Google ha lanzado una nueva herramienta de inteligencia artificial llamada Whisk, que permite crear y modificar conceptos visuales de manera más sencilla. A diferencia de otros generadores de imágenes que requieren descripciones detalladas, Whisk utiliza imágenes como entrada. Los usuarios pueden subir tres imágenes: una para el sujeto, otra para el escenario y una más para el estilo. Luego, Whisk se encarga de generar una imagen que combine estos elementos.
Por ejemplo, puedes subir una foto de un coche como sujeto, una imagen de un paisaje rural como escenario y una acuarela como estilo. Al hacer clic en un botón, obtendrás un par de imágenes basadas en tus elecciones. Además, la interfaz permite hacer cambios fácilmente, añadiendo detalles adicionales o subiendo diferentes imágenes para inspirarte.
Aunque Whisk está diseñado para no necesitar descripciones textuales, Google ofrece la opción de ajustar los textos generados, ya que los resultados pueden no coincidir exactamente con lo que esperabas. La herramienta se basa en el análisis de imágenes realizado por el modelo Gemini de Google, que puede no captar todos los detalles que tienes en mente.
A pesar de estas limitaciones, Whisk es una aplicación interesante de las herramientas de IA de Google, ofreciendo una forma más accesible y creativa para que los creadores visuales experimenten con sus ideas. Actualmente, Whisk está disponible de forma gratuita solo para usuarios en Estados Unidos a través de su navegador web en labs.google/whisk.