Los mejores generadores de imágenes con IA han estado en las noticias recientemente, pero no siempre por las razones correctas. El Grok-2 de Elon Musk ha generado controversia por su falta de restricciones. Google probablemente quiere cambiar la conversación en una dirección más positiva, ya que ha expandido el acceso a su generador Imagen 3 para todos en los EE. UU., aumentando significativamente quién puede usar esta herramienta de IA.
Un documento de investigación de Google describe Imagen 3 como “un modelo de difusión latente que genera imágenes de alta calidad a partir de indicaciones de texto”. Según el documento, “Imagen 3 es preferido sobre otros modelos de última generación en el momento de la evaluación”. Se puede usar para crear imágenes basadas en texto ingresado por el usuario, con algunas restricciones sobre contenido ofensivo o ilegal, convirtiéndolo en un rival de alternativas populares como Midjourney.
La herramienta se lanzó originalmente en mayo de 2024 en el evento Google I/O, pero en ese momento estaba limitada a usuarios seleccionados de Vertex AI de Google. Ahora, cualquier persona en los EE. UU. puede probarla, lo que sugiere que Google confía mucho más en la capacidad de su herramienta para crear imágenes confiables y evitar algunos de los problemas que han plagado a los generadores de imágenes con IA durante tanto tiempo.
Hasta ahora, parece que la reacción a Imagen 3 ha sido mixta. Varios usuarios han notado que parece ser mucho más sensible a las indicaciones del usuario que antes, censurando palabras que podrían no haber sido bloqueadas en Imagen 2. Por ejemplo, un usuario en Reddit dijo: “Realmente tengo que esforzarme más para lograr lo que solía obtener y una palabra aleatoria como ‘calcetín’ o ‘agua’ activará el filtro de censura, que es mucho más sensible a palabras benignas”. Para otro usuario, Imagen 3 se negó a dibujar ideas inocentes como un cyborg o un hombre cruzando los brazos. Sin embargo, hay aspectos positivos, con uno de los usuarios mencionados destacando su alta calidad de salida y “asombroso reconocimiento de texturas y palabras”.
Si deseas probar Imagen 3, primero debes estar en los EE. UU. para obtener acceso. Si es así, puedes dirigirte al sitio web de AI Test Kitchen de Google e iniciar sesión con tu cuenta de Google. Una vez hecho esto, deberías poder comenzar a usar el nuevo modelo de generación de imágenes.
Los informes de los usuarios que indican que Imagen 3 es más restrictivo que su predecesor son una ilustración útil del estado actual de los generadores de imágenes con IA. Estas herramientas han generado una gran cantidad de controversia en los últimos meses, y a veces parece que no pasa una semana sin que alguna imagen generada por IA agite las emociones en internet.
El último culpable ha sido el Grok-2 de Elon Musk. La herramienta, que está limitada a usuarios premium de X (anteriormente Twitter), se actualizó recientemente a su segunda versión y genera imágenes utilizando el código abierto Flux. Los usuarios descubrieron que tenía muy pocos límites sobre lo que se podía crear, lo que llevó a personas a dibujar imágenes de Donald Trump y Kamala Harris pilotando un avión el 9/11, o imágenes claramente protegidas por derechos de autor generadas sin aparentemente ninguna restricción por parte de Grok.
Con su perspectiva restrictiva sobre la generación de imágenes, parece que Google ha configurado Imagen 3 para pecar de cauteloso por ahora. Si eso cambiará a medida que el modelo se ajuste y refine, está por verse, pero con muchas más personas ahora capaces de acceder a él, quizás no tengamos que esperar mucho para ver hasta dónde se pueden empujar sus límites.