Los suscriptores de X (anteriormente Twitter) ahora pueden pedirle a Grok, el asistente de inteligencia artificial, que describa imágenes, además de crearlas. La empresa xAI, propiedad de Elon Musk, lanzó una nueva función para analizar contenido visual, permitiendo que Grok-2, el modelo de inteligencia artificial que impulsa el chatbot y la creación de imágenes Flux AI, describa fotos, diagramas y otros tipos de imágenes. Esta función coloca a Grok al mismo nivel que competidores como ChatGPT y Gemini.
Si eres suscriptor de los planes de X, puedes probar esta nueva función haciendo clic en un botón en una publicación de imagen y preguntando a Grok sobre la imagen o pidiendo un análisis descriptivo directo. Junto con esta novedad, Grok presentó un nuevo estándar llamado RealWorldQA, que mide qué tan bien un modelo puede describir una imagen del mundo real, incluyendo el espacio entre objetos. La compañía afirma que RealWorldQA demuestra que Grok es tan bueno o mejor que sus competidores en explicar imágenes, aunque aún está en desarrollo.
Grok ahora puede entender imágenes y hasta explicar el significado de un chiste. Como se muestra en un ejemplo compartido por Elon Musk, Grok puede desglosar una imagen compleja y explicar lo que sucede en ella, incluso extrapolar el humor del chiste, aunque esto a menudo hace que el chiste sea menos gracioso. Esto indica que xAI sigue trabajando en nuevas funciones para Grok, especialmente herramientas multimodales, lo que podría llevar a que Grok explique también contenido de audio y video de manera similar a como lo hace con las imágenes.
Un aspecto que no se menciona es cómo el análisis visual de Grok podría afectar la creación de imágenes por parte del chatbot de IA, que parece no tener reparos en cuestiones de derechos de autor. Esto es relevante, ya que algunos usuarios enfrentaron problemas con Nintendo por crear imágenes de Mario. Sería interesante ver si una imagen generada por IA de Mario o cualquier otra propiedad intelectual sería descrita de manera específica o en términos más generales.
Dado que xAI es propiedad de Musk, hay un gran potencial para esta función en otras empresas tecnológicas de su propiedad. Por ejemplo, la conducción semiautónoma de Tesla podría beneficiarse al identificar personas y objetos a su alrededor y cómo están distribuidos. Lo mismo aplica para los robots humanoides que Tesla ha estado desarrollando en los últimos años.