Antes de las festividades, Microsoft anunció que estaba mejorando el modelo de inteligencia artificial detrás de Bing Image Creator, una herramienta de edición de imágenes impulsada por IA integrada en su motor de búsqueda Bing. Microsoft prometió que el nuevo modelo, la última versión del modelo DALL-E 3 de OpenAI, conocido como “PR16”, permitiría a los usuarios crear imágenes “dos veces más rápido que antes” y con “mayor calidad”. Sin embargo, esto no sucedió. Las quejas comenzaron a inundar las plataformas X y Reddit. Un usuario de Reddit comentó: “El DALL-E que solíamos amar se ha ido para siempre”. Otro escribió: “Ahora estoy usando ChatGPT porque Bing se ha vuelto inútil para mí”. La reacción fue tan negativa que Microsoft anunció que restaurará el modelo anterior en Bing Image Creator hasta que pueda resolver los problemas.
Jordi Ribas, jefe de búsqueda en Microsoft, explicó en una publicación en X que han podido reproducir algunos de los problemas reportados y planean volver al modelo DALL-E 3 PR13 hasta que puedan solucionarlos. “El proceso de implementación es muy lento, desafortunadamente. Comenzó hace más de una semana y tomará de 2 a 3 semanas más para llegar al 100%”. Entonces, ¿qué salió mal? Es difícil comparar los resultados de los modelos basándose en informes anecdóticos, especialmente cuando las solicitudes no son estandarizadas. Sin embargo, muchos usuarios señalaron que PR16 hacía que las imágenes se vieran menos realistas y “sin vida”. Mayank Parmar, de Windows Latest, destacó que las imágenes generadas por PR16 carecían de detalle y pulido, y parecían extrañamente caricaturescas.
No es la primera vez que un modelo de imagen que supuestamente pasó controles internos no fue bien recibido públicamente. En febrero, Google tuvo que pausar la capacidad de su chatbot de IA Gemini para crear imágenes de personas después de que los usuarios se quejaran de inexactitudes históricas. Estos errores ilustran cuán complicado puede ser medir las mejoras de un modelo en el mundo real. Según Ribas, las pruebas de Microsoft encontraron que la calidad de PR16 era “un poco mejor en promedio” en comparación con el modelo anterior de Bing Image Creator. Sin embargo, parece claro que esta métrica interna no se alineó con las preferencias de la mayoría de las personas.