OpenAI ha añadido un nuevo modelo de lenguaje grande (LLM) llamado GPT-4o Mini a ChatGPT y sus APIs. Como su nombre indica, el modelo GPT-4o Mini es una versión más pequeña del modelo GPT-4o presentado en mayo. El modelo mini está diseñado para equilibrar la potencia de GPT-4o con un enfoque más rentable.
GPT-4o Mini tiene gran parte de la funcionalidad de su primo mayor, aunque la API solo tiene soporte para texto y visión por ahora, con entradas y salidas de imagen, video y audio aún en desarrollo. Al igual que GPT-4o, el nuevo modelo tiene una ventana de contexto de 128,000 tokens, o ocho veces la de GPT-3.5 Turbo. El nuevo modelo también viene con características de seguridad mejoradas. Además de las ya integradas en GPT-4o, GPT-4o Mini añadió nuevas técnicas que lo hacen más resistente a jailbreaks e inyecciones de prompts inapropiados, entre otros problemas que preocupan a los desarrolladores que buscan desplegar APIs de IA de manera amplia.
Listo para trabajos más grandes
OpenAI sugiere que la ventana de contexto más grande y otras mejoras, como la mejor comprensión de textos en idiomas no ingleses, harán que GPT-4o Mini sea especialmente útil para procesar documentos grandes o vincular múltiples interacciones con el modelo de IA. Por ejemplo, podría proporcionar mejores recomendaciones en tiendas en línea, acelerar las respuestas de texto en tiempo real para el servicio al cliente y producir respuestas precisas y detalladas para estudiantes que estudian para un examen más rápidamente que otros modelos.
OpenAI tiene visiones de que GPT-4o automatice y agilice los procesos empresariales gracias a su capacidad para obtener datos y tomar acciones con sistemas externos. Para las empresas que usan la API, el costo se reduce notablemente a poco más de la mitad del precio por token de GPT-3.5 Turbo.
“OpenAI está comprometido a hacer que la inteligencia sea lo más accesible posible”, explicó OpenAI en su anuncio. “Esperamos que GPT-4o Mini amplíe significativamente el rango de aplicaciones construidas con IA al hacer la inteligencia mucho más asequible”.
GPT-4o Mini es parte de la reciente ola de LLMs más pequeños como Gemini Flash de Google y Claude Haiku de Anthropic. Sin embargo, según OpenAI, GPT-4o Mini los supera en muchas de las pruebas estándar. El modelo obtuvo un 82% en el benchmark de Comprensión de Lenguaje Multitarea Masiva (MMLU), en comparación con el 77.9% y el 73.8% de Gemini Flash y Haiku, respectivamente. Lo mismo ocurre con las pruebas MGSM y Human Eval, donde GPT-4o Mini alcanzó el 87% y el 87.2%, mientras que Gemini Flash tuvo 75.5% y 71.5%, y Haiku tuvo 71.7% y 75.9%. En otras palabras, GPT-4o Mini gana en comprensión textual además de tareas de matemáticas y codificación.
La introducción de GPT-4o Mini representa un paso significativo para hacer que la IA avanzada sea más asequible y accesible, según OpenAI. Los costos más bajos y el mejor rendimiento probablemente ayudarán a incorporar la IA en aplicaciones cotidianas. Lo mismo ocurre con los usuarios de ChatGPT, quienes podrán acceder al modelo a partir de esta semana. OpenAI también tiene planes para introducir capacidades de ajuste fino para GPT-4o Mini dentro de la API.
El panorama general muestra otro paso en la evolución de los servicios de ChatGPT. A medida que OpenAI elimina gradualmente GPT-3.5 para ChatGPT, el enfoque se desplaza a la próxima etapa de proporcionar modelos más poderosos. El CEO de OpenAI, Sam Altman, ha insinuado durante mucho tiempo cómo GPT-5 “mejorará sustancialmente” los modelos existentes. Al mismo tiempo, la escala filtrada de OpenAI para medir el poder de la IA muestra que aún queda un largo camino hacia la inteligencia artificial general (AGI) que pueda imitar perfectamente el funcionamiento de la mente humana.