OpenAI ha lanzado o1, su modelo de inteligencia artificial especializado en “razonamiento”, en su API, pero inicialmente solo estará disponible para ciertos desarrolladores. A partir de hoy, o1 comenzará a estar disponible para los desarrolladores que se encuentren en la categoría de uso “nivel 5” de OpenAI. Para calificar en este nivel, los desarrolladores deben gastar al menos $1,000 con OpenAI y tener una cuenta que tenga más de 30 días desde su primer pago exitoso.
El modelo o1 reemplaza al modelo o1-preview que ya estaba disponible en la API. A diferencia de la mayoría de las inteligencias artificiales, los modelos de razonamiento como o1 pueden verificar sus propias respuestas, lo que les ayuda a evitar errores comunes. Sin embargo, esto puede hacer que tarden más en llegar a soluciones. Además, su uso es costoso, ya que requieren muchos recursos computacionales. OpenAI cobra $15 por cada aproximadamente 750,000 palabras que o1 analiza y $60 por cada 750,000 palabras que el modelo genera. Esto es entre 3 y 4 veces más caro que el modelo “no de razonamiento” más reciente de OpenAI, GPT-4o.
El modelo o1 en la API de OpenAI es mucho más personalizable que o1-preview, gracias a nuevas funciones como la llamada a funciones (que permite conectar el modelo a datos externos), mensajes para desarrolladores (que permiten a los desarrolladores instruir al modelo sobre tono y estilo) y análisis de imágenes. Además de generar resultados estructurados, o1 cuenta con un parámetro en la API llamado “reasoning_effort”, que permite controlar cuánto tiempo “piensa” el modelo antes de responder a una consulta.
OpenAI ha indicado que la versión de o1 en la API, y pronto en su plataforma de chatbot ChatGPT, es una “nueva versión post-entrenamiento” de o1. Comparado con el modelo o1 lanzado en ChatGPT hace dos semanas, esta versión, “o1-2024-12-17”, mejora en “áreas del comportamiento del modelo basadas en comentarios”, según lo que mencionó OpenAI de manera general. La compañía está implementando el acceso de manera gradual mientras trabaja para expandir el acceso a otros niveles de uso y aumentar los límites de tasa.
En otras noticias relacionadas con desarrolladores, OpenAI anunció nuevas versiones de sus modelos GPT-4o y GPT-4o mini como parte de la API Realtime, que permite crear aplicaciones con respuestas de voz generadas por IA en tiempo real. Los nuevos modelos (“gpt-4o-realtime-preview-2024-12-17” y “gpt-4o-mini-realtime-preview-2024-12-17”) ofrecen una mejor eficiencia de datos y confiabilidad, y son más económicos de usar.
Hablando de la API Realtime, que aún está en beta, ha ganado varias nuevas capacidades, como respuestas simultáneas fuera de banda, lo que permite que tareas en segundo plano, como la moderación de contenido, se realicen sin interrumpir las interacciones. La API ahora también admite WebRTC, un estándar abierto para construir aplicaciones de voz en tiempo real para navegadores, teléfonos inteligentes y dispositivos de internet de las cosas.
No es casualidad que OpenAI contratara al creador de WebRTC, Justin Uberti, a principios de diciembre. OpenAI ha mencionado que su integración con WebRTC está diseñada para permitir interacciones fluidas y rápidas en condiciones del mundo real, incluso con calidad de red variable. Esta integración maneja la codificación de audio, la transmisión, la supresión de ruido y el control de congestión.
Por último, OpenAI ha introducido el ajuste fino de preferencias en su API de ajuste fino; este ajuste compara pares de respuestas del modelo para “enseñarle” a distinguir entre respuestas preferidas y “no preferidas”. También ha lanzado una beta para kits de desarrollo de software oficiales en los lenguajes de programación Go y Java.