Un nuevo modelo de inteligencia artificial ha llegado para competir con los mejores. Ai2, un instituto de investigación sin fines de lucro de Seattle, ha presentado Tulu3-405B, un modelo que, según ellos, supera a DeepSeek V3, uno de los sistemas más destacados de la empresa china DeepSeek. Además, Tulu3-405B también supera a GPT-4o de OpenAI en ciertas pruebas, según las evaluaciones internas de Ai2.
Lo interesante de Tulu3-405B es que es de código abierto, lo que significa que cualquiera puede acceder a sus componentes y replicarlo fácilmente. Un portavoz de Ai2 comentó que este avance resalta el potencial de Estados Unidos para liderar el desarrollo global de modelos de inteligencia artificial de alta calidad. Este lanzamiento representa un momento crucial no solo para el desarrollo de la IA, sino también para demostrar que EE. UU. puede competir con modelos de código abierto sin depender de las grandes empresas tecnológicas.
Tulu3-405B es un modelo grande, con 405 mil millones de parámetros, y necesitó 256 GPUs trabajando juntas para su entrenamiento. En general, los modelos con más parámetros tienden a resolver problemas de manera más efectiva. Ai2 evaluó Tulu3-405B en varias pruebas, incluyendo matemáticas y conocimientos generales.
Una de las claves para su rendimiento competitivo fue una técnica llamada aprendizaje por refuerzo con recompensas verificables. Esta técnica entrena modelos en tareas con resultados “verificables”, como resolver problemas matemáticos y seguir instrucciones. Ai2 afirma que en la prueba PopQA, que incluye 14,000 preguntas de conocimiento especializadas, Tulu3-405B superó no solo a DeepSeek V3 y GPT-4o, sino también al modelo Llama 3.1 de Meta. También tuvo el mejor rendimiento en GSM8K, una prueba de problemas matemáticos de nivel escolar.
Tulu3-405B ya está disponible para probar a través de la aplicación web de chatbot de Ai2, y el código para entrenar y ajustar el modelo se puede encontrar en GitHub. ¡Aprovecha esta oportunidad antes de que llegue el próximo modelo de IA que supere todos los récords!