Se está viviendo una nueva era en el razonamiento de la inteligencia artificial. Tras el lanzamiento del modelo de razonamiento o1 de OpenAI, han surgido muchos modelos similares de otros laboratorios de IA. A principios de noviembre, DeepSeek, una empresa de investigación de IA, presentó su primer algoritmo de razonamiento, DeepSeek-R1. Ese mismo mes, el equipo Qwen de Alibaba mostró lo que dice ser el primer competidor “abierto” de o1.
¿Por qué ha ocurrido esto? La búsqueda de nuevas formas de mejorar la tecnología de IA generativa es una razón. Según informes, las técnicas tradicionales para aumentar el tamaño de los modelos ya no están dando los resultados esperados. Las empresas de IA sienten una fuerte presión competitiva para seguir innovando. Se estima que el mercado global de IA alcanzó los 196.63 mil millones de dólares en 2023 y podría llegar a 1.81 billones de dólares para 2030.
OpenAI afirma que los modelos de razonamiento pueden “resolver problemas más difíciles” que los modelos anteriores y representan un avance significativo en el desarrollo de la IA generativa. Sin embargo, no todos están convencidos de que estos modelos sean el mejor camino. Ameet Talwalkar, profesor asociado de aprendizaje automático en Carnegie Mellon, considera que los primeros modelos de razonamiento son “bastante impresionantes”, pero también cuestiona las afirmaciones de quienes dicen saber hasta dónde llegarán estos modelos en la industria. Talwalkar advierte que las empresas de IA tienen incentivos financieros para hacer proyecciones optimistas sobre sus tecnologías futuras.
Dos desventajas de los modelos de razonamiento son que son (1) costosos y (2) requieren mucha energía. Por ejemplo, OpenAI cobra 15 dólares por cada 750,000 palabras que analiza o1 y 60 dólares por cada 750,000 palabras que genera. Esto es entre 3 y 4 veces más caro que su modelo anterior, GPT-4o. Aunque o1 está disponible de forma gratuita en la plataforma ChatGPT de OpenAI, hay límites. Recientemente, OpenAI lanzó una versión más avanzada, o1 pro mode, que cuesta 2,400 dólares al año.
Guy Van Den Broeck, profesor de ciencias de la computación en UCLA, señala que el costo de los modelos de razonamiento no disminuirá. Una de las razones de su alto costo es que requieren muchos recursos computacionales. A diferencia de otros modelos de IA, o1 y otros modelos de razonamiento intentan verificar su propio trabajo mientras lo realizan, lo que puede hacer que tarden más en llegar a soluciones.
OpenAI imagina que los futuros modelos de razonamiento “pensarán” durante horas, días o incluso semanas. Aunque los costos de uso serán más altos, la empresa cree que los beneficios, como nuevas baterías o medicamentos contra el cáncer, pueden valer la pena. Sin embargo, la propuesta de valor de los modelos de razonamiento actuales no es tan clara. Costa Huang, investigador en Ai2, menciona que o1 no es un calculador muy confiable y ha habido errores reportados en su modo pro.
Van den Broeck sostiene que los modelos de razonamiento no están realizando razonamiento real y, por lo tanto, tienen limitaciones en los tipos de tareas que pueden abordar con éxito. “El verdadero razonamiento funciona en todos los problemas, no solo en aquellos que son probables en los datos de entrenamiento de un modelo”, explica.
Dado el fuerte incentivo del mercado para mejorar los modelos de razonamiento, es probable que mejoren con el tiempo. No solo OpenAI, DeepSeek y Alibaba están invirtiendo en esta nueva línea de investigación en IA. Inversores y fundadores de industrias relacionadas también están interesados en un futuro dominado por la IA de razonamiento. Sin embargo, Talwalkar teme que los grandes laboratorios mantengan en secreto estas mejoras, lo que podría obstaculizar el avance de la comunidad investigadora. “A medida que más personas trabajen en esta dirección, espero que los modelos de razonamiento avancen rápidamente. Pero, dado los incentivos financieros, la mayoría de los modelos probablemente serán ofrecidos por grandes laboratorios industriales como OpenAI.”