Google ha lanzado un nuevo modelo de inteligencia artificial llamado Gemini 2.0 Flash Thinking Experimental. Este modelo está en fase experimental y, según nuestras pruebas iniciales, tiene margen de mejora. Está disponible en AI Studio, la plataforma de prototipado de IA de Google. Según una descripción, este modelo es “el mejor para la comprensión multimodal, el razonamiento y la programación”, y tiene la capacidad de “razonar sobre los problemas más complejos” en áreas como la programación, las matemáticas y la física.
Logan Kilpatrick, quien lidera el producto de AI Studio, mencionó en una publicación que Gemini 2.0 Flash Thinking Experimental es “el primer paso en el viaje de razonamiento de Google”. Jeff Dean, científico jefe de Google DeepMind, comentó que este modelo está “entrenado para usar pensamientos que fortalezcan su razonamiento”.
Dean también señaló que se observan resultados prometedores al aumentar el tiempo de computación de inferencia, lo que se refiere a la cantidad de computación utilizada para “ejecutar” el modelo mientras considera una pregunta. Basado en el modelo Gemini 2.0 Flash, Gemini 2.0 Flash Thinking Experimental parece tener un diseño similar a otros modelos de razonamiento como o1 de OpenAI. A diferencia de la mayoría de las IA, los modelos de razonamiento se autocorrigen, lo que les ayuda a evitar errores comunes.
Sin embargo, un inconveniente es que estos modelos suelen tardar más en llegar a soluciones, a veces de segundos a minutos. Al recibir una pregunta, Gemini 2.0 Flash Thinking Experimental se toma unos segundos para responder, considerando varias preguntas relacionadas y “explicando” su razonamiento. Después de un tiempo, el modelo resume lo que parece ser la mejor respuesta. Por ejemplo, cuando pregunté cuántas letras “R” hay en la palabra “fresa”, respondió “dos”, lo que muestra que aún tiene dificultades con el conteo.
En respuesta al lanzamiento de o1, ha habido un aumento en los modelos de razonamiento de otros laboratorios de IA, no solo de Google. A principios de noviembre, DeepSeek, una empresa de investigación en IA, lanzó un adelanto de su primer algoritmo de razonamiento, DeepSeek-R1. Ese mismo mes, el equipo Qwen de Alibaba presentó lo que afirma ser el primer competidor “abierto” de o1. Este aumento en la competencia se debe a la búsqueda de nuevas formas de mejorar la IA generativa, ya que las técnicas tradicionales ya no están dando los resultados esperados.