La lista de modelos de inteligencia artificial que no han cumplido con sus fechas de lanzamiento prometidas sigue creciendo. El verano pasado, Elon Musk, el fundador y CEO de la empresa de IA xAI, anunció que Grok 3, su próximo modelo importante, llegaría para “finales de 2024”. Grok es la respuesta de xAI a modelos como GPT-4 de OpenAI y Gemini de Google. Este modelo puede analizar imágenes y responder preguntas, y es responsable de varias funciones en X, la red social de Musk. En una publicación de julio en X, Musk mencionó: “Grok 3, después de entrenar en 100,000 H100s, debería ser realmente algo especial”. En diciembre, reafirmó que Grok 3 representaría un gran avance. Sin embargo, ya es 2 de enero y Grok 3 no ha llegado, ni hay señales de que su lanzamiento sea inminente. De hecho, algunos códigos en el sitio web de xAI, detectados por el informante de IA Tibor Blaho, sugieren que un modelo intermedio, “Grok 2.5”, podría lanzarse primero.
Grok[.]com podría estar llegando pronto con el modelo Grok 2.5 (grok-2-latest – “Nuestro modelo más inteligente”) – ¡gracias por la pista, anónimo! pic.twitter.com/emsvmZyaf7
— Tibor Blaho (@btibor91) 20 de diciembre de 2024
Cabe mencionar que no es la primera vez que Musk establece un objetivo ambicioso y no lo cumple. Es bien sabido que sus anuncios sobre el lanzamiento de productos suelen ser poco realistas. Sin embargo, la ausencia de Grok 3 es interesante porque forma parte de una tendencia creciente. El año pasado, la startup de IA Anthropic no logró lanzar un sucesor de su modelo Claude 3 Opus. Meses después de anunciar que el modelo de próxima generación, Claude 3.5 Opus, se lanzaría a finales de 2024, Anthropic eliminó toda mención del modelo de su documentación para desarrolladores. Según un informe, aunque Anthropic completó el entrenamiento de Claude 3.5 Opus el año pasado, decidió que no tenía sentido económico lanzarlo. Se ha informado que Google y OpenAI también han enfrentado contratiempos con sus modelos principales en los últimos meses.
Gran parte de estos retrasos se deben a los límites de las leyes de escalado actuales de la IA, que son los métodos que las empresas utilizan para aumentar las capacidades de sus modelos. En el pasado reciente, era posible lograr mejoras de rendimiento sustanciales entrenando modelos con grandes cantidades de poder computacional y conjuntos de datos cada vez más grandes. Sin embargo, las ganancias con cada generación de modelos han comenzado a disminuir, lo que lleva a las empresas a buscar técnicas alternativas. También podría haber otras razones para el retraso de Grok 3; xAI tiene un equipo mucho más pequeño que muchos de sus competidores. A pesar de esto, el retraso en el lanzamiento añade evidencia de que los enfoques convencionales de entrenamiento de IA están llegando a un límite.