Microsoft ha presentado un nuevo modelo de inteligencia artificial llamado Phi-4, que es un modelo de lenguaje pequeño (SLM), a diferencia de los modelos de lenguaje grandes (LLM) que utilizan chatbots como ChatGPT y Copilot. Phi-4 es ligero y se destaca en tareas de razonamiento complejo, lo que lo hace ideal para matemáticas y procesamiento de lenguaje.
La compañía ha compartido resultados que muestran que Phi-4 supera incluso a modelos más grandes como Gemini Pro 1.5 en problemas de competencia matemática.
Los modelos de lenguaje pequeños, como ChatGPT-4o mini, Gemini 2.0 Flash y Claude 3.5 Haiku, suelen ser más rápidos y económicos de operar en comparación con los modelos grandes. Sin embargo, su rendimiento ha mejorado notablemente con las versiones recientes.
Microsoft ha logrado estas mejoras gracias a avances en el entrenamiento de Phi-4 utilizando conjuntos de datos sintéticos de alta calidad y a innovaciones en el desarrollo posterior al entrenamiento. Históricamente, la mejora de la capacidad de la IA ha estado limitada por la gran cantidad de potencia de procesamiento y datos necesarios para el entrenamiento, conocido como el “muro de datos de pre-entrenamiento”. Por ello, las empresas de IA están buscando formas de mejorar el desarrollo posterior al entrenamiento para optimizar el rendimiento.
Actualmente, Phi-4 está disponible en Azure AI Foundry, una plataforma para que los desarrolladores creen aplicaciones de IA generativa. Sin embargo, aunque Phi-4 está disponible bajo un acuerdo de licencia de investigación de Microsoft, no se puede interactuar con él de la misma manera que con Copilot o ChatGPT. Tendremos que esperar para ver qué aplicaciones se desarrollan con esta nueva herramienta en el futuro.