Hay una nueva familia de modelos de inteligencia artificial llamada OLMo 2, lanzada por Ai2, una organización de investigación sin fines de lucro. OLMo significa “Modelo de Lenguaje Abierto”. A diferencia de otros modelos de lenguaje, OLMo 2 cumple con la definición de inteligencia artificial de código abierto, lo que significa que todas las herramientas y datos utilizados para su desarrollo están disponibles públicamente.
Ai2 anunció que OLMo 2 fue desarrollado con datos de entrenamiento accesibles y código abierto, lo que permite a la comunidad de código abierto utilizar estos recursos para encontrar nuevas formas innovadoras de trabajar. La familia OLMo 2 incluye dos modelos: uno con 7 mil millones de parámetros (OLMo 7B) y otro con 13 mil millones de parámetros (OLMo 13B). Los parámetros son como las habilidades de resolución de problemas de un modelo; generalmente, los modelos con más parámetros funcionan mejor.
Estos modelos pueden realizar diversas tareas basadas en texto, como responder preguntas, resumir documentos y escribir código. Para entrenar OLMo 2, Ai2 utilizó un conjunto de datos de 5 billones de tokens, que son fragmentos de datos; un millón de tokens equivale a aproximadamente 750,000 palabras. El conjunto de entrenamiento incluyó sitios web de alta calidad, artículos académicos y foros de preguntas y respuestas.
Ai2 afirma que OLMo 2 es competitivo en rendimiento con otros modelos de código abierto, como Llama 3.1 de Meta. Según Ai2, OLMo 2 muestra una mejora significativa en el rendimiento en comparación con modelos anteriores y supera a Llama 3.1 en ciertas tareas.
Los modelos OLMo 2 y todos sus componentes están disponibles para descarga en el sitio web de Ai2 bajo la licencia Apache 2.0, lo que permite su uso comercial. Sin embargo, ha habido preocupaciones sobre la seguridad de los modelos abiertos, ya que algunos se han utilizado para desarrollar herramientas de defensa. A pesar de esto, Ai2 cree que los beneficios de los modelos abiertos superan los riesgos, ya que fomentan avances técnicos y un acceso más equitativo a la tecnología.