Hace apenas una semana, DeepSeek lanzó su modelo de inteligencia artificial R1, lo que generó mucha emoción en el mercado. Ahora, investigadores de Hugging Face están tratando de replicar este modelo desde cero, en un esfuerzo que llaman “conocimiento abierto”. Leandro von Werra, jefe de investigación de Hugging Face, junto con varios ingenieros de la empresa, han iniciado el proyecto Open-R1, que busca crear una copia del R1 y hacer que todos sus componentes, incluyendo los datos utilizados para entrenarlo, sean de código abierto.
Los ingenieros de Hugging Face se sintieron motivados a actuar debido a la filosofía de “caja negra” de DeepSeek. Aunque R1 es “abierto” en el sentido de que tiene una licencia permisiva, lo que permite su uso sin muchas restricciones, no es “código abierto” porque muchas de las herramientas utilizadas para crearlo son un misterio. DeepSeek, como muchas empresas de inteligencia artificial, no está dispuesta a revelar sus secretos.
Elie Bakouch, uno de los ingenieros de Hugging Face en el proyecto Open-R1, comentó que, aunque el modelo R1 es impresionante, no hay conjuntos de datos abiertos, detalles de experimentos o modelos intermedios disponibles, lo que dificulta la replicación y la investigación adicional. “Hacer que la arquitectura completa de R1 sea de código abierto no solo se trata de transparencia, sino de desbloquear su potencial”, dijo Bakouch.
DeepSeek, un laboratorio de inteligencia artificial chino financiado en parte por un fondo de cobertura cuantitativo, lanzó R1 la semana pasada. En varias pruebas, R1 iguala e incluso supera el rendimiento del modelo de razonamiento o1 de OpenAI. Como modelo de razonamiento, R1 se autocorrige, lo que le ayuda a evitar errores comunes en otros modelos. Sin embargo, estos modelos suelen tardar más en llegar a soluciones en comparación con los modelos típicos.
R1 ganó popularidad después de que la aplicación de chatbot de DeepSeek, que ofrece acceso gratuito a R1, se posicionara en la cima de las listas de la App Store de Apple. La rapidez con la que se desarrolló R1 ha llevado a muchos analistas de Wall Street a cuestionar si Estados Unidos puede mantener su liderazgo en la carrera de la inteligencia artificial.
El proyecto Open-R1 se centra más en “abrir completamente la caja negra del entrenamiento de modelos” que en la dominación de la IA en EE. UU. Bakouch destacó que, dado que R1 no se lanzó con el código o instrucciones de entrenamiento, es complicado estudiar el modelo en profundidad. “Tener control sobre el conjunto de datos y el proceso es crucial para implementar un modelo de manera responsable en áreas sensibles”, añadió.
El objetivo del proyecto Open-R1 es replicar R1 en unas pocas semanas, utilizando en parte el Science Cluster de Hugging Face, un servidor de investigación dedicado con 768 GPUs Nvidia H100. Los ingenieros planean utilizar este clúster para generar conjuntos de datos similares a los que DeepSeek usó para crear R1. Además, están buscando ayuda de la comunidad de IA y tecnología en Hugging Face y GitHub, donde se aloja el proyecto Open-R1.
El interés por el proyecto ya es alto; Open-R1 obtuvo 10,000 estrellas en GitHub en solo tres días. Si el proyecto tiene éxito, los investigadores de IA podrán construir sobre la línea de entrenamiento y trabajar en el desarrollo de la próxima generación de modelos de razonamiento de código abierto. Bakouch espera que Open-R1 no solo produzca una fuerte replicación de R1, sino que también sirva como base para mejores modelos en el futuro.
Bakouch también mencionó que el desarrollo de código abierto beneficia a todos, incluyendo a los laboratorios y proveedores de modelos, ya que todos pueden utilizar las mismas innovaciones. Aunque algunos expertos en IA han expresado preocupaciones sobre el posible abuso de la IA de código abierto, Bakouch cree que los beneficios superan los riesgos. “Cuando se haya replicado la receta de R1, cualquiera que pueda alquilar algunas GPUs podrá construir su propia variante de R1 con sus propios datos, difundiendo aún más la tecnología”, concluyó.