Un grupo de desarrolladores de la plataforma de inteligencia artificial Hugging Face, liderado por Thomas Wolf, cofundador y científico jefe de la empresa, ha creado una versión “abierta” de la herramienta de investigación profunda de OpenAI. Esta herramienta, que OpenAI presentó en un evento reciente, explora la web para recopilar informes de investigación sobre cualquier tema. Sin embargo, actualmente solo está disponible en una vista previa limitada para los usuarios suscritos al plan ChatGPT Pro de OpenAI, que cuesta 200 dólares al mes.
El proyecto del equipo de Hugging Face se llama Open Deep Research y consiste en un modelo de inteligencia artificial —el o1 de OpenAI— y un “marco de trabajo agente” de código abierto que ayuda al modelo a planificar su análisis y a utilizar herramientas como motores de búsqueda. Aunque o1 es un modelo propietario (es decir, requiere una API de pago), el equipo afirma que ofrece un rendimiento superior a modelos “abiertos” como el R1 de DeepSeek.
En menos de 24 horas, los investigadores lograron utilizar o1 con un navegador simple basado en texto y un conjunto de herramientas llamado “inspector de texto” para leer archivos en la web. Open Deep Research puede navegar por la web de manera autónoma, desplazándose por páginas, manipulando archivos e incluso realizando cálculos con datos.
En GAIA, un estándar para asistentes de inteligencia artificial general, Open Deep Research obtuvo una puntuación del 54%. Esto se compara con la puntuación del 67.36% de la investigación profunda de OpenAI.
Intenté probar Open Deep Research en la demostración pública que el equipo configuró, pero no pude hacerlo funcionar. La página estaba muy cargada en el momento de la publicación; después de 10 minutos, apareció un mensaje de error. Sin embargo, los investigadores aseguran que están comprometidos a mejorar la experiencia y han puesto el código fuente disponible en GitHub para revisión y comentarios.
Es importante mencionar que hay varias “reproducciones” de la investigación profunda de OpenAI en la web, algunas de las cuales utilizan modelos y herramientas abiertas. El componente crucial que les falta a estas reproducciones —y a Open Deep Research— es el o3, el modelo que respalda la investigación profunda. Pocos, si es que hay, modelos superan a o3 en pruebas relacionadas con la respuesta a preguntas complejas y la recopilación de información. Sin un modelo abierto que compita con o3, las alternativas a la investigación profunda pueden no estar a la altura de la original.