DeepSeek ha ganado popularidad rápidamente. Este laboratorio de inteligencia artificial de China se hizo conocido esta semana cuando su aplicación de chatbot alcanzó los primeros lugares en las listas de la App Store de Apple y Google Play. Los modelos de IA de DeepSeek, que fueron entrenados con técnicas eficientes, han llevado a analistas de Wall Street y expertos en tecnología a cuestionar si Estados Unidos podrá mantener su liderazgo en la carrera de la IA y si la demanda de chips de IA se sostendrá.
DeepSeek fue fundado por High-Flyer Capital Management, un fondo de cobertura cuantitativo chino que utiliza IA para tomar decisiones de inversión. Liang Wenfeng, un entusiasta de la IA, cofundó High-Flyer en 2015 y lanzó DeepSeek en 2023 como un laboratorio dedicado a investigar herramientas de IA, separado de su negocio financiero. Desde el principio, DeepSeek construyó sus propios centros de datos para entrenar modelos, pero ha enfrentado restricciones de exportación de hardware por parte de EE. UU. Para entrenar uno de sus modelos más recientes, tuvo que usar chips Nvidia H800, que son menos potentes que los H100 disponibles para empresas estadounidenses.
El equipo técnico de DeepSeek es mayormente joven y la empresa recluta activamente investigadores de IA con doctorados de universidades chinas. También contratan personas sin experiencia en informática para ayudar a mejorar la comprensión de una amplia gama de temas. En noviembre de 2023, DeepSeek presentó sus primeros modelos: DeepSeek Coder, DeepSeek LLM y DeepSeek Chat. Sin embargo, fue en la primavera pasada cuando la industria de la IA comenzó a prestar atención tras el lanzamiento de su familia de modelos DeepSeek-V2, que se destacó por su rendimiento en diversas pruebas y por ser más económico que modelos similares.
El modelo DeepSeek-V3, lanzado en diciembre de 2024, aumentó aún más la notoriedad de la empresa. Según pruebas internas, DeepSeek V3 supera a modelos como Llama de Meta y a otros modelos “cerrados” que solo se pueden acceder a través de una API, como GPT-4 de OpenAI. También destaca el modelo de razonamiento R1, que se lanzó en enero y que, según DeepSeek, tiene un rendimiento comparable al modelo o1 de OpenAI. Este modelo se autocorrige, lo que le ayuda a evitar errores comunes en otros modelos.
Sin embargo, los modelos de DeepSeek, al ser desarrollados en China, deben cumplir con regulaciones que aseguran que sus respuestas reflejen “valores socialistas centrales”. Por ejemplo, en su aplicación de chatbot, R1 no responde preguntas sobre la Plaza de Tiananmen o la autonomía de Taiwán.
El modelo de negocio de DeepSeek no está del todo claro, ya que sus precios son muy bajos y ofrecen algunos servicios de forma gratuita. La empresa sostiene que sus avances en eficiencia le permiten ser muy competitiva en costos, aunque algunos expertos cuestionan estas cifras. A pesar de esto, los desarrolladores han adoptado los modelos de DeepSeek, que no son de código abierto pero están disponibles bajo licencias permisivas para uso comercial. Según Clem Delangue, CEO de Hugging Face, los desarrolladores han creado más de 500 modelos derivados de R1, acumulando 2.5 millones de descargas en total.
El éxito de DeepSeek ha sido considerado como un cambio en la industria de la IA, y su éxito ha contribuido a que las acciones de Nvidia cayeran un 18% en enero. Microsoft anunció que DeepSeek está disponible en su servicio Azure AI Foundry, que reúne servicios de IA para empresas. Durante una llamada de ganancias, el CEO de Meta, Mark Zuckerberg, mencionó que la inversión en infraestructura de IA seguirá siendo una “ventaja estratégica” para la compañía.
A pesar de su éxito, algunas empresas y gobiernos, como el de Corea del Sur y el estado de Nueva York, han prohibido el uso de DeepSeek en dispositivos gubernamentales. El futuro de DeepSeek es incierto, aunque se espera que continúen mejorando sus modelos. Sin embargo, el gobierno de EE. UU. parece estar cada vez más preocupado por lo que considera una influencia extranjera dañina.