A principios de esta semana, la empresa china de inteligencia artificial DeepSeek lanzó una versión abierta de su modelo de razonamiento R1, lo que ha generado muchas reacciones en la industria tecnológica. El capitalista de riesgo Marc Andreessen afirmó que DeepSeek ha logrado uno de los avances más impresionantes que ha visto. Según parece, el modelo R1 iguala o supera al modelo o1 de OpenAI en ciertas pruebas de inteligencia artificial. Además, la empresa afirma que entrenar uno de sus modelos costó solo 5.6 millones de dólares, en comparación con los cientos de millones que gastan las empresas estadounidenses líderes.
DeepSeek ha logrado esto a pesar de las sanciones de EE. UU. que prohíben la venta de chips avanzados a empresas chinas. La revista MIT Technology Review señala que el éxito de la empresa muestra cómo estas sanciones están impulsando a startups como DeepSeek a innovar de manera más eficiente y colaborativa. Sin embargo, el Wall Street Journal reporta que Liang Wenfeng, de DeepSeek, comentó que las restricciones de exportación de EE. UU. siguen siendo un obstáculo.
Neal Khosla, CEO de Curai, ofreció una explicación más sencilla, sugiriendo que la empresa es una “operación psicológica del estado” que está “fingiendo que el costo es bajo para justificar precios bajos y dañar la competitividad de la IA en EE. UU.” Sin embargo, un aviso comunitario señala que Khosla no presenta evidencia de esto y que su padre es inversor en OpenAI.
Por otro lado, el periodista Holger Zschaepitz sugirió que DeepSeek podría representar una gran amenaza para los mercados de valores de EE. UU. Si una empresa china puede construir un modelo avanzado a bajo costo sin acceso a chips avanzados, esto cuestionaría la utilidad de los miles de millones de dólares invertidos en esta industria.
En respuesta, Garry Tan, CEO de Y Combinator, argumentó que el éxito de DeepSeek sería beneficioso para sus competidores estadounidenses. Si el entrenamiento de modelos se vuelve más barato y fácil, la demanda de uso real de la IA crecerá, asegurando que se utilice la capacidad de cómputo disponible. Yann LeCun, científico jefe de IA en Meta, sugirió que no se debe ver el anuncio de DeepSeek como una competencia entre China y EE. UU., sino como una señal de que los modelos de código abierto están superando a los propietarios.
LeCun destacó que DeepSeek se ha beneficiado de la investigación abierta y del código abierto, como PyTorch y Llama de Meta. “Han desarrollado nuevas ideas y las han construido sobre el trabajo de otros. Como su trabajo es publicado y de código abierto, todos pueden beneficiarse de ello”, escribió. Todo este debate ha llevado a muchos consumidores a probar el producto, y hasta el domingo por la tarde, el asistente de IA de DeepSeek era la aplicación gratuita más popular en la App Store de Apple, justo por delante de ChatGPT.