Un laboratorio de inteligencia artificial chino llamado DeepSeek ha causado gran revuelo en Silicon Valley al lanzar versiones abiertas de sus modelos de IA, que compiten con las mejores tecnologías de OpenAI, Meta y Google. DeepSeek asegura que ha desarrollado sus modelos de manera eficiente y rápida, ofreciendo estos productos a un costo mucho menor que el de las empresas de IA estadounidenses. Este avance ha inquietado no solo a las grandes empresas tecnológicas, sino también a altos funcionarios del gobierno de EE. UU., que temen que China esté avanzando en la carrera de la inteligencia artificial.
Robert Nishihara, cofundador de la startup de infraestructura de IA Anyscale, comentó que no sería sorprendente que muchos laboratorios de IA estén trabajando en estrategias de respuesta ante esta situación. La llegada de DeepSeek marca un punto de inflexión en el panorama de la IA en Silicon Valley. Expertos en IA han señalado que los modelos de DeepSeek tienen importantes implicaciones para la política de IA en EE. UU. y son un indicador del acelerado progreso en este campo.
Una de las innovaciones clave de DeepSeek en su modelo R1 es el uso de “aprendizaje por refuerzo”, un enfoque de prueba y error. Kian Katanforoosh, CEO de Workera y profesor adjunto en Stanford, comparó este avance con un niño que aprende a no tocar una estufa caliente tras quemarse accidentalmente. DeepSeek parece haber utilizado más el aprendizaje por refuerzo que otros modelos de IA avanzados. OpenAI también empleó técnicas similares para desarrollar su modelo o1, que fue presentado poco antes que R1.
El aprendizaje por refuerzo es considerado una de las formas más prometedoras para mejorar los modelos de IA en la actualidad. Los “modelos de base” se refieren a aquellos entrenados con grandes cantidades de datos, como imágenes y textos de la web. Es probable que otros laboratorios de IA continúen explorando los límites del aprendizaje por refuerzo, especialmente después del éxito de DeepSeek.
Recientemente, las empresas de IA enfrentaban dificultades para mejorar el rendimiento de sus modelos, pero el éxito de métodos como el aprendizaje por refuerzo sugiere que el progreso en IA podría estar recuperándose. R1, que se puede descargar y ejecutar en cualquier máquina que cumpla con los requisitos de hardware, iguala o supera a o1 en varias pruebas de rendimiento de IA. Aunque no es la primera vez que se reduce la brecha de rendimiento entre modelos “cerrados” y modelos disponibles abiertamente, la rapidez con la que DeepSeek lo logró ha sorprendido a la industria.
Esto podría llevar a EE. UU. a aumentar su inversión en IA abierta o incluso en código abierto para competir con China. Martin Casado, socio general de Andreessen Horowitz, afirmó que DeepSeek demuestra lo erróneo que ha sido el enfoque regulatorio de los últimos dos años. Según él, esto muestra que EE. UU. no está solo en su capacidad técnica y que soluciones competitivas pueden surgir de cualquier lugar, especialmente de China.
El ex presidente Trump también comentó que DeepSeek debería ser una “señal de alerta” para las empresas de IA estadounidenses, elogiando el enfoque abierto del laboratorio chino. Marc Andreessen, cofundador de a16z, comparó el momento de DeepSeek con el lanzamiento del satélite Sputnik por parte de la Unión Soviética, que impulsó a EE. UU. a invertir seriamente en su programa espacial.
Sin embargo, es importante no exagerar los logros de DeepSeek. Algunos analistas son escépticos sobre su afirmación de haber entrenado uno de sus modelos por solo 5.6 millones de dólares, utilizando aproximadamente 2,000 GPUs de Nvidia más antiguas. Además, los modelos de DeepSeek presentan fallas. Un estudio encontró que R1 proporciona respuestas inexactas o no responde el 83% de las veces en temas de noticias. También se ha reportado que R1 se niega a responder el 85% de las preguntas relacionadas con China, posiblemente debido a la censura gubernamental.
Por último, OpenAI ha afirmado tener evidencia de que DeepSeek utilizó sus modelos de IA para entrenar los propios, lo que, de ser cierto, violaría los términos de OpenAI. A pesar de esto, DeepSeek ha logrado avances con modelos más eficientes e innovadores. Ahora, queda por ver cómo responderán los responsables de políticas y laboratorios de IA en EE. UU. ante esta situación.