¿Se ha perdido la cordura colectiva? ¿Cómo pasó DeepSeek de ser una startup china poco conocida a convertirse en un fenómeno en los smartphones y, de manera indirecta, en el mercado de valores de EE. UU.? Para ser claros, no he podido acceder a DeepSeek y desafiar su modelo R1. He intentado durante dos días, pero la gran cantidad de inscripciones y algunos ciberataques han abrumado completamente los servidores de DeepSeek.
Leí un excelente análisis de John-Anthony Disotto sobre DeepSeek, que dejó claro que, aunque el R1 es bueno, no es un cambio radical. Lo describió como un “excelente modelo de razonamiento gratuito” que podría hacerte cuestionar por qué pagas por el modelo O1 de OpenAI, que también es bastante bueno. Esa es una pregunta válida, pero no explica el pánico en el mercado de valores de EE. UU. ni la respuesta casi irracional ante la aparición de este modelo.
Esto huele raro. El problema es que DeepSeek-R1 no solo es gratuito, sino que la empresa afirma haber entrenado sus modelos con chips baratos, por un costo de solo 5.6 millones de dólares. En mi mundo, eso es mucho dinero. En el ámbito de la IA, es casi nada. Meta gastará 65 mil millones de dólares en entrenamiento de IA solo este año. La necesidad de mayor potencia de procesamiento de modelos de IA convirtió a Nvidia en la empresa más valiosa del mundo (aunque perdió esa distinción durante la reciente caída del mercado). Ahora llega DeepSeek, diciendo que hizo lo mismo por, esencialmente, centavos.
De repente, todos los inversores se preguntaron si habían hecho la apuesta equivocada. Con casi ninguna información o prueba real de que DeepSeek y sus inversores sean transparentes y veraces, los inversores han comenzado a retirar su dinero de IA del mercado de valores de EE. UU.
Como mencioné, DeepSeek es una aplicación china. No es china como TikTok, que tiene un control remoto de su empresa matriz, ByteDance. TikTok, que es operada en EE. UU. por empleados estadounidenses y almacena todos sus datos en EE. UU., tiene hasta abril para encontrar un comprador estadounidense o ser prohibida nuevamente en EE. UU. DeepSeek no oculta su origen chino. En la App Store, su listado está lleno de caracteres en chino. Millones de usuarios estadounidenses están ansiosos por usar el modelo R1 y enviarle sus consultas sobre sus vidas, trabajos y planes.
El gobierno chino tiene acceso total a todos esos datos y ahora se los estamos entregando voluntariamente porque alguien dijo que este modelo R1 era “el avance más increíble y prometedor que había visto”. ¿De verdad? La aplicación ni siquiera incluye soporte multimodal. Solo es texto. ¿Cómo se puede considerar increíble cuando hablo con todas mis IA y les muestro imágenes que pueden interpretar y reaccionar al instante?
Escuchar a un inversor activista promover un nuevo producto por razones indefinidas nunca es una buena idea. ¿Sabemos si tiene participación en esta empresa? ¿Sabemos si tiene algún interés en contra de las empresas de IA en EE. UU.? Lo que está claro es que él y DeepSeek no necesariamente tienen los intereses de EE. UU. o de sus consumidores en mente.
DeepSeek R1 es uno de los avances más impresionantes que he visto, y como código abierto, es un regalo profundo para el mundo.
Supongamos, por el bien del argumento, que el R1 de DeepSeek resulta ser un avance real. Hay indicios de que la empresa tiene muchos más modelos en desarrollo (recientemente lanzó un modelo generativo de imágenes para desarrolladores). Eso aún no elimina su origen y propiedad china. No importa cuán bueno sea; esta aplicación no sobrevivirá en el clima actual de EE. UU.
Sin embargo, es razonable suponer que si el R1 de DeepSeek y sus otros modelos resultan ser tan innovadores como se prometió, y fueron entrenados a ese costo increíblemente bajo, podría cambiar la industria de la IA. Meta, OpenAI (que espera una inversión de 500 mil millones de dólares del gobierno de EE. UU. para construir el Proyecto Stargate), Microsoft, Nvidia y otros tendrán que repensar sus estrategias de IA y encontrar formas de reducir drásticamente sus propios costos.
No estoy convencido de que eso sea lo que vendrá. No hay razón para confiar en las afirmaciones de DeepSeek y sus patrocinadores. Creo que la verdad sobre el tiempo y la inversión financiera que les llevó llegar aquí saldrá a la luz. Y entonces DeepSeek y R1 pasarán por su propio tipo de reinicio.