Cerebras, la empresa que fabrica el chip de inteligencia artificial más rápido del mundo, ha presentado su nuevo modelo llamado DeepSeek R1 70B. Este modelo promete ser 57 veces más rápido que los que utilizan GPUs, aunque no se especifica con qué GPUs se compara. DeepSeek R1 funcionará en la nube de Cerebras y todos los datos se mantendrán en Estados Unidos.
La compañía ha decidido apoyar a DeepSeek, especialmente después de que otras empresas como Groq y Microsoft también lo hicieran. Aunque Amazon Web Services (AWS) y Google Cloud aún no han hecho anuncios al respecto, cualquier persona puede ejecutar este modelo de código abierto en cualquier lugar, incluso de forma local.
El chip de Cerebras ejecutará DeepSeek a una velocidad de 1,600 tokens por segundo, lo que significa que es mucho más rápido que las soluciones en la nube que utilizan GPUs, que aparentemente alcanzan solo 28 tokens por segundo. Además, el nuevo chip de Cerebras es 57 veces más grande que el H100.
Investigaciones realizadas por Cerebras han demostrado que DeepSeek es más preciso que los modelos de OpenAI en varias pruebas. Este modelo se ejecutará en centros de datos en Estados Unidos para abordar las preocupaciones sobre la privacidad de los datos, ya que la aplicación DeepSeek enviará datos a China, donde probablemente serán almacenados.
La solución de wafer scale de Cerebras la coloca en una posición única para aprovechar el crecimiento del uso de la inteligencia artificial en la nube. Su chip WSE-3, que es el más rápido del mundo, cuenta con casi un millón de núcleos y cuatro billones de transistores. Además, tiene 44 GB de SRAM, que es la memoria más rápida disponible, incluso más rápida que la HBM de las GPUs de Nvidia.
Aunque no se ha revelado el precio, Cerebras ha indicado que el costo de otros modelos en su plataforma es de $6 por millón de tokens de entrada y $12 por millón de tokens de salida. Se espera que DeepSeek tenga un costo mucho menor.
El WSE-4, que será la próxima versión del WSE-3, se lanzará entre 2026 y 2027 y ofrecerá un aumento significativo en el rendimiento de DeepSeek y modelos similares. La llegada de DeepSeek también podría aumentar la competencia en el mercado de la inteligencia artificial, lo que podría reducir los precios de servicios de empresas establecidas como OpenAI o Anthropic.