DeepSeek, una empresa de inteligencia artificial que ha ganado popularidad, ha lanzado un nuevo conjunto de modelos de IA multimodal que, según afirma, pueden superar a DALL-E 3 de OpenAI. Estos modelos están disponibles para descarga en la plataforma de desarrollo de IA Hugging Face y pertenecen a una nueva familia llamada Janus Pro. Su tamaño varía entre 1 mil millones y 7 mil millones de parámetros. Los parámetros son una medida de las habilidades de resolución de problemas de un modelo; en general, los modelos con más parámetros tienden a tener un mejor rendimiento.
Los modelos Janus de DeepSeek pueden analizar y crear nuevas imágenes. Según la empresa, en dos pruebas de evaluación de IA, GenEval y DPG-Bench, el modelo más grande, Janus Pro 7B, supera a DALL-E 3 y a otros modelos como PixArt-alpha, Emu3-Gen y Stable Diffusion XL de Stability AI. Aunque algunos de estos modelos son más antiguos, el rendimiento de Janus Pro 7B es notable, considerando su tamaño relativamente pequeño.
DeepSeek afirma que “Janus Pro supera a modelos unificados anteriores y iguala o supera el rendimiento de modelos específicos para tareas”. La empresa destaca que la simplicidad, alta flexibilidad y efectividad de Janus Pro lo convierten en un fuerte candidato para los modelos multimodales unificados de próxima generación.
DeepSeek, un laboratorio de IA chino financiado en gran parte por la firma de trading High-Flyer Capital Management, ha captado la atención del público esta semana después de que su aplicación de chatbot alcanzara el primer lugar en las listas de la App Store de Apple. Los modelos de lenguaje de DeepSeek, entrenados con técnicas eficientes en computación, han llevado a muchos analistas de Wall Street y tecnólogos a cuestionar si Estados Unidos puede mantener su liderazgo en la carrera de la IA y si la demanda de chips de IA se sostendrá.