Alibaba ha lanzado un nuevo modelo de inteligencia artificial llamado Qwen2.5-Max, que según la empresa, es mejor que otros modelos como DeepSeek-V3 y ChatGPT-4o en varias pruebas de rendimiento. A diferencia de modelos de razonamiento como DeepSeek-R1 o ChatGPT-o1, Qwen2.5-Max no muestra cómo llega a sus respuestas, pero funciona a un nivel similar a sus competidores.
El equipo de Qwen afirma en su sitio web que sus modelos base han demostrado ventajas significativas en la mayoría de las pruebas y están optimistas sobre las mejoras que traerá la próxima versión de Qwen2.5-Max.
Las comparaciones de rendimiento, que incluyen pruebas como Arena-Hard y LiveBench, muestran que Qwen2.5-Max supera a sus rivales, además de obtener buenos resultados en otras evaluaciones como MMLU-Pro. A diferencia de DeepSeek, Qwen2.5-Max no es un proyecto de código abierto, lo que significa que algunos detalles sobre su funcionamiento no son públicos.
Para probar Qwen2.5-Max, puedes usar el chatbot Qwen Chat en tu navegador. Solo necesitas registrarte con un correo electrónico o tu cuenta de Google, y actualmente no hay problemas de tiempo de espera para crear una cuenta. No parece haber una aplicación móvil oficial de Qwen, aunque algunas aplicaciones de terceros permiten acceder a sus modelos.
En cuanto a la censura, a diferencia de DeepSeek, Qwen2.5-Max ofreció una respuesta más equilibrada a la pregunta “¿Es Taiwán un país?”, mientras que se negó a comentar sobre “¿Qué ocurrió en la Plaza de Tiananmén en 1989?”, diciendo que no puede discutir temas relacionados con política, religión, violencia y similares.