He disfrutado comparando diferentes chatbots de inteligencia artificial entre sí. Después de evaluar a DeepSeek con ChatGPT, ChatGPT con Le Chat de Mistral, ChatGPT con Gemini 2.0 Flash, y Gemini 2.0 Flash con su versión anterior, ahora he decidido enfrentar a DeepSeek R1 con Gemini 2.0 Flash. DeepSeek R1 generó mucho interés y desconfianza cuando se lanzó en EE. UU. a principios de este año. Por su parte, Gemini 2.0 Flash es una nueva capa de capacidades sobre el ecosistema de Google, diseñada para ser rápida y eficiente, ofreciendo respuestas prácticas sin sacrificar la precisión.
Ambos se presentan como asistentes de IA de vanguardia, así que decidí probarlos desde la perspectiva de alguien que tiene un interés casual en usar chatbots de IA en su vida diaria. Ambos demostraron ser efectivos a un nivel básico, pero quería ver cuál se sentía más práctico, perspicaz y realmente útil en el uso cotidiano. Cada prueba incluye una captura de pantalla con DeepSeek a la izquierda y Gemini 2.0 Flash a la derecha. Aquí están los resultados.
**Búsqueda de eventos locales**
Estaba interesado en probar las habilidades de búsqueda de los dos modelos de IA, combinadas con la capacidad de ofrecer información sobre actividades interesantes. Les pedí a ambas aplicaciones de IA que “encontraran eventos divertidos para asistir en el Valle de Hudson este mes”. Vivo en el Valle de Hudson y conocía algunos eventos en el calendario, así que sería una buena medida de precisión y utilidad. Sorprendentemente, ambas hicieron un buen trabajo, presentando una larga lista de ideas y organizándolas temáticamente para el mes. Muchos de los eventos eran los mismos en ambas listas.
DeepSeek incluyó enlaces a lo largo de su lista, lo cual encontré útil, pero las descripciones eran solo citas de esas fuentes. Las descripciones de Gemini 2.0 eran casi todas únicas y, francamente, más vívidas e interesantes, lo que preferí. Aunque Gemini no tenía las fuentes disponibles de inmediato, podía obtenerlas pidiéndole que verificara sus respuestas.
**Consejos de lectura**
Decidí ampliar mi prueba habitual sobre la capacidad de la IA para ofrecer consejos útiles, esta vez con algo más complejo y basado en investigaciones reales. Les pedí a Gemini y DeepSeek que “me ayudaran a elaborar un plan para enseñar a mi hijo a leer”. Mi hijo aún no tiene ni un año, así que sé que tengo tiempo antes de que lea a Chaucer, pero es un aspecto de la paternidad en el que pienso mucho. Según sus respuestas, los dos modelos de IA podrían haber sido columnas de consejos idénticas. Ambos presentaron guías detalladas para diferentes etapas de la enseñanza de la lectura, incluyendo ideas específicas para juegos, aplicaciones y libros a utilizar. Aunque no eran idénticas, estaban tan cerca que habría tenido problemas para diferenciarlas sin las diferencias de formato, como las edades recomendadas de DeepSeek. Diría que no hay diferencia si se me pregunta cuál IA elegir basándome únicamente en esta prueba.
**Explicación de vacunas**
Algo similar ocurrió con una pregunta sobre cómo simplificar un tema complejo. Con los niños en mente, opté por una respuesta amigable para ellos, preguntando a Gemini y DeepSeek que “explicaran cómo las vacunas entrenan al sistema inmunológico para combatir enfermedades de una manera que un niño de seis años pudiera entender”. Gemini comenzó con una analogía sobre un castillo y guardias que tenía mucho sentido. Curiosamente, la IA incluyó una analogía de entrenamiento de superhéroes al final. Sin embargo, las similitudes en el entrenamiento con DeepSeek podrían explicarlo, ya que DeepSeek se centró completamente en la analogía de superhéroes. La explicación se ajusta a la metáfora, que es lo que importa.
Notablemente, la respuesta de DeepSeek incluyó emojis, que, aunque apropiados para su inserción, implicaban que la IA esperaba que la respuesta fuera leída por un niño de seis años. Espero sinceramente que los niños pequeños no tengan acceso sin restricciones a chatbots de IA, sin importar cuán precoces y responsables sean sus preguntas sobre atención médica.
**Resolviendo acertijos**
Pedir a los chatbots de IA que resuelvan acertijos clásicos siempre es una experiencia interesante, ya que su razonamiento puede ser extraño incluso cuando la respuesta es correcta. Les planteé un acertijo clásico: “Tengo llaves, pero no abro cerraduras. Tengo espacio, pero no habitación. Puedes entrar, pero no puedes salir. ¿Qué soy?”. Como era de esperar, ambos no tuvieron problemas para responder. Gemini simplemente dio la respuesta, mientras que DeepSeek desglosó el acertijo y la lógica detrás de la respuesta, además de incluir más emojis. Incluso añadió un “bonus” extraño sobre teclados que desbloquean ideas, lo cual no fue muy acertado como broma ni como insight sobre el valor de los teclados. La intención de DeepSeek de ser ingenioso es impresionante, pero el intento real se sintió un poco desconectado.
**DeepSeek supera a Gemini**
Gemini 2.0 Flash es un modelo de IA impresionante y útil. Comencé esta comparación esperando que superara a DeepSeek en todos los aspectos. Pero, aunque Gemini hizo un gran trabajo en términos absolutos, DeepSeek igualó o superó a Gemini en la mayoría de los casos. Gemini parecía alternar entre un lenguaje humano y una sintaxis más robótica, mientras que DeepSeek tenía una vibra más cálida o simplemente citaba otras fuentes.
Esta prueba informal no es un estudio definitivo, y hay muchas razones para ser cauteloso con DeepSeek, incluida su política de recopilar prácticamente toda la información que puede sobre ti y almacenarla en China para usos desconocidos. Aun así, no puedo negar que parece competir de igual a igual con Gemini sin problemas. Y aunque, como su nombre indica, Gemini 2.0 Flash suele ser más rápido, DeepSeek no tardó tanto como para que perdiera la paciencia. Eso cambiaría si estuviera apurado; elegiría Gemini si solo tuviera unos segundos para obtener una respuesta. De lo contrario, a pesar de mis dudas, DeepSeek R1 es tan bueno o mejor que Google Gemini 2.0 Flash.