Estamos en medio de una carrera armamentista proverbial de IA entre tres servicios de chatbots respaldados por tres gigantes tecnológicos: la IA de Meta, ChatGPT de OpenAI y Gemini de Google. Desde que ChatGPT abrió las puertas a la IA generativa y sus potenciales aplicaciones, la competencia entre estos tres servicios ha alcanzado un punto álgido. Es fascinante ver cuánto han crecido en tan poco tiempo y reflexionar sobre cómo estos chatbots continúan evolucionando.
Por ahora, evaluemos su progreso actual midiendo cada uno en varias categorías basadas en el uso diario de los usuarios. Buscamos ayuda con cosas como correos electrónicos, matemáticas, recetas, programación y más. A partir de ahí, veremos qué chatbot de IA ofrece las respuestas más completas y precisas, proporcionando fuentes cuando sea aplicable. Para el propósito de este artículo, estamos usando la versión 4.0 de ChatGPT.
Muchos profesionales han comenzado a usar IA para tareas laborales más rutinarias, así que empecé pidiendo a los tres chatbots de IA que “me escribieran un correo para el trabajo solicitando una extensión de proyecto”. Cada chatbot fue capaz de generar un correo bien redactado que no solo cumplía con el objetivo principal de la solicitud, sino que lo hacía de manera educada y profesional. Todos también estaban en formato de plantilla, lo que significa que podía personalizar el correo con información más relevante. En el caso de la redacción de correos electrónicos, Meta AI, ChatGPT y Google Gemini obtienen calificaciones perfectas. Por supuesto, esta fue la solicitud más fácil de realizar; llegaremos a los verdaderos desafíos más adelante.
Para esta solicitud, pedí a los chatbots “dame una receta para chili”, y cada uno me proporcionó recetas precisas y completas (con ligeras variaciones), que determiné comparándolas con mi conocimiento de hacer chili. Sin embargo, hubo una diferencia importante entre los chatbots, y eso involucró la fuente de la receta. Tanto Meta AI como Gemini citaron la receta al final e incluso enlazaron al sitio web utilizado, con el último incluso yendo un paso más allá y enlazando a recetas adicionales al final. Sin embargo, ChatGPT no citó en absoluto; simplemente tomó la receta de un sitio desconocido. ¿Estaba plagiando? ¿Estaba inventando la receta? Si es así, esto podría ser peligroso ya que la IA está lejos de ser perfecta, y ChatGPT podría cometer un error con las instrucciones de cocina, poniendo en riesgo a los cocineros novatos, especialmente porque no hay forma de verificar. En este sentido, usaría Gemini o Meta AI para recetas, ya que puedes rastrear la receta y verificar que hubo un humano involucrado, lo que la hace más confiable en cuanto a la seguridad alimentaria.
Pedí a cada chatbot “dame una lista con viñetas de las últimas noticias para [inserta la fecha actual aquí]”, y cada uno pudo hacerlo bastante rápido. Sin embargo, los tres copiaron titulares con poco contexto sobre las historias en sí. Una vez más, la diferencia entre los chatbots de IA radicaba en cómo citaban las noticias, si es que lo hacían. Tanto ChatGPT como Meta AI enlazaron directamente a los medios de comunicación que citaron, con el primero enlazando a varias fuentes después de cada titular que citaba. Mientras tanto, Gemini mencionó varios sitios de noticias para obtener noticias pertinentes, pero no enlazó a las páginas que citaba. ChatGPT y Meta AI parecen ser los mejores chatbots de IA para noticias, ya que realmente enlazan a su fuente en lugar de tomar de un sitio desconocido sin la cita adecuada.
Pedí a los tres chatbots dos conjuntos de problemas matemáticos: uno de álgebra y otro de geometría. “Determina todos los valores posibles de la expresión A³ + B³ + C³ — 3ABC donde A, B y C son enteros no negativos” y “En el triángulo ∆ABC, sea G el centroide y sea I el centro del círculo inscrito. Sean α y β los ángulos en los vértices A y B, respectivamente. Supongamos que el segmento IG es paralelo a AB y que β = 2 tan^-1 (1/3). Encuentra α.” En el caso de la primera pregunta, los tres chatbots usaron tres métodos separados para resolver este problema, pero todos llegaron a la misma conclusión. La segunda pregunta pareció realmente confundir a los chatbots. ChatGPT al principio trabajó bien el problema y casi tuvo la respuesta, pero nunca publicó el resultado final. Gemini también trabajó el problema pero no insertó valores numéricos para las ecuaciones, por lo que llegó a una respuesta teórica que es útil para entender los principios en general, pero no responde a la pregunta. Solo Meta AI respondió correctamente el problema, dándonos una respuesta sólida. Si buscas un chatbot que pueda resolver problemas matemáticos por ti, Meta AI es la mejor opción.
Di a cada chatbot de IA la siguiente solicitud de programación, basada en una utilizada en este excelente artículo, pidiendo a un modelo anterior de ChatGPT que hiciera lo mismo: “Quiero crear una variante del juego tic-tac-toe, pero necesito que sea más complejo. Así que la cuadrícula debe ser de 12 por 12. Debe seguir usando ‘x’ y ‘o’. Las reglas incluyen que cualquier jugador puede bloquear a otro colocando su ‘x’ o ‘o’ en cualquier espacio alrededor de la cuadrícula, siempre que esté en uno de los espacios justo al lado del otro jugador. Pueden elegir colocar su ‘X’ o ‘o’ en cualquier espacio, también, para bloquear movimientos futuros. El objetivo es ser el primero en tener al menos seis ‘x’ o ‘o’ en cualquier fila, columna o diagonal antes que el otro jugador. Recuerda, un jugador es ‘x’ y el otro es ‘o’. Por favor, programa esto en HTML y JavaScript simples. Llamemos a este juego: Tic-Tac-Go.” Para que esto se considere un éxito, cada chatbot simplemente necesitaba proporcionarme código completo en HTML y JavaScript. Meta AI y ChatGPT me dieron exactamente lo que pedí en ambos lenguajes de programación. Gemini me dio código en JavaScript pero luego decidió sustituir HTML por CSS, lo cual, según Testbook, “HTML proporciona la estructura y el contenido de una página web, mientras que CSS proporciona el diseño visual”, por lo que no son intercambiables. Si buscas un chatbot de IA que cree código de programación sólido, entonces Meta AI y ChatGPT son las mejores opciones.
La última solicitud que probé fue: “haz una entrevista simulada para un puesto de redactor de tecnología en una importante publicación en línea”. Para esta, cada uno de los chatbots simuló una posible entrevista entre yo y el entrevistador, completa con preguntas y respuestas simuladas. Los tres abordaron la entrevista falsa de manera diferente, pero todos terminaron con excelentes resultados. Aunque luego tendrías que crear un escenario más detallado para hacer un juego de roles con el bot, todos funcionan bien como puntos de partida para entender mejor cómo abordar una entrevista y qué se podría preguntar.
Después de sumar los resultados, parece que Meta AI es el mejor chatbot de IA en general. De los tres, Meta AI tiene los resultados más consistentes en una amplia variedad de solicitudes, lo que lo hace mucho más confiable que su competencia. ChatGPT está en el medio, ya que también devolvió resultados bastante consistentes. Para ver cómo se comparaba con su modelo anterior 3.5, hice las mismas preguntas a esa versión y veo una mejora masiva entre las dos. OpenAI claramente está mejorando su modelo con cada actualización. Desafortunadamente, Gemini de Google quedó en último lugar y parece ser el chatbot de IA menos consistente del grupo. Esto coincide con su inicio muy accidentado, cuando todavía se llamaba Google Bard, y sigue poniéndose al día con la competencia hasta el día de hoy.