OpenAI no lanzó un competidor de motor de búsqueda para enfrentarse a Google en su evento de actualización de primavera el 13 de mayo de 2024. En cambio, OpenAI presentó GPT-4 Omni (o GPT-4o, para abreviar) con capacidades conversacionales similares a las humanas, y es realmente impresionante. Más allá de hacer que esta versión de ChatGPT sea más rápida y accesible para más personas, GPT-4o amplía cómo puedes interactuar con él, incluyendo tener conversaciones naturales a través de la aplicación móvil o de escritorio. Considerando que estará disponible en iPhone, Android y aplicaciones de escritorio, podría allanar el camino para ser el asistente que todos siempre hemos querido (o temido).
OpenAI demostró GPT-4o en un iPhone durante el evento de actualización de primavera. GPT-4o ha dado un paso significativo hacia la comprensión de la comunicación humana en el sentido de que puedes conversar de una manera que se acerca a la natural. Viene completo con todas las complicaciones de las tendencias del mundo real, como interrumpir, entender el tono e incluso darse cuenta de que ha cometido un error.
Durante la primera demostración en vivo, el presentador pidió comentarios sobre su técnica de respiración. Respiró fuertemente en su teléfono, y ChatGPT respondió con la agudeza, “No eres una aspiradora”. Aconsejó una técnica más lenta, demostrando su capacidad para entender y responder a las sutilezas humanas.
Así que sí, ChatGPT tiene sentido del humor pero también cambia el tono de las respuestas, completo con diferentes inflexiones mientras transmite un “pensamiento”. Como en las conversaciones humanas, puedes interrumpir al asistente y corregirlo, haciendo que reaccione o deje de hablar. Incluso puedes pedirle que hable en un tono, estilo o voz robótica determinados. Además, incluso puede proporcionar traducciones.
En una demostración en vivo sugerida por un usuario en X (anteriormente Twitter), dos presentadores en el escenario, uno hablando inglés y otro italiano, tuvieron una conversación con Chat GPT-4o manejando la traducción. Podía entregar rápidamente la traducción del italiano al inglés y luego traducir sin problemas la respuesta en inglés de vuelta al italiano.
No es solo comprensión de voz con GPT-4o, también puede entender visuales como una ecuación lineal escrita y luego guiarte sobre cómo resolverla, así como mirar un selfie en vivo y proporcionar una descripción. Eso podría ser lo que estás usando o tus emociones.
En esta demostración, GPT dijo que el presentador parecía feliz y alegre. No está sin peculiaridades, sin embargo. En un momento, ChatGPT dijo que vio la imagen de la ecuación antes de que se escribiera, refiriéndose a una visualización anterior de solo una mesa de madera.
A lo largo de la demostración, ChatGPT trabajó rápidamente y realmente no luchó para entender el problema o preguntar sobre él. GPT-4o también es más natural que escribir una consulta, ya que puedes hablar naturalmente a tu teléfono y obtener una respuesta deseada, no una que te diga que lo busques en Google.
Si estás pensando en Her o en otra película futurista distópica con una IA, no eres el único. Hablar con ChatGPT de una manera tan natural es esencialmente el momento Her para OpenAI. Considerando que se implementará en la aplicación móvil y como una aplicación de escritorio de forma gratuita, muchas personas pronto podrían tener sus propios momentos Her.
Las impresionantes demostraciones en el habla y las visuales solo podrían estar rascando la superficie de lo que es posible. El rendimiento general y cómo se desempeña GPT-4o día a día en varios entornos aún está por verse, y una vez disponible, TechRadar lo pondrá a prueba. Sin embargo, después de este vistazo, está claro que GPT-4o se está preparando para enfrentarse a lo mejor que Google y Apple tienen para ofrecer en sus esperadas revelaciones de IA.
Sin embargo, anunciar esto el día antes de que comience Google I/O y solo unas semanas después de que hayamos visto nuevos gadgets de IA en la escena, como el Rabbit R1, OpenAI nos está dando un adelanto de las experiencias de IA verdaderamente útiles que queremos. Si esta rumoreada asociación con Apple se materializa, Siri podría ser supercargado, y Google casi seguramente mostrará sus últimos trucos de IA en I/O el 14 de mayo de 2024. Pero, ¿serán suficientes?
Desearíamos que OpenAI mostrara un poco más de demostraciones en vivo con el último ChatGPT-4o en lo que resultó ser una presentación clave de menos de 30 minutos. Afortunadamente, se implementará para los usuarios en la próxima semana, y no tendrás que pagar para probarlo.