Hace casi dos meses que OpenAI mostró el impresionante nuevo Modo de Voz de ChatGPT (y tuvo un desacuerdo público con Scarlett Johansson), pero la función ahora está lista para ser lanzada a los suscriptores de Plus, o al menos a un pequeño grupo de ellos.
Los fanáticos de ChatGPT han estado insistiendo a OpenAI sobre el Modo de Voz casi a diario, y el CEO Sam Altman ha dado una actualización en X (anteriormente Twitter). En una breve respuesta a alguien que preguntaba sobre el modo de voz renovado, Altman dice: “¡El lanzamiento alfa comienza para los suscriptores de Plus la próxima semana!”.
La naturaleza casual de la respuesta sugiere que esto no es un anuncio completo, por lo que son posibles más retrasos. Pero sí sugiere que el nuevo Modo de Voz es inminente para un grupo selecto de suscriptores de ChatGPT Plus (un nivel que cuesta $20 / £16 / AU$28 al mes).
El nuevo modo probablemente no se lanzará por completo en la semana que comienza el 29 de julio, porque OpenAI dijo anteriormente en X (anteriormente Twitter) que “comenzará la alfa con un pequeño grupo de usuarios para recopilar comentarios y expandirse según lo que aprendamos”.
OpenAI había planeado inicialmente comenzar este pequeño lanzamiento a usuarios Alfa a fines de junio, pero dijo que necesitaba “un mes más para alcanzar nuestro estándar de lanzamiento”. Bueno, parece que ese tiempo extra, que necesitaba para mejorar la “capacidad del modelo para detectar y rechazar cierto contenido”, ha sido fructífero y estará disponible (para algunos) dentro de unos días.
Esto puede resultar frustrante nuevamente para los suscriptores de ChatGPT Plus que no están en el grupo selecto de Alfa, pero OpenAI dice que está “planeando que todos los usuarios de Plus tengan acceso en el otoño”. Eso parece seguir siendo su calendario planificado para el nuevo Modo de Voz, pero probablemente obtendremos una actualización más grande la próxima semana.
¿Qué es el nuevo Modo de Voz de ChatGPT?
OpenAI ha estado generando expectativas para el Modo de Voz de ChatGPT en las semanas desde que se demostró por primera vez, lanzando varios videos (como el de arriba) que muestran su capacidad para hacer rutinas de improvisación con diferentes voces de personajes, ayudar a los usuarios con juegos de rol en entrevistas y asistir en el aprendizaje de nuevos idiomas.
Cuando ves estas demostraciones, es fácil entender por qué el nuevo Modo de Voz es tan esperado. Puede que hayamos visto a Siri recibir una actualización de IA, pero ningún otro asistente de voz de IA ha demostrado aún una capacidad equivalente para lo que OpenAI llama “conversaciones naturales en tiempo real con IA”.
Un elemento adicional a estas interacciones de voz es que el último modelo GPT-4o también puede formar sus respuestas basadas en una combinación de audio, texto y también video, lo que significa conversaciones de ciencia ficción como la del video de demostración.
Si el nuevo Modo de Voz de ChatGPT puede lograr este nivel de fluidez y consistencia en el mundo real es algo que vamos a descubrir muy pronto. Con OpenAI también revelando un prototipo de su motor de búsqueda SearchGPT, se perfila como otro mes salvaje para la compañía de IA más conocida del mundo.