ChatGPT acaba de recibir un nuevo Modo de Voz Avanzado esta semana. Aunque solo está disponible para un pequeño grupo de suscriptores de pago en fase de prueba alfa, ya hemos visto varios ejemplos de esta función en acción. Estos ejemplos están apareciendo en línea, en plataformas como YouTube y X, donde los afortunados usuarios de ChatGPT Plus muestran la función en una variedad de tareas.
Según informa The Verge, estas tareas incluyen desde cantar una canción de cierta manera o imitar acentos, hasta abordar las sutilezas de la pronunciación correcta en diferentes idiomas. Si recuerdas, esta funcionalidad se reveló en el lanzamiento de GPT-4 hace unos meses. Sin embargo, el Modo de Voz Avanzado se retrasó debido a preocupaciones sobre la seguridad, pero ahora está aquí y funcionando con resultados impresionantes.
Por ejemplo, The Verge menciona a ChatGPT dando una lección de pronunciación de palabras en francés a un usuario en YouTube, donde la IA es bastante útil. Otro ejemplo es una solicitud para cantar “Feliz Cumpleaños” en un estilo de blues soul. O ChatGPT contando chistes con diferentes voces (tímida, enojada).
Finalmente, echa un vistazo a las publicaciones en X del Modo de Voz Avanzado de ChatGPT contando rápidamente y luego imitando acentos regionales de EE. UU. Si estás ansioso por probarlo tú mismo, OpenAI ha informado que todos los suscriptores de ChatGPT Plus tendrán acceso al Modo de Voz Avanzado a finales de este año. El despliegue completo debería completarse para finales de otoño, por lo que todos deberían tenerlo para diciembre, en teoría.
Análisis: 50 tonos de genialidad
Si has visto las demostraciones anteriores, son bastante impresionantes, ¿verdad? Si no, deberías verlas. Hay una atención al detalle seria en términos de hacer que el Modo de Voz Avanzado parezca más humano y real. Por ejemplo, el nivel de dificultad artificial incorporado al contar hasta 50 rápidamente, incluyendo una pausa para tomar aire, es un toque realmente ingenioso.
O la excursión de cantar blues, que no se trata solo de cantar, sino también de las explicaciones detalladas de cómo el cantante podría abordar la canción y el estilo natural y la entrega de la voz de la IA. Estas interacciones de IA alcanzan nuevos niveles de realismo, aunque todavía hay aspectos por mejorar.
En cuanto a los acentos estadounidenses, no nos impresionaron tanto, aunque fue una tarea difícil y mejoraron un poco cuando el usuario pidió a ChatGPT que los enfatizara más. Y aunque las respuestas de la IA son generalmente rápidas y fluidas, hay momentos de silencio y confusión al ver una variedad de estos clips en línea.
Recuerda que el Modo de Voz Avanzado todavía está en fase alfa, y dado eso, es realmente impresionante, sorprendentemente bueno en algunos escenarios. Esta podría ser una de las áreas en las que la IA avanza tan rápido que asusta…