He estado hablando con Alexa durante más de una década. Uno de los primeros y posiblemente mejores chatbots ha respondido miles de preguntas, reproducido álbumes de canciones y encendido y apagado innumerables luces inteligentes. Ha sido consistente, confiable y cada vez menos sorprendente. Todo eso se suponía que cambiaría este año.
Volvamos a septiembre de 2023, cuando el entonces jefe de hardware de Amazon, David Limp, nos mostró una impresionante demostración de una nueva Alexa potenciada por IA y modelos de lenguaje grande (LLM) que sonaba más humana, recordaba el contexto, no necesitaba una palabra de activación y casi podía mantener una conversación real.
En ese momento, llamé a la demostración “excelente y espeluznante”, pero también estaba ansioso por verla. No es solo que tengo media docena de productos Amazon Echo en mi casa y todavía los uso. Amazon estaba tratando de alcanzar al chatbot de IA del momento, ChatGPT. Comparado con los modelos GPT que OpenAI sigue mejorando en el último ChatGPT, las habilidades de Alexa parecen anticuadas, en el mejor de los casos. ChatGPT es un asistente, mientras que Alexa es simplemente una utilidad, como un interruptor activado por voz.
Desde la presentación de la nueva Alexa con IA el año pasado, Google presentó su poderoso Gemini, y el mes pasado, Apple introdujo Apple Intelligence en la WWDC 2024, que, entre otras cosas, nos presentará un Siri más inteligente, conversacional y con un sonido más natural. Si Apple logra lanzar el Siri mejorado con Apple Intelligence en los mejores iPhones este otoño, Siri podría finalmente recuperar su posición de liderazgo como asistente digital, al menos frente a Amazon Alexa.
Tal como están las cosas, parece que las probabilidades están a favor de Apple.
Desde ese evento de lanzamiento, Limp dejó Amazon, y cada vez más parece que esta es menos la Amazon de Jeff Bezos (quien dejó de ser CEO en 2021) y más la de Andy Jassy, el nuevo CEO, que claramente está más enfocado en los servicios empresariales de Amazon como AWS y el negocio de Amazon Prime.
En lugar de Limp, ahora está Panos Panay, anteriormente de Microsoft, quien es algo así como un genio del hardware y el software. Aunque han pasado meses desde que Panay se unió, el normalmente locuaz Panay aún no ha dado una entrevista ni ha encabezado un lanzamiento de producto de Amazon. Ha estado en silencio, y cuando le pregunté a Amazon si podía hablar con Panay sobre el estado de la IA de Alexa, básicamente dijeron que aún no.
Podría parecer que Amazon se está alejando de una confrontación directa con OpenAI, Google e incluso Microsoft y su Copilot potenciado por GPT. Después de todo, el tiempo en IA es diferente al tiempo de desarrollo tecnológico típico. Lo que solía tomar 18 meses ahora toma seis, y si es una actualización de modelo generativo, los ciclos son de solo tres meses. Esperar 10 meses para revelar cualquier cambio en Alexa es como quedarse quieto.
Busco pistas sobre actualizaciones de Alexa donde sea que pueda encontrarlas, incluyendo en el nuevo Echo Spot presentado esta semana. Es un rediseño del reloj de cabecera original que ahora cede la mitad del espacio de la pantalla a un altavoz. Ese elemento de audio puede reproducir música, pero también se utilizará para entregar las respuestas de Alexa.
En ninguna parte del comunicado de prensa del producto se menciona la IA o inteligencia artificial. La descripción de Alexa en el Spot es esencialmente la misma que sería en cualquier otro dispositivo Echo. Por cierto, Panay está notablemente ausente del comunicado. Ni siquiera una cita llamativa.
En frustración, le pregunté a Amazon si podían decirme algo sobre el progreso que se está haciendo en la Alexa actualizada que prometieron para 2024. Para mi sorpresa, un portavoz de Amazon envió esta cita:
“Nuestra visión para Alexa sigue siendo la misma: construir el mejor asistente personal del mundo. La IA generativa ofrece una gran oportunidad para hacer que Alexa sea aún mejor para nuestros clientes. Ya hemos integrado IA generativa en diferentes componentes de Alexa y estamos trabajando arduamente en la implementación a gran escala, en los más de medio billón de dispositivos habilitados con Alexa que ya están en hogares de todo el mundo, para permitir una asistencia aún más proactiva, personal y confiable para nuestros clientes. Estamos emocionados por lo que estamos construyendo y esperamos entregarlo a nuestros clientes.”
Esto me llamó la atención: “Ya hemos integrado IA generativa en diferentes componentes de Alexa.”
Espera un minuto. ¿Lo han hecho? Lo que diferencia a Alexa de, digamos, Siri, es que en lugar de requerir una actualización considerable del sistema operativo para alterarla, las actualizaciones de Alexa llegan constantemente y generalmente son imperceptibles. ¿Recuerdas cuando un día te despertaste y descubriste que Alexa podía decirte que “agradezcas a tu conductor” por entregar tus paquetes Prime? Exacto. Esas cosas simplemente aparecen (al igual que tus paquetes).
Amazon no ofreció detalles sobre cómo podríamos reconocer estos toques de IA generativa, pero está claro para mí que aún no alcanzan el nivel de IA generativa conversacional.
Al menos Amazon reconoce que la IA generativa sigue siendo importante y el trabajo continúa.
Además, Amazon debe apresurarse si quiere que Alexa siga siendo relevante en este vasto y siempre cambiante panorama de la IA.