El Rabbit r1 fue el gadget más deseado a principios de 2024, pero su popularidad se desvaneció rápidamente cuando las promesas de la empresa no se cumplieron. El CEO Jesse Lyu admite que “desde el primer día, establecimos expectativas demasiado altas”, pero asegura que una actualización que llegará este mes liberará finalmente su modelo de acción grande en la web. Aunque algunos escépticos pueden ver esto como un intento tardío de cumplir, la aspiración de Rabbit de crear un agente que funcione en diferentes plataformas aún tiene un valor fundamental, aunque teórico.
En una conversación con TechCrunch, Lyu explicó que los últimos seis meses han sido un torbellino de envíos, correcciones de errores y mejoras en los tiempos de respuesta. Sin embargo, a pesar de 16 actualizaciones, el r1 sigue limitado a interactuar con un modelo de lenguaje o acceder a siete servicios específicos, como Uber y Spotify. “Esa fue la primera versión del LAM, entrenada con grabaciones de trabajadores de datos, pero no es genérica; solo se conecta a esos servicios”, comentó.
Rabbit está listo para lanzar la primera versión genérica del LAM, que no está vinculada a ninguna aplicación específica. Este nuevo agente basado en la web puede desglosar tareas comunes, como comprar boletos para un concierto o registrar un sitio web. “Nuestro objetivo es claro: a finales de septiembre, tu r1 hará muchas más cosas. Debería soportar cualquier acción que puedas realizar en un sitio web”, dijo Lyu.
Cuando se le da una tarea, el agente la divide en pasos y comienza a ejecutarlos analizando lo que ve en la pantalla: botones, campos e imágenes, sin importar su posición o apariencia. Por ejemplo, cuando se le pidió que registrara un nuevo sitio web para un festival de cine, el agente buscó en Google, eligió un registro de dominio y completó la tarea.
El agente utiliza un navegador limpio en la nube, aunque están trabajando en versiones locales, como una extensión de Chrome, para que los usuarios no tengan que iniciar sesión en sus servicios. Lyu sugirió que en el futuro podría haber un modelo de lenguaje aislado que use las credenciales del usuario para iniciar sesión de manera privada.
La demostración mostró que, si bien el agente es funcional, aún necesita mejoras. La forma en que se formula una solicitud puede marcar la diferencia entre el éxito y el fracaso, algo que los consumidores comunes podrían no tolerar. Lyu advirtió que esta es una versión de “prueba”, no final, y aunque es un agente web general, aún puede mejorarse en muchos aspectos.
Además, la empresa está trabajando en un agente de escritorio que interactúe con aplicaciones como procesadores de texto y reproductores de música. Aunque todavía está en etapas iniciales, está en desarrollo.
A pesar de las críticas sobre el modelo de negocio de Rabbit, Lyu defendió su enfoque, argumentando que crear una aplicación no tendría sentido debido a la competencia con gigantes como Apple y Google. La propuesta fundamental de Rabbit es que puede haber un agente de IA que acceda y opere todos tus servicios desde fuera, como lo haría un usuario.
El nuevo modelo debería estar disponible para los propietarios del r1 esta semana con la actualización OTA. Lyu advirtió a los usuarios que mantengan expectativas realistas: “No es perfecto. Es solo lo mejor que la humanidad ha logrado hasta ahora”.