Google presentó su primer agente de inteligencia artificial (IA) que puede realizar acciones en la web. Este prototipo de investigación, llamado Project Mariner, proviene de la división DeepMind de la empresa. El agente, impulsado por Gemini, controla tu navegador Chrome, mueve el cursor en tu pantalla, hace clic en botones y completa formularios, lo que le permite navegar por sitios web de manera similar a un humano.
Inicialmente, Google lanzará este agente de IA a un pequeño grupo de probadores seleccionados. La compañía sigue experimentando con nuevas formas para que Gemini lea, resuma y utilice sitios web. Un ejecutivo de Google mencionó que esto representa un cambio fundamental en la experiencia del usuario, alejando a las personas de interactuar directamente con los sitios web y permitiendo que un sistema de IA generativa lo haga por ellos.
En una demostración, Jaclyn Konzelmann, directora de Google Labs, mostró cómo funciona Project Mariner. Después de configurar el agente con una extensión en Chrome, aparece una ventana de chat a la derecha del navegador. Puedes darle instrucciones como “crear un carrito de compras de un supermercado basado en esta lista”. Luego, el agente navega al sitio web de un supermercado, busca y añade artículos a un carrito de compras virtual. Sin embargo, el agente es un poco lento, con un retraso de aproximadamente 5 segundos entre cada movimiento del cursor.
Es importante destacar que el agente no puede realizar el pago, ya que no está diseñado para completar información de tarjetas de crédito o datos de facturación. Además, Project Mariner no acepta cookies ni firma acuerdos de servicio, lo que permite a los usuarios tener más control.
Detrás de escena, el agente toma capturas de pantalla de tu ventana del navegador y las envía a Gemini en la nube para su procesamiento. Luego, Gemini envía instrucciones de vuelta a tu computadora para navegar por la página web. Project Mariner también puede buscar vuelos y hoteles, comprar artículos para el hogar, encontrar recetas y realizar otras tareas que actualmente requieren que los usuarios hagan clic en la web.
Sin embargo, hay una limitación: Project Mariner solo funciona en la pestaña activa del navegador Chrome, lo que significa que no puedes usar tu computadora para otras cosas mientras el agente trabaja en segundo plano.
El director de tecnología de Google DeepMind, Koray Kavukcuoglu, explicó que esta decisión fue intencionada para que los usuarios sepan lo que está haciendo el agente de IA. A pesar de que los propietarios de sitios web pueden sentirse aliviados al saber que el agente trabaja en sus pantallas, esto podría significar que los usuarios se involucren menos con los sitios que visitan.
Además de Project Mariner, Google presentó otros agentes de IA para tareas específicas. Uno de ellos, Deep Research, ayuda a los usuarios a explorar temas complejos creando planes de investigación por pasos. Este agente competirá con el de OpenAI, que también realiza razonamientos por pasos. Sin embargo, no está diseñado para resolver problemas matemáticos o de análisis de datos.
Otro agente nuevo, llamado Jules, está destinado a ayudar a los desarrolladores con tareas de codificación, integrándose directamente en los flujos de trabajo de GitHub. Jules se lanzará a un grupo selecto de probadores beta y estará disponible más adelante en 2025.
Finalmente, Google DeepMind está trabajando en un agente de IA para ayudar a navegar en videojuegos, colaborando con desarrolladores como Supercell para probar la capacidad de Gemini en mundos de juegos como “Clash of Clans”. Aunque no se ha anunciado una fecha de lanzamiento para este prototipo, se espera que estos agentes tengan un impacto significativo en la web en el futuro.