Google ha encontrado una nueva forma de mostrar lo que su modelo de IA Gemini puede hacer, con la ayuda de un robot. Este robot proviene de la División de Robots de Google, que fue cerrada el año pasado. Sin embargo, los robots aún están disponibles, así que Google le puso un moño amarillo a uno de ellos y usó Gemini para enseñarle a responder comandos y navegar por las oficinas de DeepMind.
Para lograr esto, Google utiliza modelos de lenguaje visual (VLMs) entrenados con imágenes y videos junto con texto, lo que les permite responder preguntas y realizar tareas que requieren percepción. Por ejemplo, en un video, un empleado de Google le pide al robot que lo lleve a un lugar para dibujar. El robot dice que necesita un minuto para pensar y luego lleva al empleado a una pizarra. En otro video, el robot recibe la instrucción de seguir las direcciones en la pizarra, donde un mapa muestra cómo llegar a un área llamada Blue Area. El robot sigue las direcciones hasta un área de prueba de robótica y anuncia: “He seguido con éxito las direcciones en la pizarra”.
¡Mira el video para ver al robot en acción y cuéntanos qué piensas en los comentarios!
More from TechRadar Pro.