Esta semana, el MIT presentó un nuevo modelo para entrenar robots. En lugar de usar un conjunto limitado de datos para enseñarles nuevas tareas, este método utiliza una gran cantidad de información, similar a la que se usa para entrenar modelos de lenguaje grandes (LLMs). Los investigadores señalaron que el aprendizaje por imitación, donde el robot aprende al observar a una persona realizar una tarea, puede fallar cuando se introducen pequeños desafíos, como cambios en la iluminación, un entorno diferente o nuevos obstáculos. En estas situaciones, los robots no tienen suficientes datos para adaptarse.
El equipo se inspiró en modelos como GPT-4 para aplicar un enfoque de datos más amplio en la resolución de problemas. “En el dominio del lenguaje, los datos son solo oraciones”, explicó Lirui Wang, autor principal del estudio. “En robótica, dado que los datos son muy variados, si queremos preentrenar de manera similar, necesitamos una arquitectura diferente”. Así, presentaron una nueva arquitectura llamada Transformadores Preentrenados Heterogéneos (HPT), que reúne información de diferentes sensores y entornos. Luego, se utilizó un transformador para organizar los datos en modelos de entrenamiento. Cuanto más grande es el transformador, mejor es el resultado.
Los usuarios pueden ingresar el diseño del robot, su configuración y la tarea que desean que realice. “Nuestro sueño es tener un cerebro robótico universal que puedas descargar y usar para tu robot sin necesidad de entrenamiento”, comentó David Held, profesor asociado de CMU. “Aunque estamos en las primeras etapas, seguiremos trabajando arduamente y esperamos que el escalado conduzca a un avance en las políticas robóticas, como ocurrió con los modelos de lenguaje grandes”. Esta investigación fue apoyada en parte por el Instituto de Investigación de Toyota. El año pasado, en TechCrunch Disrupt, TRI presentó un método para entrenar robots durante la noche. Más recientemente, estableció una asociación importante que unirá su investigación en aprendizaje robótico con el hardware de Boston Dynamics.