Google está formando un nuevo equipo para trabajar en modelos de inteligencia artificial que simulen el mundo físico. Tim Brooks, quien fue co-líder del generador de videos Sora en OpenAI y que se unió al laboratorio de investigación de IA de Google, Google DeepMind, el año pasado, liderará este nuevo equipo, según anunció en una publicación en X. Este equipo será parte de Google DeepMind. Brooks mencionó que “DeepMind tiene planes ambiciosos para crear modelos generativos masivos que simulen el mundo”. Está buscando personal para este nuevo equipo con esta misión.
Según las ofertas de trabajo que Brooks compartió, el nuevo equipo de modelado colaborará y se basará en el trabajo de los equipos Gemini, Veo y Genie de Google para abordar “nuevos problemas críticos” y escalar modelos “a los niveles más altos de computación”. Gemini es la serie principal de modelos de IA de Google para tareas como analizar imágenes y generar texto, mientras que Veo es el modelo de generación de videos de Google. Genie, por su parte, es la propuesta de Google para un modelo del mundo, que simula juegos y entornos 3D en tiempo real. El modelo más reciente de Genie, presentado en diciembre pasado, puede generar una gran variedad de mundos 3D jugables.
Brooks también destacó que “creemos que escalar el entrenamiento de IA en video y datos multimodales es fundamental para alcanzar la inteligencia artificial general”. La inteligencia artificial general (AGI) se refiere a una IA que puede realizar cualquier tarea que un humano puede hacer. “Los modelos del mundo impulsarán numerosos dominios, como el razonamiento visual y la simulación, la planificación para agentes físicos y el entretenimiento interactivo en tiempo real”.
El nuevo equipo de Brooks buscará desarrollar herramientas de “generación interactiva en tiempo real” y estudiar cómo integrar sus modelos con modelos multimodales existentes como Gemini. Varias startups y grandes empresas tecnológicas están persiguiendo modelos del mundo, incluyendo World Labs de la investigadora Fei-Fei Lee, la startup israelí Decart y Odyssey. Creen que estos modelos podrían usarse algún día para crear medios interactivos, como videojuegos y películas, y realizar simulaciones realistas, como entornos de entrenamiento para robots.
Sin embargo, los creativos tienen sentimientos encontrados sobre esta tecnología. Una reciente investigación de Wired reveló que estudios de videojuegos como Activision Blizzard, que ha despedido a numerosos trabajadores, están utilizando IA para reducir costos, aumentar la productividad y compensar la pérdida de personal. Un estudio de 2024, encargado por el Animation Guild, estimó que más de 100,000 empleos en cine, televisión y animación en EE. UU. se verán afectados por la IA para 2026. Algunas startups en este nuevo espacio de modelado del mundo, como Odyssey, se han comprometido a colaborar con profesionales creativos en lugar de reemplazarlos. Habrá que ver si Google sigue este camino.
También hay un tema sin resolver sobre los derechos de autor. Algunos modelos del mundo parecen estar entrenados con clips de juegos, lo que podría convertir a las empresas que desarrollan esos modelos en blanco de demandas si los videos fueron utilizados sin licencia. Google, que posee YouTube, afirma que tiene permiso para entrenar sus modelos con videos de YouTube de acuerdo con los términos de servicio de la plataforma, pero no ha especificado qué videos está utilizando para el entrenamiento.