World Labs, una startup fundada por la pionera de la inteligencia artificial Fei-Fei Li, ha presentado su primer proyecto: un sistema de IA capaz de generar escenas tridimensionales similares a las de los videojuegos a partir de una sola imagen. Estas escenas generadas por IA, que cualquier persona con teclado y ratón puede explorar en una demostración en el sitio web de World Labs, son impresionantes, aunque un poco caricaturescas. Se renderizan en vivo en el navegador y cuentan con una cámara controlable y un campo de profundidad simulado ajustable. Cuanto más fuerte es el efecto de profundidad, más borrosos se ven los objetos de fondo.
El sistema de World Labs forma parte de una nueva categoría de IA llamada “modelos de mundo”. Muchos de estos modelos pueden simular juegos y entornos 3D, pero presentan problemas de calidad y consistencia. Por ejemplo, el modelo de mundo de la startup Decart, que simula Minecraft, tiene una baja resolución y rápidamente “olvida” el diseño de los niveles.
A diferencia de esto, el enfoque de World Labs asegura que las escenas permanezcan constantes una vez generadas y que cumplan con las leyes básicas de la física, lo que les da una sensación de solidez y profundidad. Además, el sistema puede aplicar efectos interactivos y animaciones a las escenas, como cambiar el color de los objetos y ajustar dinámicamente la iluminación de los fondos.
World Labs comentó en una publicación de su blog: “La mayoría de las herramientas de IA generativa crean contenido en 2D, como imágenes o videos. Generar en 3D mejora el control y la consistencia. Esto cambiará la forma en que hacemos películas, juegos, simuladores y otras manifestaciones digitales de nuestro mundo físico”.
Sin embargo, aún hay margen de mejora. Las escenas de World Labs no son completamente explorables, ya que los movimientos están limitados a un área pequeña. Si intentas moverte fuera de ella, te encontrarás con un límite. También hay errores ocasionales de renderizado, como objetos que se mezclan de maneras poco naturales.
World Labs aclara que esto es solo una “vista previa temprana”. “Estamos trabajando arduamente para mejorar el tamaño y la fidelidad de nuestros mundos generados, y experimentando con nuevas formas para que los usuarios interactúen con ellos”, escribieron en su blog. La empresa, que se lanzó a principios de este año, ha recaudado 230 millones de dólares en capital de riesgo de inversores como Andreessen Horowitz, Ashton Kutcher, Intel Capital, AMD Ventures y Eric Schmidt. Con una valoración de más de 1,000 millones de dólares, la compañía espera tener su primer producto listo en 2025.
Más allá de las escenas interactivas, World Labs planea construir herramientas que podrían ser útiles para profesionales como artistas, diseñadores, desarrolladores, cineastas e ingenieros, apuntando a clientes que van desde desarrolladores de videojuegos hasta estudios de cine.
Justin Johnson, cofundador de World Labs, mencionó en un reciente episodio del podcast de a16z: “Ya tenemos la capacidad de crear mundos virtuales e interactivos, pero cuesta cientos de millones de dólares y mucho tiempo de desarrollo. [Los modelos de mundo] te permitirán no solo obtener una imagen o un clip, sino un mundo 3D completamente simulado, vibrante e interactivo”.