Una nueva startup está entrenando un modelo de inteligencia artificial que, según ellos, permitirá a los creadores generar mundos cinematográficos con control total sobre el paisaje, los personajes, la iluminación y el movimiento. ¿Cómo lo hacen? Haciendo que las personas lleven cámaras en sus espaldas mientras caminan por el mundo.
Odyssey, fundada por Oliver Cameron y Jeff Hawke, quienes fueron pioneros en la conducción autónoma, ha creado un “sistema avanzado de captura de cámaras” que puede recolectar datos casi en cualquier lugar al que una persona pueda llegar. Este sistema pesa alrededor de 11 kilogramos y contiene seis cámaras, dos sensores lidar y una unidad de medición inercial.
El sistema, que se asemeja al Trekker de Google Street View, puede capturar su entorno en “resolución 3.5K” y en 360 grados, con información de profundidad “precisa en términos físicos”. ¿Y cuál es el objetivo? Odyssey afirma que está tomando los datos del sistema y alimentándolos a algoritmos para “capturar los detalles finos que componen nuestro mundo”. En esencia, la empresa está generando reconstrucciones digitales de escenas del mundo real, como bosques, cuevas, senderos, playas, glaciares, parques y edificios.
Sin embargo, no está del todo claro cómo estas reconstrucciones se traducirán en mejores herramientas generativas para los creativos. Incluso los mejores “modelos de mundo” actuales tienen limitaciones, y Odyssey no afirma haber resuelto todos estos problemas.
A pesar de esto, la empresa está recaudando fondos para avanzar. Hoy, Odyssey anunció que ha asegurado 18 millones de dólares en una ronda de financiamiento Serie A, liderada por EQT Ventures, con la participación de GV y Air Street Capital. Este nuevo capital, que eleva el total recaudado a 27 millones de dólares, se destinará a ampliar las operaciones de recolección de datos de Odyssey en California.
Odyssey planea expandir su recolección de datos a otros estados y países en el futuro, con la esperanza de implementar protecciones de privacidad. (El equipo de Street View de Google, por ejemplo, ha enfrentado a reguladores por capturar imágenes de escenas cotidianas que violaban la privacidad de las personas). “Creemos que será imposible para los modelos generativos crear mundos de calidad cinematográfica que se sientan vivos sin entrenar con un vasto volumen de datos 3D del mundo real, ricos y multimodales”, escribió la empresa en una publicación en su blog. “Creemos que un modelo avanzado de construcción de mundos generativos desbloqueará una mejor manera de crear películas, juegos y más”.