Los datos son fundamentales para entrenar sistemas de inteligencia artificial, pero conseguir suficientes datos de calidad es un gran desafío, incluso para las empresas más grandes. Advex AI está trabajando para resolver este problema utilizando inteligencia artificial generativa y datos sintéticos. Su enfoque permite a los clientes entrenar sistemas de visión por computadora con una pequeña muestra de imágenes, generando miles de imágenes “falsas” a partir de esa muestra.
Hoy, Advex se lanzó oficialmente en el evento TechCrunch Disrupt 2024, aunque ya ha conseguido varios clientes durante su fase inicial. La empresa cuenta con “siete grandes” clientes empresariales, aunque no puede revelar sus nombres. Además, se ha informado que la startup con sede en San Francisco ha recaudado 3.6 millones de dólares en financiación, la mayor parte de los cuales provino de una ronda de inversión inicial de 3.1 millones de dólares en diciembre pasado, con inversores destacados como Construct Capital, Pear VC y Emerson Collective de Laurene Powell Jobs.
El CEO Pedro Pachuca fundó Advex junto a su cofundador y CTO Qasim Wani hace poco más de un año, y actualmente la empresa tiene un equipo de seis personas. Es notable que una startup tan pequeña ya tenga clientes que pagan, lo que Pachuca atribuye a su experiencia previa y a la creación de redes. Antes de fundar Advex, Pachuca fue investigador en aprendizaje automático en Berkeley y luego se unió al equipo de investigación de Google Brain.
Pachuca planea asistir a varias conferencias en Europa, como la Conferencia Europea de Visión por Computadora (ECCV) en Milán y Vision en Stuttgart, donde espera aprender y vender. Los clientes potenciales incluyen desarrolladores de sistemas de visión por máquina que buscan mejorar sus productos con mejor inteligencia artificial, así como empresas que construyen sus propias herramientas internas, como fabricantes de automóviles o empresas de logística.
Por ejemplo, un fabricante de automóviles podría necesitar enseñar a su sistema de visión por computadora a reconocer defectos en los asientos. Aunque tenga acceso a cientos de imágenes, los defectos son únicos. Advex permite que el fabricante suba unas pocas fotos de asientos dañados y genera miles de imágenes de asientos defectuosos para crear un conjunto de datos de entrenamiento más amplio y diverso.
La generación de datos sintéticos no es un concepto nuevo, pero con la revolución de la inteligencia artificial en marcha, las empresas buscan cerrar las brechas de datos. Advex trabaja con dos tipos de modelos: uno que se despliega en el sitio del cliente, que utiliza imágenes del cliente para entrenarse, y otro que es un modelo de difusión propietario, similar a Midjourney o Dall-E, que se utiliza para crear los datos sintéticos.
Pachuca explica que el modelo de difusión es altamente complicado y donde se concentra el esfuerzo de la empresa. A diferencia de otras técnicas de simulación, el uso de este modelo permite generar imágenes en segundos por cada par de imagen/etiqueta, y se asemeja más a los datos de la vida real. “No solo estamos creando imágenes, estamos creando las imágenes que no tienes”, dice Pachuca, destacando que identificar lo que falta es uno de los mayores innovaciones de Advex.