En enero del año pasado, la empresa biotecnológica alemana BioNTech adquirió la startup africana de inteligencia artificial Instadeep por más de 550 millones de dólares, un acuerdo que se finalizó en julio del mismo año. Instadeep, que es la salida más grande de África hasta ahora, ha estado operando bajo el paraguas de la farmacéutica alemana durante poco más de un año. Es un buen momento para analizar cómo le ha ido desde la adquisición.
Instadeep utiliza técnicas avanzadas de aprendizaje automático para integrar la inteligencia artificial en aplicaciones empresariales. Sus productos van desde análisis acelerados por GPU hasta sistemas de toma de decisiones auto-aprendizaje. Antes de la adquisición, la startup, que nació en Túnez y tiene sedes en París y Londres, recaudó más de 108 millones de dólares de varios inversores globales, incluyendo a Google, Deutsche Bahn y BioNTech. Estos tres también fueron algunos de los socios y clientes más importantes de la startup.
Un aspecto notable es que esta startup, que tiene una década de existencia, colaboró con BioNTech para desarrollar un sistema de alerta temprana que podía detectar variantes de COVID-19 de alto riesgo con meses de anticipación durante la pandemia. Instadeep también trabajó con Google DeepMind para crear un sistema de detección temprana de brotes de langostas en África y colaboró en un proyecto para automatizar la programación ferroviaria para Deutsche Bahn, el mayor operador ferroviario de Europa.
Aunque estas asociaciones muestran diversas aplicaciones para las soluciones de Instadeep, su adquirente tenía un caso de uso claro: utilizar la inteligencia artificial para desarrollar terapias y vacunas para varios tipos de cáncer y enfermedades infecciosas, algo en lo que ahora se está enfocando más bajo su nuevo dueño. Quince meses después de la adquisición, el cofundador y CEO Karim Beguir comentó en una entrevista que Instadeep ha logrado avances significativos en este sentido, a pesar de que la empresa de IA sigue operando de manera independiente y continúa ofreciendo soluciones a clientes fuera del sector biotecnológico.
Beguir mencionó que el objetivo de Instadeep en el último año ha sido implementar inteligencia artificial en cada paso del proceso de BioNTech para mejorar los procedimientos existentes. Un ejemplo que compartió fue en histología, que implica el análisis de tejidos y la tarea visual de etiquetar diferentes tejidos, como identificar células tumorales o células sanas. Según él, los expertos de BioNTech tradicionalmente realizaban este trabajo manualmente, pero la tecnología de Instadeep ha acelerado el proceso mediante la implementación de sistemas de IA visual y segmentación, aumentando la velocidad de este flujo de trabajo en cinco veces.
Otro logro es la finalización de su proyecto RiboMab, que involucra anticuerpos codificados por ARNm que ahora forman parte del kit de herramientas de BioNTech como empresa de inmunoterapia para combatir el cáncer y otras enfermedades. Instadeep presentó este proyecto en su plataforma DeepChain, que diseña proteínas y analiza datos biológicos, durante su primera colaboración en 2020.
La biotecnología implica una gran cantidad de datos sensibles de salud. Recopilarlos y analizarlos es una cosa, pero mantenerlos seguros es otra. BioNTech no es ajena a estos eventos; en 2020, hackers accedieron ilegalmente a documentos relacionados con su vacuna COVID-19 al atacar la Agencia Europea de Medicamentos (EMA). Aunque Pfizer y BioNTech confirmaron que sus sistemas y datos de ensayos permanecieron seguros, el incidente resalta la vulnerabilidad de las organizaciones, incluso las regulatorias, a ciberataques.
Beguir asegura que Instadeep y BioNTech son muy cautelosos con los datos de salud, especialmente porque la asociación está utilizando IA para aumentar los activos de datos, permitiéndoles identificar secuencias de proteínas precisas y potencialmente desbloquear nuevos objetivos para el cáncer y otros casos de uso de inmunoterapia. Sin embargo, hay una segmentación en los datos que utilizan ambas empresas. BioNTech maneja datos personales de pacientes reales, mientras que Instadeep desarrolla modelos y los entrena con datos disponibles públicamente.
En cuanto a los próximos hitos para Instadeep dentro de BioNTech, Beguir menciona el “último avance” de la startup: las redes de flujo bayesianas (BFN), un nuevo modelo de IA generativa para proteínas que supera significativamente a los modelos autoregresivos y de difusión. El CEO de BioNTech, Ugur Sahin, describe esta tecnología como “de última generación”. Según Beguir, el modelo produce las proteínas más naturales y mejor comportadas del mercado.
Instadeep lanzó el nuevo modelo de IA la semana pasada junto con un nuevo superordenador casi exaescala, lo que coloca a la asociación entre las 100 mejores en computación e infraestructura y entre los 20 mejores clústeres de GPU H100 a nivel mundial. Ambos desarrollos destacan cómo Instadeep, bajo BioNTech, implementa IA en varios casos de uso en ciencias de la vida.
Por otro lado, Instadeep maneja de manera independiente su otra línea de negocio, que involucra IA y aprendizaje profundo para la optimización industrial. Un ejemplo es su proyecto de 12 años para automatizar la planificación y despacho ferroviario para Deutsche Bahn. Además, la empresa ha intensificado esfuerzos para desarrollar otros casos de uso de optimización industrial, como colaborar con Fraport en Alemania para optimizar operaciones complejas en aeropuertos con IA.
Beguir también menciona el lanzamiento de la versión pro de su producto DeepPCB, un diseño de placa de circuito impreso completamente asistido por IA autónoma en San Francisco. Aunque BioNTech gastó 500 millones de dólares en Instadeep para mejorar sus capacidades biotecnológicas, mantiene a la empresa de IA operativamente independiente, permitiéndole trabajar en proyectos fuera de la biotecnología.
Desde la adquisición, Instadeep ha crecido a más de 400 empleados en todo el mundo, incluyendo un nuevo equipo en Kigali, que lidera el trabajo de inteligencia geoespacial de la empresa. Instadeep ahora utiliza datos de etiquetas pasadas e imágenes satelitales para inferir con alta calidad y una precisión del 80-85% dónde estarán los lugares de reproducción de langostas en los próximos 30 días. Beguir destaca que InstaGeo, el marco de la empresa que utiliza imágenes satelitales, es de código abierto y está disponible para que otras empresas desarrollen soluciones escalables en el continente.