La inteligencia artificial (IA) está entrando en todos los rincones de la biotecnología y la investigación farmacéutica. Sin embargo, implementar esta tecnología no siempre es fácil. Converge Bio ha desarrollado una herramienta que ayuda a las empresas a hacer que sus modelos de lenguaje centrados en biología funcionen correctamente, desde “enriquecer” sus datos hasta explicar sus respuestas. La compañía ha recaudado 5.5 millones de dólares en una ronda inicial para escalar su producto.
El CEO y cofundador, Dov Gertz, explicó que “un modelo es solo un modelo. No es suficiente”. Aseguró que es necesario crear un proceso para que las empresas puedan usar el modelo en su investigación y desarrollo. Aunque el mercado es muy fragmentado, las empresas farmacéuticas y biotecnológicas quieren consumir esta tecnología de manera consolidada, en un solo lugar. “Queremos ser ese lugar”, añadió.
Para aquellos que no son ingenieros de aprendizaje automático en el descubrimiento de fármacos, el problema puede no ser familiar. Existen modelos de lenguaje potentes, entrenados no solo con libros e internet, sino con enormes bases de datos de ADN, estructuras de proteínas y genómica. Estos modelos son versátiles, pero requieren mucho trabajo para adaptarlos a un uso diario en laboratorios, especialmente en áreas especializadas como microbiología o inmunología.
Gertz mencionó la investigación de anticuerpos como un ejemplo. Aunque existe un modelo de lenguaje entrenado en biología específica de anticuerpos, es bastante general. Converge Bio ofrece mejoras que se pueden realizar de manera segura utilizando la propiedad intelectual de la empresa. Primero, se realiza un “enriquecimiento de datos”, añadiendo información importante relacionada, como interacciones entre antígenos y anticuerpos. Luego, el modelo se ajusta a un antígeno específico que el equipo desea atacar y sobre el cual puede tener datos propios.
La plataforma también proporciona una capa importante de “explicabilidad”. Los investigadores pueden profundizar en los resultados para entender no solo que “esta secuencia funciona mejor que esta”, sino también identificar a nivel de aminoácido o par de bases qué parte de la secuencia está mejorando el rendimiento. Además, genera nuevas secuencias que ofrecen resultados mejorados, también con explicabilidad.
Converge utiliza muchos modelos de base de código abierto y gratuitos, pero también está trabajando en desarrollar el suyo propio. Ya tiene un proceso propietario para la parte de explicabilidad. El “currículo” de enriquecimiento de datos es completamente suyo, lo cual no es un proceso trivial. Gertz destacó que las metodologías de entrenamiento son uno de los secretos mejor guardados por las empresas de IA más exitosas.
A pesar de esto, muchas empresas biotecnológicas no cuentan con una solución dedicada para trabajar con modelos de lenguaje en su campo. Gertz comentó que su objetivo es ser “la tienda integral para la IA generativa en biotecnología” y utilizar eso como base para ofrecer más soluciones con el tiempo. Los inversores parecen estar de acuerdo, invirtiendo 5.5 millones de dólares en una ronda inicial liderada por TLV Partners. La empresa utilizará este dinero para contratar personal y adquirir clientes, además de publicar un artículo científico sobre el diseño de anticuerpos utilizando sus propios sistemas y entrenar “un modelo de base adecuado”.