Los CIOs de empresas están adoptando la inteligencia artificial generativa con cautela. Una de las razones es que la IA no se adapta a los flujos de trabajo de ingeniería de software existentes, ya que no “habla” el mismo idioma. Por ejemplo, los modelos de lenguaje grande (LLMs) requieren mucha manipulación para entregar datos válidos en formato JSON. Aquí es donde entra en juego una startup estadounidense llamada Dottxt, que promete “hacer que la IA hable el lenguaje de las computadoras”. La empresa está dirigida por el equipo detrás del proyecto de código abierto Outlines, que ayuda a los desarrolladores a obtener lo que necesitan de ChatGPT y otros modelos de IA generativa sin recurrir a tácticas poco éticas.
Bibliotecas de software como Outlines, una biblioteca de Python, o Guidance de Microsoft, permiten guiar a los LLMs de una manera más sofisticada que simplemente manipular los comandos. Este enfoque se conoce como generación estructurada. Según el CEO de Dottxt, Rémi Louf, la técnica se centra más en la salida de los LLMs que en la entrada, lo que significa que se trata de decir a los modelos de IA cómo deben responder. Louf explica que este enfoque permite volver a un flujo de trabajo de ingeniería tradicional, refinando la “gramática” hasta obtener el resultado correcto.
Dottxt busca construir una solución de generación estructurada potente, siendo independiente de los modelos y ofreciendo más características y mejor rendimiento que el proyecto Outlines. Louf, que tiene un doctorado y experiencia en estadísticas bayesianas, y otros miembros del equipo de Dottxt, han reconocido el potencial de la generación estructurada gracias a su formación en teoría de probabilidades. Además, su familiaridad con la tecnología más allá de la IA los llevó a crear una empresa que ayude a otros a aprovechar la IA generativa de manera útil.
La referencia de Louf a la gramática no es casualidad. Dottxt se basa en la premisa de que la mayoría del texto con el que interactuamos está muy estructurado. Recientemente, OpenAI, creador de GPT, introdujo una forma de generación estructurada llamada Salidas Estructuradas, mencionando a Outlines como parte de su inspiración.
La popularidad de Outlines indica que hay demanda por un enfoque flexible con más funcionalidades. Los inversores están de acuerdo: Dottxt ha recaudado 11.9 millones de dólares en pocos meses, comenzando con una ronda de pre-semilla de 3.2 millones de dólares liderada por la firma de capital de riesgo Elaia en 2023, seguida de una ronda de semilla de 8.7 millones de dólares liderada por EQT Ventures en agosto. Durante este tiempo, Louf y sus cofundadores se han enfocado en demostrar que su enfoque no afecta el rendimiento. La demanda por Outlines ha crecido, con más de 2.5 millones de descargas, lo que los ha motivado a pensar en grande.
Dottxt planea utilizar los fondos para contratar más personal y responder a la creciente demanda de herramientas de generación estructurada. Su equipo remoto alcanzará los 17 miembros a finales de mes, en comparación con ocho en junio. Entre los nuevos empleados hay dos profesionales de relaciones con desarrolladores, lo que refleja la prioridad de Dottxt en construir un ecosistema. Louf afirma que su objetivo en los próximos 18 meses es acelerar la adopción más que el lado comercial, aunque la comercialización comenzará en seis meses, enfocándose en clientes empresariales.
Este enfoque podría ser arriesgado si el interés en la IA disminuye para cuando Dottxt busque más financiamiento. Sin embargo, la startup está convencida de que hay sustancia detrás de la burbuja; su esperanza es ayudar a las empresas a desbloquear el verdadero valor de la IA. Julien Chaumond, CTO de Hugging Face e inversor en Dottxt, ha llamado a la generación estructurada “el futuro de los LLMs”. Con otras tendencias como los agentes de IA y el auge de modelos de IA más pequeños, la apuesta de Dottxt por la adopción podría dar frutos. Louf predice: “Todos estarán usando generación estructurada en unos años, no hay duda de eso”.