La inteligencia artificial (IA) a veces inventa información, lo que puede ser un problema, especialmente para las empresas, ya que respuestas incorrectas pueden afectar sus ganancias. Un estudio reciente de Salesforce muestra que la mitad de los trabajadores teme que las respuestas de los sistemas de IA generativa de sus empresas no sean precisas. Aunque no hay una solución perfecta para estas “alucinaciones”, existen métodos que pueden ayudar. Uno de ellos es la generación aumentada por recuperación (RAG), que combina un modelo de IA con una base de conocimiento para ofrecer información adicional antes de que el modelo responda, funcionando como un mecanismo de verificación de hechos.
Empresas como Voyage AI, fundada en 2023 por el profesor de Stanford Tengyu Ma, han surgido para satisfacer la creciente demanda de IA más confiable. Voyage proporciona sistemas RAG a compañías como Harvey, Vanta, Replit y SK Telecom. Según Ma, “Voyage tiene la misión de mejorar la precisión y eficiencia en la búsqueda y recuperación en la IA empresarial”. Las soluciones de Voyage están diseñadas para áreas específicas como programación, finanzas, derecho y aplicaciones multilingües, adaptándose a los datos de cada empresa.
Para implementar sistemas RAG, Voyage entrena modelos de IA que convierten texto, documentos y otros tipos de datos en representaciones numéricas llamadas “embeddings vectoriales”. Estos embeddings capturan el significado y las relaciones entre diferentes datos de manera compacta, lo que los hace útiles para aplicaciones de búsqueda. Voyage utiliza un tipo específico de embedding llamado “embedding contextual”, que no solo captura el significado semántico de los datos, sino también el contexto en el que aparecen.
Voyage ofrece sus modelos para uso en instalaciones propias, en la nube privada o pública, y ajusta sus modelos para los clientes que eligen pagar por este servicio. Aunque otras empresas como OpenAI también ofrecen servicios de embeddings personalizables, Ma afirma que los modelos de Voyage ofrecen un mejor rendimiento a un costo menor.
En el proceso de RAG, cuando se recibe una pregunta, primero se recupera información relevante de una base de conocimiento no estructurada, similar a cómo un bibliotecario busca libros en una biblioteca. Los métodos convencionales de RAG a menudo enfrentan problemas de pérdida de contexto, lo que dificulta la recuperación de información relevante. Los modelos de embedding de Voyage, según Ma, tienen una precisión de recuperación de primer nivel, lo que mejora la calidad de respuesta de los sistemas RAG.
Voyage cuenta con el respaldo de Anthropic, un competidor de OpenAI, que describe los modelos de Voyage como “de última generación”. Actualmente, Voyage tiene más de 250 clientes y recientemente cerró una ronda de financiamiento de 20 millones de dólares, lo que eleva su total recaudado a 28 millones. Este capital permitirá a la empresa lanzar nuevos modelos de embedding y duplicar su tamaño.