No faltan las startups que intentan crear asistentes de inteligencia artificial para empresas. Sin embargo, lo que es menos común es un asistente que pueda realizar tareas en varias aplicaciones de trabajo al mismo tiempo. Esa es la propuesta de Narada AI, una startup que ha desarrollado un asistente de IA basado en investigaciones recientes de la Universidad de California en Berkeley. Narada ha estado trabajando en secreto durante dos años y hoy hizo su debut público en el evento Startup Battlefield 20 de TechCrunch Disrupt 2024.
Dos de sus cofundadores, Kurt Keutzer y Amir Gholami, coescribieron un artículo este año sobre “Compiladores LLM”, que son sistemas de IA que pueden realizar múltiples funciones simultáneamente. La startup se basa en esta técnica de código abierto y cree que es un aspecto clave que la diferencia de los chatbots de IA de uso general. Dave Park, cofundador y CEO de la empresa, menciona que su equipo utilizó esta base para construir un modelo de IA personalizado que puede utilizar herramientas de productividad. Park, quien tiene un doctorado en informática de Stanford y 24 años de experiencia en ventas empresariales, considera que el Compilador LLM y la capacidad de Narada para usar sitios web sin APIs son la “clave secreta” para ganar en la carrera de agentes empresariales.
La idea suena prometedora, pero ¿cómo funciona el asistente en la práctica? Al probarlo, descubrí que el asistente podía ejecutar varias tareas utilizando IA generativa a través de diferentes aplicaciones de trabajo, ahorrándome unos segundos o minutos en distintas partes de mi día. El asistente se presenta en una ventana de chat separada en tu navegador y puede redactar correos electrónicos, hacer invitaciones de calendario, tomar notas en reuniones y buscar información en la web en tu nombre. La empresa afirma que su asistente también puede navegar por aplicaciones empresariales, como encontrar una factura en SAP, tomar notas en una videollamada o analizar información de las numerosas aplicaciones de Salesforce.
Le pedí al asistente de IA que redactara un correo electrónico amistoso para rechazar una invitación que había recibido. En segundos, apareció un borrador en mi Gmail con el destinatario correcto (sin que yo le dijera el correo de la persona, lo encontró), el asunto y el cuerpo del mensaje, todo con mi firma al final. Solo tuve que revisarlo y hacer clic en enviar. En otra ocasión, le pedí al asistente que encontrara un restaurante japonés bien valorado en mi vecindario en San Francisco y que programara una invitación de calendario para cenar con un amigo en un horario que funcionara con mi agenda. Encontró un restaurante, creó la invitación de calendario y redactó un correo para mi amigo con la información.
¿Cómo logra el asistente hacer todo esto? Para acceder a tu correo y calendario, el asistente utiliza parcialmente APIs para acceder a estos programas a través de un backend orientado a desarrolladores. Sin embargo, Park menciona que su agente de IA también hace clic, desplaza y escribe a través del frontend de los sitios web (así es como abre los borradores de correo en Gmail, por ejemplo). Este agente de frontend, que ellos llaman Web Redemption, debería permitir a Narada utilizar aplicaciones empresariales sin APIs, como HubSpot. Gholami, el CTO de la startup, explica que el agente funciona como un Roomba, creando un mapa interno para entender nuevos sitios web o aplicaciones. Una vez que un usuario le indica a Narada que desea utilizar una nueva aplicación, el agente supuestamente la mapea para poder entender cómo usarla.
Sin embargo, Narada no es la única startup que intenta crear un agente de IA que pueda usar sitios web a través de un frontend. La idea es similar a la de otros proyectos como el uso de computadoras de Anthropic o el LAM de Rabbit. Sin embargo, estos agentes son difíciles de implementar en la práctica y requieren mucho mantenimiento para seguir funcionando. Si las páginas web actualizan su diseño, puede romperse el agente. La principal diferencia del agente de Narada es que se centra exclusivamente en aplicaciones empresariales, en lugar de ser un agente de propósito general para cualquier sitio web.
En cuanto al Compilador LLM, ya hay personas en la industria implementando este método de código abierto. Gholami menciona que LangChain y LlamaIndex ya tienen integraciones con el Compilador LLM. Pero la herramienta de Narada es única porque está enfocada en el ámbito empresarial; la startup ya tiene una empresa Fortune 500 utilizando su agente, aunque no reveló cuál.
¿Es esto un reemplazo para un asistente humano? No realmente. Sin embargo, la herramienta a veces se siente como un atajo para tareas mundanas, lo cual es más de lo que puedo decir de muchas herramientas de IA hoy en día. Una cosa que me hizo sentir un poco incómodo fue la cantidad de acceso que tuve que darle a este asistente de IA. Narada puede leer todos mis correos, ver mi calendario completo y conocer toda mi lista de contactos. Como cualquier “asistente inteligente” o aplicación de ayuda, debes confiar no solo en la tecnología, sino también en la empresa misma, que Narada no abusará de tus datos ni de los de tu empresa. Dicho esto, la compañía promete no entrenar sus modelos de IA con datos de clientes.
Hasta ahora, Narada ha recaudado algunos millones de dólares de varios asesores que ha incorporado, pero el CEO indica que ahora buscan recaudar más de capitales de riesgo tradicionales.