El CEO de OpenAI, Sam Altman, comenzó el año afirmando en un blog que 2025 será un año importante para los agentes de inteligencia artificial, herramientas que pueden automatizar tareas y tomar acciones en tu nombre. Ahora, OpenAI está dando su primer paso real en este ámbito. El jueves, OpenAI anunció el lanzamiento de una vista previa de investigación de Operator, un agente de inteligencia artificial de propósito general que puede controlar un navegador web y realizar ciertas acciones de manera independiente.
Operator estará disponible primero para los usuarios en EE. UU. que estén suscritos al plan Pro de ChatGPT, que cuesta 200 dólares al mes. OpenAI planea expandir esta función a más usuarios en sus planes Plus, Team y Enterprise en el futuro. Esta vista previa inicial se puede acceder a través de operator.chatgpt.com, pero OpenAI también tiene la intención de integrar Operator en ChatGPT.
La nueva función de Operator promete automatizar tareas como reservar alojamientos, hacer reservas en restaurantes o comprar en línea. Los usuarios pueden elegir entre varias categorías de tareas dentro de Operator, que incluyen compras, entregas, cenas y viajes, cada una permitiendo diferentes tipos de automatización. Cuando los usuarios de ChatGPT activan el agente Operator, aparecerá una pequeña ventana que mostrará un navegador web dedicado que utiliza el agente, junto con texto que explica las tareas que está realizando. Los usuarios aún pueden controlar su pantalla mientras Operator trabaja.
OpenAI explica que Operator está impulsado por un modelo llamado CUA (agente que usa computadora), que combina las capacidades visuales del modelo GPT-4o de la compañía con las habilidades de razonamiento de sus modelos más avanzados. El CUA está entrenado para interactuar con la interfaz de los sitios web, lo que significa que no necesita usar APIs dirigidas a desarrolladores para acceder a diferentes servicios. En otras palabras, el CUA puede utilizar botones, navegar por menús y completar formularios en una página web, de manera similar a como lo haría un humano.
El modelo CUA está diseñado para pedir confirmación al usuario antes de finalizar tareas que puedan tener efectos externos, como enviar un pedido o un correo electrónico, permitiendo que el usuario revise el trabajo del modelo antes de que se haga permanente. OpenAI también menciona que está colaborando con empresas como DoorDash, Instacart, Priceline, StubHub y Uber para asegurarse de que Operator respete las normas de estos negocios. Sin embargo, OpenAI advierte que el CUA no es perfecto y no espera que funcione de manera confiable en todos los escenarios por el momento. Por precaución, OpenAI requiere supervisión para algunas tareas, como transacciones bancarias, que el CUA y Operator podrían realizar por sí solos. En sitios web particularmente sensibles, como el correo electrónico, Operator requiere supervisión activa del usuario, asegurando que puedan detectar y corregir cualquier posible error que el modelo pueda cometer.