OpenAI ha lanzado una nueva función para su aplicación ChatGPT en MacOS que permite a los desarrolladores trabajar de manera más eficiente. Ahora, ChatGPT puede leer código directamente desde aplicaciones de programación como VS Code, Xcode, TextEdit, Terminal e iTerm2. Esto significa que los programadores ya no necesitan copiar y pegar su código en ChatGPT, lo que era una práctica común. Con esta nueva función, llamada “Trabajar con Aplicaciones”, OpenAI envía automáticamente la sección de código en la que estás trabajando junto con tu solicitud al chatbot.
Sin embargo, a diferencia de otras herramientas de codificación de IA como Cursor o GitHub Copilot, ChatGPT no puede escribir código directamente en las aplicaciones de desarrollo por ti. OpenAI considera que esta función es un “bloque de construcción clave” para desarrollar sistemas más avanzados que puedan actuar como agentes. Uno de los principales retos para estos agentes de IA es comprender lo que hay en la pantalla de tu computadora, más allá de las solicitudes que reciben.
Por ahora, OpenAI se está enfocando en aplicaciones de codificación, ya que los asistentes de codificación de IA son uno de los usos más populares de los modelos de lenguaje. La función está disponible para usuarios de Plus y Teams, y se lanzará para Enterprise y Edu en las próximas semanas. OpenAI planea expandir esta capacidad a otras aplicaciones, especialmente aquellas basadas en texto que se utilizan para tareas de escritura.
En una demostración, un empleado de OpenAI mostró cómo ChatGPT podía ayudar a completar un proyecto simple en Xcode que modelaba el sistema solar, aunque faltaba la Tierra. El empleado le pidió a ChatGPT que “agregara los planetas que faltaban”, y el chatbot pudo generar una línea de código para representar la Tierra, aunque todavía tuvo que copiar y pegar la respuesta en su entorno de trabajo.
Para leer diferentes aplicaciones, OpenAI utiliza principalmente la API de Accesibilidad de MacOS, que ha estado disponible durante casi dos décadas y es bastante confiable para la mayoría de las aplicaciones comunes. Sin embargo, algunas aplicaciones, como VS Code, requieren que los usuarios instalen una extensión especial para que la función funcione. Además, el lector de pantalla de MacOS solo puede leer texto, por lo que no puede ayudar a ChatGPT a comprender elementos visuales como fotos o videos.
La función “Trabajar con Aplicaciones” enviará las últimas 200 líneas de código a ChatGPT junto con cada solicitud en ciertas aplicaciones. En otras, se utilizará todo el código en la ventana activa como entrada para el chatbot. Los usuarios pueden resaltar secciones de código o texto para ayudar a ChatGPT a concentrarse en la parte correcta del proyecto, aunque también incluirá texto circundante.
OpenAI ha mencionado que este desarrollo es un paso importante hacia la creación de agentes de IA más avanzados. Recientemente, se ha informado que OpenAI está cerca de lanzar un agente de IA de propósito general, conocido como “Operador”, que se espera llegue a principios de 2025. Este nuevo agente competirá con otros intentos de agentes de IA de propósito general, como el sistema de Anthropic o el agente “Jarvis” de Google.
Por ahora, estas funciones se están lanzando en MacOS, justo antes de que Apple integre ChatGPT en diciembre. Aún no se sabe cuándo estará disponible “Trabajar con Aplicaciones” en Windows, el sistema operativo creado por Microsoft, el mayor patrocinador de OpenAI.