El martes por la tarde, Anthropic lanzó “Claude Juega Pokémon” en Twitch, una transmisión en vivo del nuevo modelo de inteligencia artificial de Anthropic, Claude 3.7 Sonnet, jugando Pokémon Rojo. Este evento se ha convertido en un experimento fascinante que muestra las capacidades de la tecnología de IA actual y las reacciones de las personas ante ella. Los investigadores de IA han utilizado diferentes videojuegos, desde Street Fighter hasta Pictionary, para probar nuevos modelos, a menudo más por diversión que por utilidad. Sin embargo, Anthropic afirmó que Pokémon resultó ser un buen punto de referencia para Claude 3.7 Sonnet, que puede “pensar” en los acertijos que contiene el juego.
Al igual que o3-mini de OpenAI y R1 de DeepSeek, Claude 3.7 Sonnet puede “razonar” para superar desafíos difíciles, como jugar un videojuego diseñado para niños. Mientras que su predecesor, Claude 3.5 Sonnet, no pudo salir de la casa del jugador en Pueblo Paleta, Claude 3.7 Sonnet logró ganar tres medallas de líderes de gimnasio. Sin embargo, el nuevo modelo también enfrenta dificultades. Horas después de comenzar la transmisión en Twitch, el modelo se encontró con una pared de roca que no podía atravesar, sin importar cuánto lo intentara. Un usuario de Twitch resumió la situación de esta manera: “¿quién ganaría, una IA de computadora con miles de horas de programación, o una pared de roca?” Finalmente, Claude se dio cuenta de que podía rodear la pared.
Por un lado, es frustrante ver a Claude avanzar en Pokémon Rojo con la velocidad de un Slowpoke, razonando cada paso con una contemplación exasperante. Sin embargo, también es extrañamente cautivador. A la izquierda de la transmisión se muestra el “proceso de pensamiento” de Claude, mientras que a la derecha se ve el juego en tiempo real. En un momento, Claude intentó localizar al Profesor Oak en su laboratorio, pero se confundió debido a otros personajes no jugables (NPC) en la escena. “Noto que ha aparecido un nuevo personaje debajo de mí — un personaje con cabello negro y lo que parece ser un abrigo blanco en las coordenadas (2, 10),” escribió Claude. “¡Este podría ser el Profesor Oak! Voy a bajar y hablar con él.” Luego, Claude terminó hablando erróneamente con un NPC diferente al Profesor, un personaje con el que ya había interactuado varias veces. Algunos de los mil usuarios en el chat de Twitch comenzaron a impacientarse, mientras que otros, especialmente aquellos que llevaban más tiempo viendo la transmisión, estaban menos preocupados. “Chicos, tranquilos,” escribió una persona en el chat. “Antes salimos y entramos al laboratorio de Oak como 10 veces antes de entender cómo avanzar.”
Para los usuarios veteranos de Twitch, el formato de la transmisión de Anthropic puede resultar nostálgico. Hace más de una década, millones de personas intentaron jugar Pokémon Rojo al mismo tiempo en un experimento social en línea llamado Twitch Plays Pokémon. Cada usuario podía controlar al personaje del jugador a través del chat de Twitch, lo que resultaba en un juego caótico. Algunos investigadores de IA han citado Twitch Plays Pokémon como inspiración para su trabajo. En octubre de 2023, el ingeniero de software de Seattle, Peter Whidden, publicó un video en YouTube donde detallaba cómo entrenó un algoritmo de aprendizaje por refuerzo para jugar Pokémon. Su IA pasó más de 50,000 horas jugando antes de aprender a navegar con éxito en el juego. Un desafío fue que la IA prefería admirar el paisaje pixelado en lugar de jugar realmente.
Las “recreaciones” impulsadas por IA de Twitch Plays Pokémon, como las de Whidden y Anthropic, son entretenidas, pero también un poco agridulces. La transmisión original fue un momento clave en la historia de Twitch porque unió a las personas de una manera inesperada. Todos estaban en el mismo equipo, trabajando para lograr que el personaje del jugador dejara de correr en círculos y avanzara en el juego. En 2025, parece que ya no somos compañeros de equipo, sino espectadores, observando a un modelo de IA intentar jugar un juego que muchos de nosotros dominamos a los cinco años. Es un microcosmos motivado por IA de una tendencia más amplia: nuestras experiencias en línea están pasando de ser actividades compartidas y comunitarias a ser más solitarias.