Los abogados de The New York Times y Daily News están demandando a OpenAI porque creen que la empresa usó sus artículos sin permiso para entrenar sus modelos de inteligencia artificial. Recientemente, los abogados informaron que los ingenieros de OpenAI borraron accidentalmente datos que podrían ser importantes para el caso.
Este otoño, OpenAI aceptó proporcionar dos máquinas virtuales para que los abogados de los periódicos pudieran buscar contenido protegido por derechos de autor en sus conjuntos de datos de entrenamiento. Desde el 1 de noviembre, los abogados y expertos han pasado más de 150 horas buscando información en esos datos. Sin embargo, el 14 de noviembre, los ingenieros de OpenAI eliminaron todos los datos de búsqueda de los periódicos que estaban almacenados en una de las máquinas virtuales.
OpenAI intentó recuperar la información y tuvo cierto éxito, pero debido a que la estructura de carpetas y los nombres de archivos se perdieron de forma irreversible, los datos recuperados no pueden ayudar a determinar dónde se usaron los artículos de los demandantes para construir los modelos de OpenAI.
Los abogados de los periódicos mencionaron que han tenido que volver a hacer su trabajo desde cero, lo que ha requerido mucho tiempo y recursos. Ayer se enteraron de que los datos recuperados no son utilizables y que todo el trabajo de una semana debe hacerse de nuevo, lo que motivó la presentación de una carta adicional al tribunal.
Los abogados aclararon que no creen que la eliminación de datos haya sido intencional, pero sí resaltaron que OpenAI está en la mejor posición para buscar en sus propios conjuntos de datos cualquier contenido que pueda infringir derechos de autor.
OpenAI ha defendido su posición, afirmando que usar datos disponibles públicamente, incluidos los artículos de The Times y Daily News, es un uso justo. Esto significa que, al crear modelos como GPT-4, que aprenden de millones de ejemplos para generar texto similar al humano, OpenAI considera que no necesita pagar por esos ejemplos, incluso si obtiene beneficios económicos de ellos.
A pesar de esto, OpenAI ha firmado acuerdos de licencia con varios editores, como The Associated Press y Financial Times, entre otros. Aunque OpenAI no ha revelado los detalles de estos acuerdos, se informa que uno de sus socios, Dotdash, recibe al menos 16 millones de dólares al año.