El sitio web británico de crianza Mumsnet ha presentado una demanda contra OpenAI, alegando que violó la ley de derechos de autor al usar sus datos para entrenar sus modelos de inteligencia artificial, incluyendo ChatGPT. Esta es la primera acción legal de este tipo contra OpenAI en el Reino Unido, pero se suma a una creciente cantidad de casos similares a nivel internacional que acusan a OpenAI de recopilar información sin permiso.
Mumsnet afirma que sus foros albergan más de seis mil millones de palabras y que OpenAI utilizó esas palabras para enseñar a sus modelos de IA sobre temas de crianza y relacionados. “Dicha recopilación sin permiso es una violación explícita de nuestros términos de uso, que claramente establecen que ninguna parte del sitio puede ser distribuida, recopilada o copiada para cualquier propósito sin nuestra aprobación expresa,” explicó Justine Roberts, cofundadora de Mumsnet, en una publicación en el sitio web.
La queja legal también señala el momento de la recopilación de datos como otro punto de controversia, ya que ocurrió principalmente antes de que los sitios web prestaran mucha atención a si las empresas de IA estaban recopilando sus datos. Mumsnet alega que instituciones de investigación externas realizaron la mayoría de esta recopilación de datos inicialmente.
Roberts escribió que Mumsnet se acercó a OpenAI para licenciar su contenido, destacando que la plataforma tiene una colección concentrada de escritos por mujeres que es única en comparación con la mayoría del contenido en internet. Sin embargo, OpenAI los rechazó, citando interés en “conjuntos de datos que no son fácilmente accesibles en línea,” según Roberts.
Mumsnet no está solo en sus quejas sobre la recopilación de datos de OpenAI y ahora forma parte de un grupo creciente de empresas que llevan a OpenAI a los tribunales por este asunto. Por ejemplo, el Authors Guild ha demandado a OpenAI, alegando que se usaron libros con derechos de autor para entrenar los modelos de IA, al igual que un grupo de académicos que afirman que sus artículos fueron levantados de manera similar por OpenAI. Reuters y The New York Times también han demandado a OpenAI no solo por la recopilación de datos, sino también alegando que ChatGPT genera respuestas con contenido demasiado parecido a sus artículos con derechos de autor. Incluso Creative Commons ha presentado una demanda contra el desarrollador de IA, alegando que la empresa utilizó contenido con licencia de Creative Commons para entrenar sus modelos de IA de maneras que violaban los términos de las licencias.
OpenAI ha defendido sus prácticas argumentando que caen bajo la doctrina de uso justo. En el Reino Unido, la empresa respondió a una investigación de la Cámara de los Lores reconociendo la necesidad de usar materiales con derechos de autor para entrenar sus modelos de IA y que debería hacer más para apoyar a los creadores de contenido, pero aún sostiene que lo que hace es legal. Aunque este es el primer caso de OpenAI en el Reino Unido sobre este asunto, Getty Images tiene un caso similar en los tribunales del país contra Stability AI por su IA generadora de imágenes.
El resultado de la demanda de Mumsnet y otros casos puede sentar precedentes sobre cómo las empresas de IA manejan el contenido con derechos de autor y podría influir en futuras regulaciones y prácticas de licenciamiento. El esfuerzo por equilibrar la innovación en IA y los derechos de propiedad intelectual está lejos de resolverse y probablemente no lo estará por mucho tiempo.
Para ser justos, Mumsnet no está en contra de los modelos de lenguaje grande (LLM) y la IA como concepto. De hecho, Mumsnet empleó los modelos de OpenAI para construir un chatbot de IA llamado MumsGPT el año pasado. MumsGPT solo estaba disponible para los ejecutivos de Mumsnet cuando se anunció y no se ha mencionado desde entonces, por lo que puede que ya no esté disponible, pero la idea era ofrecerlo como una herramienta de investigación e incluso como algo que los legisladores podrían usar en el desarrollo de regulaciones relacionadas con la crianza.
Roberts no mencionó MumsGPT, pero hizo hincapié en que hay usos potenciales positivos para la IA en su explicación de la demanda. “Pero si se permite que los LLM simplemente roben contenido de editores y comunidades como Mumsnet, corren el riesgo de destruirlos,” escribió Roberts. “Sabemos que enfrentarnos a un gigante multinacional como OpenAI, con sus $3 mil millones de ingresos, no es una tarea fácil ante los enormes recursos que nos lanzarán, pero este es un tema demasiado importante como para simplemente rendirse. No solo para Mumsnet, sino para cada sitio web en el que hayas aterrizado para noticias, consejos o simplemente para preguntar si estás siendo irrazonable.”
More from TechRadar Pro.