El jefe de IA de Microsoft causa controversia al llamar “freeware” a la información pública utilizada para entrenar modelos de IA
El jefe de IA de Microsoft, Mustafa Suleyman, ha generado indignación al afirmar que toda la información disponible públicamente utilizada para entrenar modelos de IA es “freeware”. Durante una entrevista con CNBC en el Aspen Ideas Festival, Suleyman, CEO de Microsoft AI, intentó diferenciar entre el contenido web accesible públicamente y el material protegido por derechos de autor. Sin embargo, también reconoció la complejidad de los contenidos que los editores protegen específicamente contra el scraping.
¿Debería la IA usar contenido publicado en línea para su entrenamiento?
En una amplia discusión sobre el estado actual de la tecnología de IA, su impacto potencial en diversas industrias y la sociedad, los desafíos y preocupaciones en torno a su desarrollo y el papel de la IA en el futuro, Suleyman también enfatizó la necesidad de un desarrollo y gobernanza responsables.
El debate se centra en los modelos de IA de código abierto y cerrado, con Suleyman abogando por la cooperación en lugar de un enfoque adversarial en el desarrollo internacional, especialmente en relación con China. Sin embargo, independientemente de dónde se entrenen los modelos de IA, los creadores de contenido han argumentado que su propiedad intelectual está siendo explotada sin compensación, sugiriendo que el uso no autorizado de su trabajo amenaza sus medios de vida y, en cierta medida, la integridad de la IA generativa.
La declaración de Suleyman de que los límites legales del entrenamiento de modelos de IA aún no están claros se refleja en casos judiciales en curso. Poco después de la discusión, el Centro de Reportajes de Investigación presentó una demanda contra OpenAI y su principal inversor, Microsoft, por usar el contenido de la organización sin permiso ni compensación.
La CEO del Centro, Monika Bauerlein, declaró: “OpenAI y Microsoft comenzaron a absorber nuestras historias para hacer su producto más poderoso, pero nunca pidieron permiso ni ofrecieron compensación, a diferencia de otras organizaciones que licencian nuestro material”.
Mientras Microsoft enfrenta un escrutinio continuo sobre su manejo de datos para la IA, al menos ha ofrecido protección a los usuarios de sus herramientas GenAI para protegerlos de cualquier caso de derechos de autor.
Un portavoz de OpenAI nos dijo: “Estamos trabajando de manera colaborativa con la industria de noticias y asociándonos con editores de noticias globales para mostrar su contenido en nuestros productos como ChatGPT, incluyendo resúmenes, citas y atribuciones, para dirigir tráfico de vuelta a los artículos originales. Un componente de las asociaciones es la capacidad de aprovechar el contenido de los editores utilizando diversas técnicas de aprendizaje automático y entrenamiento para ayudarnos a optimizar la visualización de ese contenido y hacerlo más útil para los usuarios”.
TechRadar Pro solicitó a Microsoft un comentario sobre la reciente demanda, pero no recibimos una respuesta inmediata.