Meta Demandada por Piratería de Contenido Adulto para Entrenar su IA

Futurism

Una nueva demanda presentada en un tribunal federal de California por las compañías de cine para adultos Strike 3 Holdings y Counterlife Media alega que Meta pirateó casi 2.400 películas para adultos con derechos de autor para entrenar sus modelos de inteligencia artificial, incluidos Meta Movie Gen y su modelo de lenguaje grande, LLaMA. La demanda, señalada por primera vez por TorrentFreak, afirma que Meta comenzó a descargar y compartir este contenido a través de BitTorrent ya en 2018.

Los demandantes afirman que su análisis de infracción y herramientas de seguimiento de IP identificaron 47 direcciones IP asociadas con Meta, incluida una dirección IP residencial de un empleado de Meta, como involucradas en la descarga de su contenido con derechos de autor. También señalaron “patrones no humanos” en el movimiento de datos, lo que sugiere que la adquisición de contenido fue para datos de entrenamiento de IA. Strike 3 Holdings y Counterlife Media buscan daños de hasta $150.000 por video robado, lo que podría ascender a $359 millones si se consideran los 2.396 contenidos. La demanda también busca la eliminación de cualquier contenido con derechos de autor y pirateado, y una orden judicial para prohibir permanentemente a Meta volver a usar torrents de su trabajo.

Esta demanda se suma a un número creciente de desafíos legales que Meta enfrenta con respecto a sus datos de entrenamiento de IA. En 2023, autores, incluida Sarah Silverman, presentaron una demanda colectiva similar contra Meta, alegando que la compañía utilizó libros pirateados de “bibliotecas en la sombra” como LibGen para entrenar sus modelos LLaMA. Comunicaciones internas de Meta, citadas en documentos judiciales, sugieren que el CEO de Meta, Mark Zuckerberg, aprobó el uso del conjunto de datos LibGen a pesar de las advertencias internas de que se sabía que era pirateado. Estos documentos también indican discusiones entre empleados de Meta sobre los riesgos y beneficios de usar contenido con derechos de autor e incluso formas de ocultar cómo la compañía adquirió sus datos de entrenamiento de IA.

Meta ha defendido generalmente su uso de material con derechos de autor para el entrenamiento de IA bajo la doctrina del “uso legítimo” (fair use), argumentando que sus modelos no redistribuyen las obras originales de una manera que perjudique a los titulares de los derechos de autor. Sin embargo, esta defensa está siendo rigurosamente probada en los tribunales, con algunas sentencias, como en el caso Thomson Reuters contra ROSS Intelligence, que indican que privar a un titular de derechos de autor de la capacidad de licenciar su trabajo como datos de entrenamiento de IA podría socavar una defensa de uso legítimo.

El panorama más amplio del desarrollo de la IA es actualmente un campo de batalla para los derechos de propiedad intelectual. Más de treinta demandas han sido presentadas contra empresas de IA en tribunales federales de EE. UU. por titulares de derechos de autor, alegando el uso no autorizado de sus obras para desarrollar modelos de IA. Estos casos involucran varias formas de contenido, incluidos texto, imágenes y video, y plantean preguntas fundamentales sobre la compensación para los creadores, el alcance del uso legítimo en el contexto de la IA y la transparencia de las fuentes de datos de entrenamiento de IA. Un fallo en contra de Meta en estos casos podría impactar significativamente la forma en que todas las empresas de IA entrenan sus modelos, lo que podría llevar a mayores requisitos de licencia, costos más altos y regulaciones más estrictas para la industria de la IA.