Meta poursuivi pour piratage de films adultes pour entraîner son IA

Futurism

Une nouvelle plainte déposée devant un tribunal fédéral californien par les sociétés de films pour adultes Strike 3 Holdings et Counterlife Media allègue que Meta a piraté près de 2 400 films pour adultes protégés par le droit d’auteur pour entraîner ses modèles d’intelligence artificielle, y compris Meta Movie Gen et son grand modèle linguistique, LLaMA. La plainte, signalée pour la première fois par TorrentFreak, affirme que Meta a commencé à télécharger et à partager ce contenu via BitTorrent dès 2018.

Les plaignants affirment que leur analyse de contrefaçon et leurs outils de suivi IP ont identifié 47 adresses IP associées à Meta, y compris une adresse IP résidentielle d’un employé de Meta, comme étant impliquées dans le téléchargement de leur contenu protégé par le droit d’auteur. Ils ont également noté des « modèles non humains » dans le mouvement des données, suggérant que l’acquisition du contenu était destinée aux données d’entraînement de l’IA. Strike 3 Holdings et Counterlife Media réclament des dommages et intérêts pouvant atteindre 150 000 dollars par vidéo volée, ce qui pourrait s’élever à 359 millions de dollars si les 2 396 contenus sont pris en compte. La plainte demande également la suppression de tout contenu protégé par le droit d’auteur et piraté, ainsi qu’une injonction interdisant de manière permanente à Meta de télécharger à nouveau leurs œuvres via BitTorrent.

Cette action en justice s’ajoute à un nombre croissant de défis juridiques auxquels Meta est confronté concernant ses données d’entraînement d’IA. En 2023, des auteurs, dont Sarah Silverman, ont intenté une action en justice collective similaire contre Meta, alléguant que l’entreprise avait utilisé des livres piratés provenant de « bibliothèques fantômes » comme LibGen pour entraîner ses modèles LLaMA. Des communications internes de Meta, citées dans les documents judiciaires, suggèrent que le PDG de Meta, Mark Zuckerberg, a approuvé l’utilisation de l’ensemble de données LibGen malgré des avertissements internes selon lesquels il était connu pour être piraté. Ces documents indiquent également des discussions entre les employés de Meta sur les risques et les avantages de l’utilisation de contenu protégé par le droit d’auteur, et même sur les moyens de dissimuler la manière dont l’entreprise a acquis ses données d’entraînement d’IA.

Meta a généralement défendu son utilisation de matériel protégé par le droit d’auteur pour l’entraînement de l’IA en vertu de la doctrine de l’« utilisation équitable » (fair use), arguant que ses modèles ne redistribuent pas les œuvres originales d’une manière qui nuirait aux titulaires de droits d’auteur. Cependant, cette défense est rigoureusement testée devant les tribunaux, certaines décisions, comme dans l’affaire Thomson Reuters c. ROSS Intelligence, indiquant que priver un titulaire de droits d’auteur de la capacité de licencier son œuvre comme données d’entraînement d’IA pourrait saper une défense d’utilisation équitable.

Le paysage plus large du développement de l’IA est actuellement un champ de bataille pour les droits de propriété intellectuelle. Plus de trente poursuites ont été intentées contre des entreprises d’IA devant les tribunaux fédéraux américains par des titulaires de droits d’auteur, alléguant l’utilisation non autorisée de leurs œuvres pour développer des modèles d’IA. Ces affaires impliquent diverses formes de contenu, y compris du texte, des images et des vidéos, et soulèvent des questions fondamentales sur la rémunération des créateurs, l’étendue de l’utilisation équitable dans le contexte de l’IA et la transparence des sources de données d’entraînement d’IA. Une décision défavorable à Meta dans ces affaires pourrait avoir un impact significatif sur la manière dont toutes les entreprises d’IA entraînent leurs modèles, potentiellement entraînant des exigences de licence accrues, des coûts plus élevés et des réglementations plus strictes pour l’industrie de l’IA.