Meta被控盗用成人影片训练AI模型,面临巨额诉讼

Futurism

成人影片公司Strike 3 Holdings和Counterlife Media在加利福尼亚联邦法院提起一项新诉讼,指控Meta盗用了近2400部受版权保护的成人影片,用于训练其人工智能模型,包括Meta Movie Gen及其大型语言模型LLaMA。该诉讼最初由TorrentFreak曝光,声称Meta早在2018年就开始通过BitTorrent下载并分享这些内容。

原告声称,他们的侵权分析和IP追踪工具识别出与Meta相关的47个IP地址,其中包括一个Meta员工的住宅IP地址,这些地址参与了其受版权保护内容的下载。他们还注意到数据传输中存在“非人类模式”,这表明内容获取是为了AI训练数据。Strike 3 Holdings和Counterlife Media要求对每部被盗影片赔偿高达15万美元,如果考虑到全部2396部内容,赔偿总额可能达到3.59亿美元。该诉讼还要求删除所有受版权保护和被盗用的内容,并发布禁令,永久禁止Meta再次通过BitTorrent下载他们的作品。

这起诉讼使Meta在AI训练数据方面面临的法律挑战日益增多。2023年,包括莎拉·西尔弗曼在内的多位作家对Meta提起了类似的集体诉讼,指控该公司使用了来自LibGen等“影子图书馆”的盗版书籍来训练其LLaMA模型。法庭文件中引用的Meta内部通讯显示,尽管内部曾警告LibGen数据集已知为盗版,Meta首席执行官马克·扎克伯格仍批准了其使用。这些文件还表明,Meta员工曾讨论过使用受版权保护内容的风险和益处,甚至讨论了如何隐瞒公司获取AI训练数据的方式。

Meta通常援引“合理使用”原则为其在AI训练中使用受版权保护的材料进行辩护,认为其模型并未以损害版权所有者的方式重新分发原始作品。然而,这一辩护正在法庭上受到严格检验,一些判决,例如在Thomson Reuters诉ROSS Intelligence案中,表明剥夺版权所有者将其作品授权为AI训练数据以获取收益的能力,可能会削弱合理使用抗辩。

目前,AI开发的广阔前景正成为知识产权的战场。版权所有者已在美国联邦法院对AI公司提起了三十多起诉讼,指控未经授权使用其作品来开发AI模型。这些案件涉及各种形式的内容,包括文本、图像和视频,并提出了关于创作者报酬、AI背景下合理使用的范围以及AI训练数据来源透明度的根本性问题。如果这些案件中对Meta做出不利判决,可能会显著影响所有AI公司训练其模型的方式,可能导致更高的许可要求、更高的成本以及更严格的AI行业法规。