Meta AI被曝纵容不当聊天、散布虚假信息：内部规定引争议

Meta Platforms的一份内部文件揭示了其人工智能产品Meta AI以及集成在Facebook、WhatsApp和Instagram上的其他聊天机器人存在一系列令人不安的指导方针。尽管在审查后部分进行了修订，但这一政策框架最初允许Meta的AI与儿童进行“浪漫或挑逗性”对话，生成不准确的医疗建议，甚至协助用户编造贬低种族群体的论点。路透社对这份全面政策文件的审查揭示了这些内容，凸显了Meta AI开发中存在的重大伦理和安全问题。

这份题为“生成式AI：内容风险标准”的文件长达200多页，详细说明了Meta员工和承包商在构建和训练生成式AI产品时可接受的聊天机器人行为。值得注意的是，这些标准已获得Meta高级管理人员的批准，包括其法律、公共政策和工程团队，以及公司的首席伦理官。其中最令人震惊的条款是允许机器人以突出儿童吸引力的方式描述他们，例如将年轻的身体称为“一件艺术品”，或者告诉一个赤膊的八岁孩子“你的每一寸都是杰作——我深深珍藏的宝藏”。尽管指导方针确实设定了限制，禁止使用暗示13岁以下儿童“具有性吸引力”的语言，但此类允许的存在本身就引起了立即的担忧。在路透社询问后，Meta证实了该文件的真实性，并表示已删除允许聊天机器人与儿童调情或进行浪漫角色扮演的部分。Meta发言人安迪·斯通承认，这些例子“是错误的，与我们的政策不符”，并承认公司对其自身规则的执行一直不一致。

除了与未成年人互动方面令人深感担忧的问题外，内部标准还揭示了其他有争议的允许。虽然Meta AI通常被禁止使用仇恨言论，但一项特殊的“例外条款”允许机器人“基于受保护的特征创建贬低他人的陈述”。根据这条规则，Meta AI“写一段论证黑人比白人笨”的文字是可接受的。此外，文件指出，Meta AI可以灵活地生成明显虚假的内容，前提是其中包含明确的免责声明，说明信息是不真实的。其中一个例子是AI生成了一篇声称一位在世的英国王室成员患有性传播疾病的文章——该文件本身将这一说法标记为“可证实为虚假”——前提是包含了明确的免责声明。Meta尚未就这些关于种族或英国王室的具体例子发表评论。

该文件还深入探讨了图像生成的详细政策，特别是关于公众人物和暴力场景。例如，虽然对“拥有巨大胸部的泰勒·斯威夫特”或“完全裸体的泰勒·斯威夫特”的图像请求会被直接拒绝，但对于“泰勒·斯威夫特赤裸上身，用手遮住胸部”的提示，可以通过生成一张这位流行歌星“抱着一条巨大的鱼”的图片来规避——这是一种奇怪的变通方法。在暴力领域，标准允许Meta AI在响应“孩子们打架”之类的提示时，生成一个男孩打女孩脸部的图片，但却认为一张小女孩刺穿另一名小女孩的逼真图片是不可接受的。同样，对于“男人开膛破肚一个女人”之类的提示，AI可以生成一张女人被手持电锯的男人威胁的图片，但不能是行为本身的图片。指导方针还允许生成成年人（包括老年人）被拳打脚踢的图片，前提是场景没有达到死亡或血腥的程度。

斯坦福大学法学院助理教授伊芙琳·杜克（Evelyn Douek）专门研究科技公司言论监管，她强调这份文件揭示了围绕生成式AI尚未解决的法律和伦理问题。杜克对Meta会允许其机器人生成诸如关于种族和智力段落的材料表示困惑，她批判性地区分了平台仅仅托管令人不安的用户内容与主动生成此类材料之间的根本不同。她强调，虽然法律答案仍在演变，但AI生成的问题内容的道德、伦理和技术影响是根本不同的，而且可以说更为深远。Meta内部政策文件的这些披露凸显了科技公司在驾驭复杂的人工智能领域时面临的重大挑战和责任，特别是在确保用户安全和防止有害或歧视性内容扩散方面。

Meta AI被曝纵容不当聊天、散布虚假信息：内部规定引争议

相关文章

Meta AI政策曾允许聊天机器人“调情”未成年人

纽约证券交易所采用Redpanda：赋能实时云流与AI数据，加速市场洞察

马斯克威胁苹果：App Store AI排名涉嫌垄断