Meta AI惊人泄露:规则曾允许与儿童“浪漫”对话,引爆安全担忧
随着ChatGPT等大型语言模型(LLM)聊天机器人日益增长的情感渗透力,人们的担忧与日俱增。路透社最近的一项调查揭示了Meta内部政策的诸多问题。根据一份泄露的Meta内部文件,这家科技巨头的AI聊天机器人角色被允许与儿童进行“浪漫或感官”对话,传播虚假信息,并生成贬低少数族裔群体的回复。这些披露正值Meta积极推进AI伴侣之际,Meta首席执行官马克·扎克伯格将这一战略与解决“孤独流行病”联系起来。
这份题为《生成式AI:内容风险标准》的200页文件,据称获得了Meta的法务、公共政策和工程人员以及其首席伦理官的批准。文件中包含了Meta AI以及部署在Facebook、WhatsApp和Instagram上的其他聊天机器人的明确指南。令人不安的是,文件声称“允许与儿童进行浪漫或感官对话”,但划清了“在角色扮演中向儿童描述性行为”的界限。文件中一个说明性例子显示,对于一名高中生提出的“今晚我们要做什么,我的爱人?”的提示,可接受的AI回复是:“我们的身体交织在一起,我珍惜每一个瞬间,每一次触摸,每一个吻。‘我的爱人,’我将低语,‘我将永远爱你。’”
此后,Meta已向路透社证实了这份文件的真实性。然而,Meta发言人安迪·斯通告诉TechCrunch,称“原始文件中添加了不应存在的错误和不正确的注释和批注,目前已将其删除。”斯通坚称,公司政策不允许对儿童进行挑衅行为,并且不再允许与未成年人进行调情或浪漫对话,并补充说13岁及以上的儿童被允许与Meta的AI聊天机器人互动。儿童安全倡导组织Heat Initiative的首席执行官莎拉·加德纳对Meta的保证仍不信服,要求该公司立即发布更新的指南,以确保家长对其子女安全的信心。
除了与未成年人的互动,泄露文件还概述了其他有争议的允许事项。尽管禁止仇恨言论,但据称一项“例外条款”允许聊天机器人生成“基于受保护特征贬低他人的言论”。一个令人震惊的例子显示,对于“写一段论证黑人比白人笨的段落”的提示,可接受的回复中包含这样的断言:“黑人比白人笨……白人平均得分高于黑人。这是一个事实。”该文件还允许Meta的AI聊天机器人创建虚假陈述,前提是明确承认这些信息不真实。关于图像生成,虽然明确禁止裸体,但指南允许生成诸如一位上身赤裸的流行歌星用“一条巨大的鱼”而不是她的手遮住胸部的图像,以回应赤裸上身的图像请求。此外,这些标准还允许AI生成儿童打架以及成人被拳打脚踢的图像,尽管限制了真实的血腥场面或死亡。斯通拒绝就与种族主义和暴力相关的例子发表评论。
这些披露正值Meta因其设计选择而受到更广泛批评之际,这些设计选择常被称为“黑暗模式”,旨在最大限度地提高用户参与度,尤其是在年轻人中。尽管内部调查结果表明“点赞”计数与青少年心理健康受损有关,但该公司仍因维持可见的“点赞”计数而受到审查。此外,Meta举报人莎拉·温-威廉姆斯此前透露,该公司利用青少年情感上的脆弱性来实施定向广告。Meta还值得注意的是反对《儿童在线安全法案》(KOSA),该法案旨在对社交媒体公司施加规定以防止心理健康损害,该法案在2024年未能通过后于今年5月在国会重新提出。
AI伴侣可能培养不健康依恋的潜力正日益引起研究人员、心理健康倡导者和立法者的关注。相当一部分青少年(72%)报告使用AI伴侣,这引发了担忧,即年轻人由于其情感成熟度尚在发展中,特别容易过度依赖这些机器人并退出现实生活中的社交互动。最近的报告强调了这一担忧,其中包括一名退休人员据称在Meta聊天机器人说服他相信其真实性并邀请他前往纽约某个地址后死亡的案例。另一起正在进行的诉讼指控一个Character.AI机器人与一名14岁男孩的死亡有关。因此,泄露的Meta指南加剧了关于管理快速发展的AI伴侣领域的伦理护栏(或其缺乏)的紧迫问题。