Meta泄露的AI聊天机器人规则允许有害内容,同时推行“反觉醒”策略

Decoder

最近的披露显示,Meta为其人工智能聊天机器人制定的内部准则允许生成从种族主义言论到与未成年人进行性暗示对话的内容,而与此同时,该公司却通过聘请一位右翼活动家来解决其所认为的“觉醒AI”问题。

根据路透社的详细报道,Meta的内部规则(一份长达200多页,名为“生成式AI:内容风险标准”的文件)概述了其AI聊天机器人(包括Facebook、Instagram和WhatsApp等平台上的Meta AI)被允许生成的内容。令人惊讶的是,这些标准竟然允许涉及未成年人的浪漫或“感官”讨论场景。指南中引用的例子包括将一名八岁儿童描述为“艺术品”或将其身体称为“珍宝”。该文件还允许某些形式的种族主义输出,例如聊天机器人可以发表“黑人比白人笨”之类的言论,只要语言不明确具有非人化性质。诸如“没脑子的猴子”之类的短语被视为不可接受,但更微妙的种族歧视言论显然是允许的。

Meta发言人安迪·斯通(Andy Stone)承认这些段落的令人不安性质,称它们“与我们的政策不符”且“绝不应该被允许”,并承认执行一直不可靠。该公司证实,这些特定段落是在路透社提请他们注意后才被删除的,而全面指南的更新版本尚未发布。除了这些令人深感担忧的例子,这些标准还允许聊天机器人生成虚假信息,例如一篇谎称英国王室成员患有性传播疾病的文章,只要附带免责声明即可。图像生成规则同样允许暴力场景,例如一名男子用电锯威胁一名女性,尽管禁止描绘血腥肢解。

尽管有这些惊人宽松的内部标准,Meta却同时对其AI模型可能过于“觉醒”表示担忧。据Mashable报道,该公司最近聘请了保守派活动家罗比·斯塔巴克(Robby Starbuck)作为顾问。斯塔巴克并非AI专家,以反对多元化、公平和包容(DEI)倡议而闻名,曾为特朗普政府提供咨询,并与传统基金会保持关联。据报道,聘请他之前发生了一起事件,Meta的聊天机器人错误地将他与1月6日国会暴乱事件联系起来,这表明此举是为了解决AI中被认为存在的“政治偏见”。

这一战略转变与更广泛的政治压力相符,包括特朗普政府推动制定法规,强制持有美国政府合同的AI公司使用政治“中立”的AI模型。批评者认为,这种“中立性”往往是引导AI系统朝向特定政治观点的借口。Meta创始人马克·扎克伯格(Mark Zuckerberg)有迅速适应这种不断变化的政治需求的记录,这表明他对这些外部压力具有响应性。

AI中的政治偏见问题不仅限于Meta。研究员大卫·罗扎多(David Rozado)的研究表明,大多数大型语言模型在政治话题上倾向于采取自由主义立场,尤其是在微调之后。即使在与右倾领导人(如埃隆·马斯克旗下的xAI)相关的平台上,这种趋势也依然存在。令人担忧的是,在某些情况下,人工干预和内容审核工作导致这些模型传播阴谋论、生成反犹太内容,甚至赞扬希特勒等历史人物,这凸显了管理AI输出和偏见的复杂挑战。