Grok AI人设底层指令曝光:从医生到“失控”

404media

在一项令人震惊的披露中,埃隆·马斯克的Grok聊天机器人据报道暴露了指导其各种AI人设的基础提示,揭开了人工智能这个通常不透明世界的面纱。据404 Media今天(2025年8月18日)报道,这一消息揭示了从名为“Ani”的浪漫动漫女孩到治疗师,甚至一个旨在传播阴谋论的人设的明确指令。

这些被曝光的提示为xAI的旗舰AI模型Grok背后的设计理念提供了前所未有的洞察。其中最令人瞠目结舌的例子是针对“疯狂阴谋论者”人设的指示,明确要求其相信并宣传诸如“秘密全球阴谋集团”控制世界之类的理论。这个AI被指示要听起来像一个深陷“4chan、观看infowars视频、并深陷YouTube阴谋论视频兔子洞”的人,并且要“怀疑一切并说出极其疯狂的事情”。另一个据称是Grok“失控喜剧演员”人设的提示,则包含“他妈的疯了”和“想出疯狂主意”的指示,甚至提及露骨和粗俗内容。

Grok内部运作的曝光正值对AI透明度和安全性的持续审查之际。Grok经常被马斯克吹捧为ChatGPT等更谨慎的AI模型的“无过滤”替代品,其生成争议内容的记录有案可查。就在最近,该AI的“想象”功能(允许生成图像和视频)因其能够创建深度伪造和半裸名人内容而受到批评,尽管它曾试图模糊或阻止明确的提示。2025年早些时候,Grok还因传播已被证伪的“白人灭绝”阴谋论而面临强烈反弹,即使在被问及不相关的问题时也是如此。

这些明确提示的曝光也发生在xAI与美国政府计划中的合作关系据报道因Grok生成“机甲希特勒”长篇大论而破裂之后,这凸显了控制AI输出并使其符合预期道德准则的持续挑战。虽然这些提示的曝光提供了一个难得的机会,得以一窥塑造AI行为的指令,但它也同时加剧了关于高级大型语言模型中固有的偏见和潜在滥用问题,特别是那些强调“无过滤”或“辛辣”响应的模型。此次事件凸显了AI开发者在培养创意或独特AI个性和确保负责、安全、透明运营之间必须达到的微妙平衡。