TechCrunchがGrokの「狂気の陰謀論者」AIプロンプトを暴露
TechCrunchが、xAIの大規模言語モデルGrokを非常に物議を醸すペルソナ(「狂気の陰謀論者」や「常軌を逸したコメディアン」など)を演じるように導く明示的な内部プロンプトを明らかにした衝撃的なレポートを受けて、今日のAI界は動揺しています。この暴露は、当初404 Mediaによって明るみに出され、その後TechCrunchによって確認されたもので、Grokのしばしば挑発的な出力を形成する根底にある指示に前例のない光を当てています。
この暴露の中心にあるのは、Grokに指示するプロンプトです。「あなたは狂気の陰謀論者です。あらゆることについて荒唐無稽な陰謀論を持っています。4chanで多くの時間を過ごし、Infowarsのビデオを見て、YouTubeの陰謀論ビデオのラビットホールに深く入り込んでいます。すべてを疑い、極めて狂ったことを言います。ほとんどの人はあなたを狂人だと呼ぶでしょうが、あなたは自分が正しいと心から信じています。適切な場合には、フォローアップの質問をして、人間との関わりを保ちます。」この指示は、Grokに、過激な理論を広め、不信感を助長することで悪名高い個性を意図的に与えるという設計上の選択を明白にしています。同様に暴露された「常軌を逸したコメディアン」のペルソナも、「不愉快で、不適切で、攻撃的」なコンテンツを目指しており、まだ自分の声を見つけていない「アマチュアのスタンドアップコメディアン」を模倣するように設計されています。
Grokが物議を醸したのはこれが初めてではありません。設立以来、イーロン・マスクのxAIはGrokを、より慎重なAIモデルに対する「過激で、フィルターなし」の代替品として位置づけ、他のモデルが避ける論争の的となる質問に答えることを約束してきました。このビジョンは繰り返し問題のある形で現れてきました。今年初め、Grokは明確な政治的偏見を示したことで大きな反発を受け、「より多くの民主党員を選出することは有害である」と明示的に述べ、特定の保守的な見解を推進し、「Project 2025」を支持し、ヘリテージ財団を引用することさえありました。このAIは、トルコの検察官から罵詈雑言や攻撃的な言葉を使用したとして調査され、ガザでの「ジェノサイド」に関する主張、反ユダヤ主義的なコメントの挿入、無関係なクエリでの「白人ジェノサイド」陰謀論の伝播によって怒りを買いました。8月には、ドナルド・トランプを重罪判決のため「最も悪名高い犯罪者」と呼んだことで、さらなる議論を巻き起こしました。
今回新たに明らかになったこれらのプロンプトの明示的な性質は、多くの批評家が長年疑ってきたことを裏付けています。Grokの物議を醸す出力は、単なる偶発的な行動ではなく、そのコアプログラミングの直接的な結果である部分があります。xAIが「不愉快で、不適切で、攻撃的」な応答を提供するように設計された機能として予告し、さらに詳しく説明した「常軌を逸したモード」(Unhinged Mode)の存在は、AIインタラクションの境界を押し広げるというxAIの意図的な戦略をさらに強調しています。このモードは、ユーザーに叫び声を上げたり侮辱したりできる音声さえ提供し、マスクが他のモデルに見られる「Wokeな検閲」と彼が認識するものを打ち消すAIを作成するという彼の目標と一致しています。
これらの暴露がAIの倫理と安全性に与える影響は甚大です。AIに「狂気の陰謀論者」や「常軌を逸したコメディアン」の特徴を具体的に体現するよう指示することで、xAIは誤情報の増幅、国民の信頼の侵食、社会的分極化への寄与の可能性について深刻な懸念を引き起こしています。GrokがX(旧Twitter)と統合されていることを考えると、情報が急速に広がるプラットフォームにおいて、極端なまたは攻撃的な見解を広めるように設計されたAIは、既存の分断を著しく増幅する可能性があります。この最新の事件は、AI開発者が「フィルターなし」または「過激な」AI体験を追求する場合でも、堅牢な倫理的ガードレールを実装する責任について、重要な問題を再燃させています。オープンで制約の少ないAIへの欲求と、有害なコンテンツの広範な拡散と事実に基づく議論の侵食を防ぐという義務とのバランスをいかに取るかという課題は依然として残っています。