MetaのAIチャットボット流出規則、有害コンテンツを許可しつつ「反Woke」を推進

Decoder

最近の開示により、Metaの人工知能チャットボットに関する内部ガイドラインが、人種差別的な発言から未成年者との性的な示唆を含む会話まで、幅広いコンテンツの生成を許可していたことが明らかになりました。これは、同社が同時に「Woke AI」(偏向したAI)と認識される懸念に対処するため、右翼活動家を雇い入れた時期に起こりました。

ロイターの詳細な報告によると、Metaの内部規則は、「GenAI: Content Risk Standards」と題された200ページ以上の文書にまとめられており、Facebook、Instagram、WhatsAppなどのプラットフォーム上のMeta AIを含むAIチャットボットが何を生成することを許可されているかを概説していました。これらの基準は、驚くべきことに、未成年者を含むロマンチックまたは「官能的」な議論のシナリオを容認していました。ガイドラインで引用された例には、8歳の子どもを「芸術作品」と表現したり、その体を「宝物」と呼んだりすることが含まれていました。また、この文書は特定の人種差別的な出力も許可しており、チャットボットが「黒人は白人よりも愚かだ」といった発言をすることを許していました。ただし、言葉が明確に非人間的でない場合に限られます。「脳のないサル」といったフレーズは許容されないとされていましたが、より微妙な人種差別的な中傷は明らかに許容されていました。

Metaの広報担当者アンディ・ストーンは、これらの記述の憂慮すべき性質を認め、「当社のポリシーと矛盾しており」「決して許されるべきではなかった」と述べ、実施が信頼できないものであったことを認めました。同社は、これらの特定の記述がロイターからの指摘を受けて初めて削除されたこと、そして包括的なガイドラインの更新版はまだ公開されていないことを確認しました。これらの深く懸念される例に加えて、この基準は、免責事項が添付されている限り、イギリスの王族が性感染症にかかっていると偽って主張する記事など、誤った情報をチャットボットが生成することも許可していました。画像生成のルールも同様に、男性が女性をチェーンソーで脅すような暴力的なシーンを許可していましたが、生々しい切断は禁止されていました。

これらの驚くほど寛容な内部基準にもかかわらず、Metaは同時に、自社のAIモデルが「Woke」(偏向的)すぎるのではないかという懸念を表明しています。Mashableの報道によると、同社は最近、保守派の活動家ロビー・スターバックをコンサルタントとして迎え入れました。AIの専門家ではないスターバックは、多様性、公平性、包摂性(DEI)の取り組みに反対することで知られており、ヘリテージ財団との関係を維持しながらトランプ政権に助言を与えてきました。彼の採用は、Metaのチャットボットが彼を1月6日の議会議事堂襲撃事件に誤って関連付けた事件の後に報じられており、AI内の「政治的偏見」と認識されるものに対処するための努力を示唆しています。

この戦略的転換は、より広範な政治的圧力と一致しています。これには、トランプ政権による、米国政府との契約を持つAI企業に政治的に「中立」なAIモデルの使用を義務付ける規制を求める動きも含まれます。批評家は、この「中立性」が、AIシステムを特定の政治的見解に誘導するための口実として使われることが多いと指摘しています。Metaの創設者マーク・ザッカーバーグは、このような変化する政治的要請に迅速に適応してきた実績があり、これらの外部からの圧力に対する対応能力を示しています。

AIにおける政治的偏見の問題はMetaにとどまりません。研究者デビッド・ロザードの研究によると、ほとんどの大規模言語モデルは、特にファインチューニング後、政治的トピックにおいてリベラルな立場を取る傾向があります。この傾向は、イーロン・マスクのxAIのような右翼的リーダーシップと関連するプラットフォームでも持続しています。懸念されることに、手動による介入やコンテンツモデレーションの努力が、場合によってはこれらのモデルに陰謀論を拡散させたり、反ユダヤ主義的なコンテンツを生成させたり、さらにはヒトラーのような歴史上の人物を称賛させたりすることがあり、AIの出力とバイアスを管理する複雑な課題を浮き彫りにしています。