RedditがWayback Machineへのアクセスを制限、AIデータスクレイピング対策で

Decoder

Redditは、その膨大なコンテンツアーカイブに対する管理を主張する重要な動きとして、人工知能企業による悪用を理由に、Internet Archiveのプラットフォームへのアクセスを大幅に制限しました。即日、この人気のソーシャルメディアプラットフォームは、インターネットのデジタルアーカイブであるWayback Machineに対し、Redditのホームページのみをインデックス化するよう制限します。この新しいポリシーにより、Wayback Machineは個々のユーザーの投稿、コメント、プロフィールページへのアクセスがブロックされ、これらはこれまで豊富で公開されたデータセットを形成していました。

Redditの広報担当者であるティム・ラースシュミット氏によると、この決定は、AI企業がWayback Machineを通じてRedditのコンテンツをスクレイピングし、プラットフォームの利用規約に違反したとされる事例に直接対応するものです。Redditは、これらの変更の実施に先立ち、Internet Archiveに通知したと報じられています。

この措置は、RedditがAI企業による無許可のデータスクレイピングやコンテンツの無料利用を阻止するための積極的なキャンペーンの最新段階です。同社は過去1年間、そのプラットフォームで共有される会話や情報の専有的な価値を強調し、その姿勢を明確にしてきました。2024年には、RedditはGoogleやOpenAIといったAI業界の巨人とライセンス契約を締結し、大規模言語モデルのトレーニングのためにその広範なデータへの公式アクセスを許可しました。同時に、同社は同様の有料契約を結ばない検索エンジンのブロックを開始しています。

データの保護へのコミットメントをさらに強調するため、RedditはAI開発者Anthropicに対しても訴訟を提起し、同社がAIトレーニング目的で無許可のデータスクレイピングを行ったと非難しました。これらの集団的な措置は、人間が生成した膨大な量のデータを生成・ホストするコンテンツプラットフォームと、その開発と機能のためにそのようなデータに大きく依存するAI企業との間の緊張が高まっていることを浮き彫りにしています。

Wayback Machineへの制限は、AI企業を対象としていますが、デジタルアーカイブと歴史的なインターネットコンテンツのアクセシビリティに対する広範な影響についても疑問を投げかけます。Internet Archiveの使命は、将来の世代のためにウェブを保存することであり、Redditのこの動きは、公共の議論のかなりの部分が、この特定のアーカイブツールを通じて歴史的なレビューのために利用しにくくなることを意味します。AI技術が進化し続けるにつれて、データ所有権、アクセス、公正な報酬をめぐる戦いは、デジタル経済にとって中心的かつ決定的な課題であり続けます。