OpenAI、著作権訴訟でNYTのChatGPTログ1.2億件要求を拒否
OpenAIは、ニューヨーク・タイムズとの間で、数百万件のChatGPTユーザー会話へのアクセスをめぐる激しい争いを伴う、重大な法的紛争に巻き込まれています。最新の意見の相違の中心にあるのは、AI大手に対する進行中の著作権訴訟の一環として、新聞社が前例のない1億2千万件のチャットログを検索するよう要求していることです。しかし、OpenAIはこれに反発し、代わりに2千万件という大幅に少ないログのサブセットを提案しています。
タイムズ紙は、自社の記事に関わる潜在的な著作権侵害を発掘し、そのようなインシデントが23ヶ月間にわたってどのように進化したかを綿密に文書化するために、この広範なデータを求めています。一方、OpenAIは、新聞社の広範な要求に応じることは、重大な技術的およびプライバシー上のリスクをもたらすと警告しています。同社は、これらのチャットログのほとんどは非構造化されており、それぞれ5,000語を超えることが多く、住所やパスワードを含む非常に機密性の高い個人情報が頻繁に含まれていると説明しています。
データが共有される前に、これらのログは機密情報を削除するために細心の注意を払った手動によるレビューと編集が必要になります。OpenAIは、提案した2千万件のログを準備するだけでも約12週間かかると見積もっており、完全な1億2千万件を処理するには約36週間かかるとのことです。同社は、この労働集約的なプロセスは、オフラインシステムからデータを引き出す必要があるため、かなりの人員と技術リソースを必要とすると述べています。OpenAIはまた、タイムズ紙の要求が示唆するように、削除されたチャットを長期間保持することは、データ漏洩に対する新たな脆弱性を生み出す可能性があると強調しています。
タイムズ紙はOpenAIの提案した制限を断固として拒否し、より小さなサンプルでは体系的な著作権侵害や長期的な傾向を証明するには不十分であると主張し、訴訟を構築するために包括的なアクセスを求めています。これに対し、OpenAIは、2千万件のログサンプルの統計的妥当性を支持するコンピューター科学者テイラー・バーグ・カークパトリック氏の意見を引用しています。AI企業は、これを超えて検索を拡大することは不均衡であり、訴訟手続きを不必要に長引かせると主張しています。
現在のこの意見の相違は、2025年6月に発行された重要な裁判所命令を背景に展開されています。この命令は、ユーザーが削除した会話を含むすべてのChatGPT会話をOpenAIが保存することを義務付けました。この指示は、タイムズ紙や他の出版社がOpenAIが自動削除プロセスを通じて証拠を破壊していると非難した後に続きました。
OpenAIはこの命令を強く批判し、数億人のユーザーのプライバシーに対する重大な侵害であると述べました。同社は法廷で、多くのチャットには、財務データから結婚式の計画のような個人的な事柄まで、「深く個人的な」情報が含まれていると主張しました。さらに、機密性の高い企業データを処理するためにOpenAIのAPIを利用しているビジネス顧客も影響を受けます。OpenAIは、この命令が自社のプライバシーポリシーに違反することを強制し、ユーザーの信頼を根本的に損なうと主張しています。
裁判官は、削除によって証拠が失われる可能性があると信じる理由を見つけ、予防措置として包括的なデータ保存を命じましたが、OpenAIは意図的な証拠破壊の申し立てを否定しています。同社は、侵害コンテンツが意図的に削除されたという証拠はないと主張し、自動的であろうと手動であろうと、ユーザーが法的なリスクを隠すためにチャットを一括削除するという考えを憶測として一蹴しています。
裁判所の決定のニュースはソーシャルメディアプラットフォームに急速に広がり、ユーザーの間で広範な懸念を引き起こしました。LinkedInやX(旧Twitter)の専門家は、新たなセキュリティリスクについて警告を発し、ChatGPTと機密データを共有しないよう助言しました。一部の企業は、この命令をOpenAIによる潜在的な契約違反と解釈し、機密データがより長く保存され、第三者に公開される可能性があることを懸念しました。