OpenAI、GPT-5ライブ配信での「グラフの誤り」を修正

Businessinsider

2025年8月7日木曜日に開催されたOpenAIの待望のGPT-5ライブ配信は、同社の人工知能における最新の進歩を披露することを目的としていましたが、視聴者が提示されたいくつかのグラフに明白な不正確さがあることに気づき、すぐに精査の対象となりました。CEOのサム・アルトマンがすぐに「大規模なグラフの失敗」と呼び、OpenAIのチームメンバーが「意図しないグラフの罪」と表現したこの出来事は、ソーシャルメディアや技術コミュニティ内で即座に議論を巻き起こしました。

最も顕著なエラーの1つは、GPT-5の「コーディング欺瞞」率とOpenAIのo3モデルのそれを比較するグラフに現れました。データはGPT-5の欺瞞率が50%であり、o3の47.4%よりもわずかに悪いことを示していました。しかし、視覚的な表現ではGPT-5が不釣り合いに小さな棒グラフで描かれ、誤解を招くような優れたパフォーマンスを示唆していました。OpenAIは後にブログ投稿でこれを修正し、GPT-5の実際の欺瞞率を大幅に低い16.5%に修正しました。もう1つの問題のあるグラフは、GPT-5、o3、およびGPT-4oを異なる性能指標で比較していました。GPT-5が74.9、o3が69.1、GPT-4oが30.8というスコアであったにもかかわらず、o3とGPT-4oのグラフの棒の長さは、かなりの数値差があるにもかかわらず、ほぼ同じに見え、モデル間の真の区別を効果的に軽視していました。視覚的な誤解のさらなる例は、GPT-5の52.8%の精度(「思考」モードが有効な場合)がo3の69.1%よりも視覚的に高く表示され、o3の69.1%がGPT-4oの30.8%と同じレベルで描かれている精度グラフで観察されました。

X(旧Twitter)のようなプラットフォームのユーザーが矛盾点を指摘するなど、迅速な世間の反応がOpenAIのリーダーシップからの迅速な対応を促しました。サム・アルトマンは公に誤りを認め、「うわー、私たちの大規模なグラフの失敗だ」と述べました。同時に、OpenAIのマーケティング担当者がオンラインで謝罪を発表し、「意図しないグラフの罪」を認め、修正されたグラフのバージョンが会社の公式ブログに迅速にアップロードされたことを確認しました。

今年の最も期待されたAIローンチの1つで発生したこの事件は、テクノロジー企業にとってデータ整合性と透明性のあるコミュニケーションの極めて重要な重要性を強調しています。これは、人工知能のような変革的な技術の最前線で事業を展開する企業にとって、たとえわずかな視覚的な誤解であっても、信頼を損ない、懐疑論を生み出す可能性があることを浮き彫りにしています。OpenAIによる迅速な承認と修正は、説明責任の意識を示していますが、このエピソードは、特に高額な製品デモンストレーションが関与する場合の、内部品質管理とプレゼンテーション資料の厳格な審査に関するより広範な問題を提起しています。一部の傍観者は、OpenAIが欠陥のあるビジュアルを生成するために自社のAIモデルを使用した可能性さえ推測しましたが、同社はこの見解については言及していません。

グラフの論争にもかかわらず、GPT-5のローンチ自体はOpenAIにとって重要なマイルストーンとなりました。このモデルは、同社史上最も強力であると宣伝されており、精度、速度、推論能力の大幅な改善を約束しています。GPT-5は、与えられたプロンプトに最適なモデルを自動的に選択するように設計された統合システムを導入し、より役立つ透明な応答のためのより優れた「安全な完了」を誇り、強化された論理と自己評価を示し、報告されている幻覚の減少につながっています。これは、無料、Plus、Pro、Teamユーザーを含むすべてのユーザー層に展開されており、コーディングから健康関連のガイダンスまで、さまざまなアプリケーションでAI体験をよりスマート、より安全、よりパーソナルにすることを目的としています。

「グラフの罪」はGPT-5の発表中に予期せぬ回り道となりましたが、OpenAIによる迅速な誤りの認識と修正は、ある程度の透明性をもたらしました。この事件は、業界のリーダーでさえ、特に画期的な技術を世界中の聴衆に紹介する際には、視覚が基礎となる数字を正確に反映するように、データ提示の最高水準を維持しなければならないという厳しい警告となります。