アルトマン氏、GPT-5の「不安定な」展開、4oの復活、そして「グラフの犯罪」について語る

Techcrunch

金曜日、OpenAIのCEOサム・アルトマン氏は、GPT-5開発チームの主要メンバーと共に、Redditの「Ask Me Anything」(AMA)セッションに参加し、新モデルの最近のリリース後に寄せられた様々な懸念に対応しました。議論は主に、GPT-5の認識された性能、前身であるGPT-4oの復活を求める広範な要望、そして「グラフの犯罪」と称された注目すべきプレゼンテーションでの失態に集中しました。

多くのユーザーは、GPT-5がGPT-4oよりも「愚か」または能力が低いように見えると不満を表明しました。アルトマン氏はこれらの苦情を認め、問題はGPT-5の新しいリアルタイムルーターの誤動作に起因すると説明しました。この革新的な機能は、与えられたクエリに対して最も適切な基盤モデルを動的に選択するように設計されており、迅速な応答を提供するか、複雑な回答を「考える」ためにより多くの時間をかけるかのいずれかです。しかし、リリース日である木曜日に、この重要なルーティングシステムが深刻なサービス停止を経験し、ユーザーが観察した性能低下につながりました。

アルトマン氏は、すでに修正が施されていることをコミュニティに保証しました。「GPT-5は本日より賢く見えるようになるでしょう」と彼は書き、自動切り替え機能の誤動作が解決されたことを確認しました。彼はさらに、モデル選択を管理するロジックを改良し、ユーザーが常に最適なモデルに誘導されるように努めると約束しました。加えて、OpenAIは透明性を高め、どのモデルがユーザーのクエリに応答しているかをより明確にする予定です。 persistentな要望に応え、アルトマン氏はOpenAIがPlusサブスクライバーがGPT-4oに戻る可能性を検討していることも示唆し、「トレードオフに関するより多くのデータを収集しようとしています」と述べました。移行をさらに円滑にし、新モデルの探索を促すため、OpenAIは展開が完了する際にPlusユーザーのレート制限を2倍にし、彼らが作成できるプロンプトの数を実質的に拡大します。

性能に関する懸念を超えて、アルトマン氏は必然的に「グラフの犯罪」について質問されました。これは、GPT-5のライブデモンストレーション中に提示された、広く嘲笑され、非常に不正確なグラフのことです。ベンチマークスコアを示すことを意図したこのグラフは、低いスコアを著しく高い棒グラフで誤解を招くように描写しており、即座に批判を浴び、無数のオンラインジョークの対象となりました。アルトマン氏はこのAMA中にグラフに直接言及しませんでしたが、以前X(旧Twitter)でこれを「メガグラフの失敗」と認めていました。その後、公式ブログ投稿で公開されたグラフは修正されたことが指摘されました。しかし、この事件は、企業プレゼンテーションにAIを使用することについてのユーモラスなコメントの波を煽り、あるレビュアーは、GPT-5がデータを正確にテーブルに変換できなかったことを、現在の限界の一例として強調しました。

アルトマン氏はAMAを締めくくるにあたり、ユーザーエクスペリエンスの向上に対するOpenAIのコミットメントを再確認しました。彼はシステムの安定化に向けた継続的な努力を約束し、コミュニティのフィードバックに耳を傾けるという会社の献身を強調しました。