GPT-5の低性能:OpenAIのコスト削減戦略か?

Futurism

OpenAIが満を持して発表したGPT-5モデルの先週のローンチは、AIの巨人にとって予想外に波乱に満ちた期間となりました。内部指標では控えめな性能向上が報告されたものの、ユーザー体験は広範にわたって失望を招き、熱心なコミュニティから大きな反発を受けました。一般的な不満は、回答の簡潔さ、記述品質の顕著な低下、そしてユーザーが慣れ親しんでいた個性の欠如に集中していました。さらに驚くべきことに、その「博士号レベル」の知能が謳われているにもかかわらず、モデルは「blueberry」という単語に「B」が3つ含まれていると誤って述べるなど、初歩的な間違いを犯すのが観察されました。

ユーザーの不満は非常に深く、多くの人が以前のモデルであるGPT-4oの復活を要求しました。OpenAIはGPT-5の登場時にGPT-4oを大胆に削除していました。事態は一変し、同社はこれらの要求に迅速に応じ、古くより人気のあるバージョンのアクセスを復元しました。この即座の撤回は、CEOサム・アルトマンが以前に述べた「GPT-5がAGI(汎用人工知能)への道における重要な一歩である」という発言に影を落としました。

GPT-5の期待外れの評価を説明する興味深い理論が浮上しています。それは、AI能力における画期的な飛躍というよりも、運用コストを最適化するための戦略的な動きである可能性が高いというものです。The Registerなどの出版物で探求されたこの見解は、急成長するAI業界における莫大な財政的圧力を浮き彫りにしています。OpenAIのような企業は、比較的小規模な収益しか生み出さない一方で、計算リソースに数十億ドルを費やしています。この変化は、OpenAIが支出を抑制し、今世紀末までに収益性を達成する見込みを改善するための努力である可能性があります。予想される評価額が約5,000億ドルであることを考えると、これは困難な課題です。

この理論に重みを与えるのは、GPT-5の基盤となるアーキテクチャに関する暴露です。GPT-5は単一のモノリシックモデルではなく、報告によるとダイナミックなデュオです。基本的な要求に対応する軽量モデルと、複雑な推論タスクに対応するより堅牢でリソースを大量に消費するモデルです。別の「ルーター」モデルが、各ユーザーのプロンプトを2つのうち最も適切な方にインテリジェントに誘導する役割を担っています。アルトマンによると、このルーターモデルはローンチ日に誤動作し、GPT-5が「予想よりもはるかに愚か」であるという認識に貢献しました。ルーターはその後、改善されたと称される状態でオンラインに戻されましたが、最初の混乱はユーザーの不満を増幅させるばかりでした。特に、彼らの選択肢が制限されていると感じられたためです。

この「オートスイッチャー」の導入は、有料購読者が好みのモデルを手動で選択できたOpenAIの以前のアプローチからの顕著な逸脱を示しています。複数の大規模言語モデルを同時にオンラインで維持することは費用のかかる取り組みであり、OpenAIが緊縮財政の時期を迎えているという考えを裏付けています。コスト削減策のさらなる証拠として、無料ユーザーのメッセージ数が1時間あたりわずか10メッセージに厳しく制限されています。さらに、モデルの「コンテキストウィンドウ」、つまり進行中の会話のための短期記憶は、Plusユーザーで32,000トークン、Proユーザーで128,000トークンと、変更されていません。多くの購読者、特に月額20ドルの手頃なPlusティア(Proは月額200ドル)のユーザーは、この重要な領域のアップグレードを一貫して求めてきました。

GPT-5が主にコスト削減策であるという感情は、ユーザーコミュニティ内で広く共感を呼んでいます。たとえば、r/ChatGPTサブレディットのトップ投稿では、GPT-5が「明らかにコスト削減策である」と明言し、次のように詳述しています。「彼らは高価で有能なモデルをすべて削除し、コスト最適化をデフォルトとする自動ルーターに置き換えたのです…改善というよりは、コスト削減のように感じられます。」

地味ではありますが、このようなコスト削減策はOpenAIにとって戦略的に健全です。同社は前例のない競争と、実現可能な収益性への道を示すことで、その巨額の評価額を正当化するという強い圧力に直面しています。しかし、財政的安定を追求する中で、OpenAIは、ユーザーが古い、おそらく「効率的」ではないモデルのニュアンスや癖に対して抱いていた深い愛着を過小評価していたようです。この予想外のユーザーロイヤルティは、AIのパイオニアがイノベーションと収益のバランスを取りながら乗り越えなければならない、新たな複雑な課題を提示しています。