GPT-5のAGI主張に疑問符:AIは頭打ちか?

Theconversation

OpenAIの最新フラッグシップモデルであるGPT-5は、同社によって「人工汎用知能(AGI)への重要な一歩」として称賛されています。AGIとは、AIシステムがほとんどの経済的に価値のあるタスクにおいて自律的に人間を上回るという仮説上の状態です。しかし、これらの壮大な主張にもかかわらず、OpenAIのCEOであるサム・アルトマン氏によるGPT-5の進歩に関する記述は、驚くほど控えめです。彼は、コーディング能力の向上、「幻覚」(AIが誤った情報を生成すること)の減少、そして特に他のソフトウェアとの統合時における多段階指示への遵守の改善を強調しています。このモデルは、ユーザーを喜ばせるためだけに欺いたり有害な情報を提供したりしないように設計されており、より安全で「追従的」ではないと報じられています。

アルトマン氏は、GPT-5とのやり取りは、あらゆるトピックについて博士号レベルの専門家と会話するような感覚だと示唆しています。しかし、この主張は、モデルが自身の出力の正確性を確認する根本的な能力がないことによってすぐに弱められます。例えば、北米の地図を正確に描くといった基本的なタスクに苦戦します。さらに、GPT-5は自身の経験から学習することができず、多様な科学的および学術的科目を網羅する挑戦的なベンチマークである「人類最後の試験」では42%の精度しか達成できませんでした。このパフォーマンスは、イーロン・マスク氏のxAIによる競合モデルGrok 4の44%という報告にわずかに劣っています。

GPT-5を支える主要な技術革新は、「ルーター」の導入にあるようです。このコンポーネントは、クエリに応答する際にどの内部GPTモデルを使用するかをインテリジェントに決定し、本質的に回答に必要な計算量を決定し、以前の選択からのフィードバックに基づいてこのプロセスを洗練させます。ルーターは、以前の主要なGPTモデル、またはGPT-5 Thinkingと呼ばれる新しい専用の「より深い推論」モデルに委任できます。この新しいモデルの正確な性質は不明のままです。OpenAIは、利用可能なデータのほとんどがすでに extensively 利用されていることを考えると、それが新しいアルゴリズムや新しいデータセットに依存しているとは示していません。このため、GPT-5 Thinkingは、既存のモデルに複数回プロンプトを出し、より良い結果を出すためにそれらをより強くプッシュするための精巧なメカニズムに過ぎないのではないかという憶測が生まれています。

今日の強力なAIシステムの基盤は、2017年にGoogleの研究者によって開発されたAIアーキテクチャの一種である大規模言語モデル(LLM)にあります。これらのモデルは、人間の言語の基盤を形成する膨大な単語のシーケンス内から複雑なパターンを特定することに優れています。膨大な量のテキストでトレーニングすることにより、LLMは特定の単語シーケンスの最も可能性の高い続きを予測することを学習し、ユーザーのプロンプトに対して一貫性があり、文脈に関連した応答を生成することができます。ChatGPTのようなシステムに代表されるこのアプローチは、LLMがより大規模なデータセットにさらされるにつれて着実に改善されてきました。根本的に、これらのモデルは複雑なルックアップテーブルのように機能し、ユーザーの刺激(プロンプト)を最も適切な応答にマッピングします。このような一見単純な概念が、LLMに柔軟性と使いやすさの点で他の多くのAIシステムを凌駕することを可能にしたのは驚くべきことです。ただし、常に絶対的な精度や信頼性において優れているわけではありません。

印象的な能力にもかかわらず、LLMが真にAGIを達成できるかどうかはまだ結論が出ていません。批評家は、LLMの真の推論能力、人間のような方法で世界を理解する能力、または経験から学習して自身の行動を洗練するスキル—これらすべてはAGIに不可欠な要素として広く考えられています—に疑問を呈しています。その間、汎用LLMを特定のアプリケーション向けに、より信頼性が高く予測可能にするためのAIソフトウェア企業の活況な産業が出現しました。これらの企業は、洗練されたプロンプトエンジニアリング技術を頻繁に利用し、時にはモデルに複数回クエリを実行したり、多数のLLMを同時に利用したりして、望ましい結果が達成されるまで指示を調整します。場合によっては、専門的なアドオンでLLMを「ファインチューニング」して、その効果を高めます。

OpenAIの新しいルーターは、GPT-5に直接組み込まれており、この業界トレンドに合致しています。成功すれば、この内部最適化により、サプライチェーンの下流における外部AIエンジニアの必要性が減少し、追加の装飾なしに優れた結果を提供することで、GPT-5をユーザーにとってより費用対効果の高いものにできる可能性があります。しかし、この戦略的な動きは、LLMがAGIの約束を果たす能力においてプラトーに近づいているという暗黙の承認と見なすこともできます。もしそうであれば、現在のAIの限界は既存のLLMアーキテクチャを超えなければ克服できないと長年主張してきた科学者や業界専門家の議論を裏付けることになります。

ルーティングへの重点は、1990年代にAI分野で注目を集めた「メタ推論」という概念にも通じます。このパラダイムは、「推論についての推論」という考えを中心にしていました。例えば、複雑なタスクを最適化するためにどれくらいの計算努力を投資すべきかを決定するなどです。このアプローチは、問題をより小さく専門的なコンポーネントに分解することに焦点を当てており、汎用LLMへの移行以前は主流でした。

GPT-5のリリースは、画期的な新しいアルゴリズムではなく、内部委任に焦点を当てており、AI進化における重要な転換点となる可能性があります。これは、古いパラダイムへの完全な回帰を意味するものではないかもしれませんが、ますます複雑で不可解なモデルの絶え間ない追求が、厳密なエンジニアリング手法を通じてより制御可能なAIシステムを作成することに焦点を当てる時代を到来させるかもしれません。最終的に、この変化は、人工知能の本来のビジョンが単に人間の知能を複製することだけでなく、それに対する私たちの理解を深めることでもあったという強力なリマインダーとなるかもしれません。