OpenAIがGPT-5を発表:AGIへの探求は強化された推論能力と共に続く

Spectrum

OpenAIは、同社のリーダーたちが汎用人工知能(AGI)の追求における画期的な飛躍と表現するGPT-5を正式に発表しました。この大規模言語モデル(LLM)の最新版は、ChatGPTインターフェースを通じてすべてのユーザーが利用できるようになり、前例のない推論能力、強化された「雰囲気コーディング」(vibe coding)、エージェントAIタスクにおける優れたパフォーマンス、そして一連の新しい安全機能が約束されています。

OpenAIのCEOであるサム・アルトマンによると、GPT-5は大幅なアップグレードであり、そのインタラクションは、あらゆる主題について博士号レベルの専門家と会話しているかのようだと述べられています。ChatGPTの責任者であるニック・ターリーは、このモデルのより自然で「人間らしい」感覚が最も注目すべき特性であると強調しました。GPT-5のリリースは、GPT-4、GPT-4o、そして「推論」モデルのo1とo3といった、これまでOpenAIが提供してきた多様なLLMの統合も目指しており、高度な機能を一元化します。特筆すべきは、これにより無料のChatGPTユーザーも高度な推論を体験できるようになることです。この機能は以前、有料購読者限定でした。この推論能力は、「思考の連鎖(chain-of-thought)」プロンプティングと呼ばれる技術を活用しており、モデルが複雑な問題を順序立てて分解し、人間のような熟考を模倣してより正確な答えに到達します。

GPT-5のベンチマーク性能を概説する詳細なシステムカードは今後公開される予定ですが、OpenAIのチームは、新しいモデルがより賢く、より速いだけでなく、より信頼性が高いと断言しています。彼らは、「ハルシネーション」(AIが事実として提示する誤った情報や誤解を招く情報を生成するインスタンス)の減少と、モデルが誤った回答を自信満々に提供するのではなく、自身の知識の限界を認める可能性が高くなったと主張しています。

GPT-5のコーディング能力には特に重点が置かれており、これはこの分野における他のLLMの優位性に対する潜在的な対応と見られています。アルトマンは、「オンデマンドソフトウェア」の新時代を構想しており、ユーザーが自然言語でアプリケーションを記述し、コードが具現化されるのを目の当たりにすることができます。プレスブリーフィング中、OpenAIのポストトレーニングリードであるヤン・デュボアは、GPT-5にフランス語学習用のウェブアプリ(フラッシュカード、クイズ、インタラクティブゲームを含む)を作成させることでこれを実演しました。モデルは数秒で何百行もの機能的なコードを生成し、人間の開発者であれば通常数時間を要する複雑な開発タスクを処理する能力を示しました。この能力は、AIアシストによるソフトウェア開発スタイルである「雰囲気コーディング(vibe coding)」という新たな概念と一致しています。これは、開発者が自然言語を通じてAIアシスタントをガイドし、コードを生成・洗練させ、手動コーディングから反復的な実験へと焦点を移すものです。

コーディング以外にも、GPT-5はエージェントAIタスクにおける卓越性が謳われています。エージェントAIとは、複数のAIモデルと外部ツールを統合することで、限られた人間の監視下で自律的に行動し、意思決定を行い、目標を追求できるシステムを指します。デュボアは、GPT-5がタスクに適したツールを選択する能力に優れ、長時間のプロセス中に脇道にそれる可能性が低く、エラーからの回復もより効果的であると述べました。

安全機能にはかなりの注意が払われ、安全研究リードのアレックス・ビューテルは、「安全な補完(safe completions)」と呼ばれる新しい技術を強調しました。これにより、GPT-5は曖昧なクエリに対しても役立つ回答を提供でき、以前の二者択一の「安全/危険」な応答とは異なり、有用性と潜在的な誤用の間の微妙な線を乗り越えることを目指しています。しかし、LLMの「ジェイルブレイク」(安全ガードレールを迂回する方法を見つけること)という継続的な課題は依然として懸念事項であり、ハッカーは直ちにGPT-5の防御をテストすると予想されます。

OpenAIはまた、LLMがユーザーに誤った情報が提示されても同意してしまうという問題のある「追従的」な傾向を認めました。この特性は、特にメンタルヘルスのような機密性の高い分野で懸念を引き起こしています。ニック・ターリーは、この方面およびメンタルヘルスのシナリオの処理において進展があったことを示唆しましたが、詳細はまもなく共有されると述べました。同社は最近、ChatGPTへの変更を発表しました。これには、ユーザーに休憩を取るよう促すリマインダーや、妄想を抱いているユーザーへの応答において「根拠に基づいた誠実さ」を強調することなどが含まれます。

アルトマンは、GPT-5がAGIの究極の実現ではないことを明確にしました。なぜなら、展開後の継続的な学習といった重要な属性がまだ欠けているからです。しかし、彼はAIの「スケーリング則」に自信を持っており、データ、モデルパラメータ、計算リソースの増加に伴うパフォーマンスの向上を予測しています。アルトマンは、これらの法則が「絶対にまだ有効である」と述べ、OpenAIは「桁違いのさらなる利益」を目の当たりにしており、将来の進歩を達成するために目を見張るような計算資源への投資を約束しています。