GPT-5登場:OpenAIの「過去最高のAIシステム」が全ChatGPTユーザーに無料開放

Arstechnica

OpenAIは、GPT-5とそのバリアントであるGPT-5 Pro、GPT-5 mini、GPT-5 nanoを発表し、これらを同社史上最も先進的な人工知能システムと位置付けています。重要なのは、これらの機能が無料ユーザーを含むすべてのChatGPTのティアで利用可能になることです。この最新のイテレーションは、顕著な進歩を約束しており、「虚偽情報」(事実誤認や幻覚を指す用語)の大幅な削減、コーディング能力の向上、そして「安全な補完」と呼ばれる機密性の高いユーザーリクエストを処理するための洗練されたアプローチが含まれています。無料のChatGPTユーザーも初めてシミュレートされた推論モデルにアクセスできるようになります。これは、複雑な問題を複数のステップに分解することで、論理的および分析的なクエリの精度を高めるために設計された技術です。

GPT-5ファミリーは、OpenAIが多様なAI機能を一貫したエコシステムに統合しようとする継続的な取り組みを示しています。同社はこれを、一般的な問い合わせ用の中核モデル、困難な問題用のより深い「GPT-5思考」モデル、そして会話のタイプ、複雑さ、ユーザーの意図に基づいて最も適切なAIにクエリをインテリジェントにルーティングするリアルタイムルーターからなる「統合システム」と特徴付けています。前身のGPT-4oと同様に、GPT-5はマルチモーダル機能を維持しており、テキスト、音声、画像を通じての対話が可能です。展開は直ちに開始され、ChatGPTの週7億人のアクティブユーザーという広範な基盤に到達しており、アクセス制限はサブスクリプションのティアによって異なります。ProサブスクライバーはGPT-5とそのProバリアントを無制限に利用でき、Plusユーザーは無料ユーザーと比較して大幅に高い使用許容量を得られます。アクセス権のあるユーザーにとって、GPT-5 Proはo3-proモデルに取って代わります。

GPT-3からGPT-4への飛躍がAI能力における劇的な変化であったのに対し、GPT-5への移行は、GPT-4o、GPT-4.5、GPT-4.1、o3-proといった一連の中間リリースを考慮すると、画期的な革命というよりも、むしろ実質的な進化のように感じられます。それにもかかわらず、「GPT-5」というブランドは大きな重みを持っており、競争の激しい業界におけるOpenAIの地位を向上させる可能性が高いです。

技術的な改善点として、OpenAIはGPT-5が「これまでのAIモデルの中で最も強力なコーディングモデルである」と断言しています。SWE-bench Verifiedベンチマークで74.9%、Aider Polyglotで88%のスコアを達成し、最近SWE-benchで74.5%を記録したAnthropicのClaude Opus 4.1などの競合他社を上回りました。このモデルは、最小限のガイダンスで複雑なコーディングタスクをエンドツーエンドで完了でき、プログラミング経験のないユーザー向けにソフトウェアインターフェースのデザインを生成することも可能だと報告されています。健康関連のクエリの分野では、GPT-5はOpenAIが開発したHealthBench Hardで46.2%のスコアを獲得しました。ただし、同社は注意を促しており、ChatGPTは専門的な医療アドバイスの代替ではないこと、また、すべてのAI言語モデルはエンゲージメントのために最適化された予測ツールであるため、ユーザーが聞きたいと望むような応答を生成する傾向があることをユーザーに注意喚起しています。その他のパフォーマンス指標は、GPT-5の数学における卓越性を示しており、AIME 2025でツールなしで94.6%を達成し、MMMUで84.2%を獲得するなど、マルチモーダル理解力も突出しています。拡張された推論機能により、GPT-5 ProはGPQAでもツールなしで88.4%という新たな最先端のスコアを記録しました。OpenAIはさらに、「思考」機能を持つGPT-5はOpenAI o3よりも効率的に動作し、様々なタスクで出力トークンを50〜80%削減できると主張しています。

精度も著しく向上しています。ウェブ検索と統合した場合、GPT-5の応答はGPT-4oよりも事実誤認が約45%少なくなります。「思考」モードを使用した場合、この可能性はo3と比較して約80%減少します。長文コンテンツの場合、「思考」機能を持つGPT-5はo3よりも虚偽情報が約6分の1に減少します。これらの進歩にもかかわらず、これらのモデルは知識のギャップを埋めるために、もっともらしいが誤った情報を生成する可能性があるため、ユーザーはAIの出力にのみ依存せず、独立した検証を行うことが引き続き推奨されます。

ChatGPTのユーザーエクスペリエンスも更新されており、カスタマイズ可能なチャットカラー、プリセットされた会話パーソナリティ(「皮肉屋」、「ロボット」、「聞き手」、「オタク」など)の導入、そしてProユーザー向けのGmail、Googleカレンダー、Google連絡先との新しい統合が含まれます。音声モードは統合された「アドバンストボイス」システムに統合され、OpenAIはユーザーの指示の理解度とより適応性の高い話し方が向上したと述べています。

OpenAIはまた、「安全な補完」によりコンテンツモデレーションのアプローチを洗練させました。GPT-5は、リクエストを完全に拒否する代わりに、「安全な境界内で可能な限り役立つ応答」を提供することを目指しています。リクエストが満たせない場合、モデルは制限事項について明確な説明を提供するようになりました。さらに、「追従性」の問題(GPT-4oのような以前のモデルが意図せず過度に追従的になっていた問題)も対処されました。新しい評価と改善されたトレーニングを通じて、GPT-5はターゲット評価において追従的な返信を14.5%から6%未満に削減したと報告されています。これがユーザーインタラクション、特にモデルの心理的影響に長期的にどのような影響を与えるかは、まだ明らかになっていません。

開発者向けには、GPT-5はgpt-5、gpt-5-mini、gpt-5-nanoの3つのAPIバージョンでアクセス可能であり、それぞれがレイテンシーとコストのバランスを取っています。コンテキストウィンドウは256,000トークンに拡張され、o3の200,000トークンから大幅に増加しましたが、GPT-4.1は特定のニーズ向けに100万トークンというより大きな容量を提供しています。gpt-5のAPI価格は、入力トークン100万あたり1.25ドル(90%のキャッシュ割引あり)、出力トークン100万あたり10ドルに設定されており、以前のモデルと同等です。より経済的なオプションとして、gpt-5-mini(入力0.25ドル/出力2ドル/100万トークン)とgpt-5-nano(入力0.05ドル/出力0.40ドル/100万トークン)が利用可能ですが、GPT-5 ProのAPI価格はまだ発表されていません。新しい開発者機能には、「自由形式関数呼び出し」が含まれており、SQLコマンドなどの生文字列をJSONフォーマットなしでツールに直接送信できるほか、応答の詳細を制御する「冗長性制御」、迅速な応答と詳細な分析を切り替える「推論努力制御」があります。

GPT-5のリリースは、GoogleのGeminiモデル、AnthropicのClaudeファミリー、MetaのオープンウェイトLlamaモデルといった著名な競合他社が市場シェアを争う、激しいAI競争の最中にあります。OpenAIは現在、500万人の有料ビジネスユーザーと400万人の開発者がAPIプラットフォームを利用しています。GPT-5は今後、ログインしているChatGPTユーザーのデフォルトモデルとして、GPT-4o、OpenAI o3、OpenAI o4-mini、GPT-4.1、GPT-4.5に代わります。システムは、有益な場合に自動的にシミュレートされた推論を適用しますが、有料ユーザーは「GPT-5思考」を明示的に要求したり、「これについて深く考えて」といったフレーズを使用したりして、より深い分析を確保することができます。段階的な展開はすべてのユーザー層で直ちに開始され、企業および教育機関の顧客は来週アクセスできるようになる予定です。OpenAIはまた、30日以内に標準音声モードを段階的に廃止し、統合されたアドバンストボイスシステムに完全に移行する計画です。無料ユーザーは、GPT-5の使用制限に達すると、より小さく高速なGPT-5 miniにシームレスに切り替わります。