GPT-5発表、OpenAIは5000億ドル評価とオープンモデルを視野に
この一週間はOpenAIにとって極めて重要な瞬間となりました。汎用人工知能(AGI)への積極的な追求、急成長する市場評価、そしてオープンソースイニシアチブへの新たなコミットメントを強調する3つの重要な発表が相次ぎました。週はgpt-ossという新しいオープンウェイトモデルのファミリーのリリースで始まり、続いて同社が投資家と株式売却の可能性について協議しているとの報道がすぐに流れました。これにより、同社の評価額は驚異的な5000億ドルに達する可能性があります。この一連の出来事の締めくくりとして、OpenAIはついに待望のフラッグシップモデルGPT-5を発表し、現在進行中の大規模言語モデルの軍拡競争における大きな飛躍を示しました。
GPT-5は、2023年3月のGPT-4の登場以来、初の主要なアップデートであり、サム・アルトマンCEOがライブストリームでの発表中に紹介し、「AGIへの我々の道のりにおける重要な一歩」と称賛しました。新モデルは現在、ChatGPTの無料ユーザー、Plusユーザー、Teamユーザーが利用可能で、EnterpriseおよびEducation向けの展開は翌週に予定されています。開発者もGPT-5、GPT-5 Mini、GPT-5 Nanoの3つの異なるAPIティアを通じてGPT-5にアクセスできるようになります。GPT-5における主要なアーキテクチャ変更は、ChatGPTのルーティングロジックの再設計です。以前は、システムはルーチンクエリを高速モデルに、複雑なタスクをより遅く、より熟考を要する推論バリアントに振り分けていました。この「分岐」はGPT-5で廃止されました。OpenAIの主任研究員であるマーク・チェンが説明したように、モデルは内部コントローラーを使用して最適な「思考」時間を動的に決定し、より単純な要求に対して不必要な遅延なく正確な回答を提供することを目指しています。
発表会で示されたベンチマーク結果は、GPT-5の目覚ましい能力を示しました。このモデルは、Pythonコーディングプロジェクトでのバグ修正能力を測るSWE-Benchで74.9%のスコアを達成し、Aider Polyglotコーディングテストでは88%のスコアを獲得しました。また、マルチモーダルMMMU視覚推論スイートでも新記録を樹立し、2025年AIME高校数学試験ではGPT-4oを非公開の差で上回りました。OpenAIのスタッフは、正式な評価がすべての現実世界のシナリオを網羅できないことを認めつつも、これらの高いスコアが内部で観察された信頼性の向上と一致していることを強調しました。GPT-5のトレーニング中の重要な焦点は、事実誤認と欺瞞的行動の削減でした。安全責任者のサチ・デサイは、モデルが内部テストで事実の不正確さが少なく、「安全な完了」方法を採用しており、厳格な「遵守または拒否」ルールではないと述べました。欺瞞への対処について、デサイはGPT-5が前任者よりも「著しく欺瞞性が低い」ことを強調しました。特に曖昧または不特定なタスクにおいて顕著です。発熱性花火の指示など、潜在的に危険な要求に対しては、モデルは部分的なガイダンスを提供し、ユーザーを安全マニュアルに誘導し、拒否の理由を透明に説明することで、害を助長することなく役立つコンテキストを提供することを目指しています。
中核モデルの改善に加え、OpenAIはGPT-5を基盤とした製品およびAPIのアップデートを展開しています。これには、無料ユーザー向けのライブビデオコンテキストを備えたより自然な音声モード、強化されたパーソナライゼーションオプション、GmailやGoogleカレンダーなどのサービスに接続できるメモリ機能が含まれます。新しい学習モードでは、ステップバイステップの学習が提供されます。開発者向けには、GPT-5はプレーンテキストを受け入れるカスタムツールコール、ツール使用前のオプションのプレアンブル、冗長性制御、および深さよりも速度を優先する最小推論設定を導入します。同社は、GPT-5がマルチツールタスクのTau-Squaredベンチマークで驚異的な97%を達成したと主張しており、わずか2ヶ月前の49%から大幅に増加しています。様々なユーザー層へのリリースは確認されていますが、GPT-5の展開は安定性を確保するために段階的に行われるため、一部のユーザーは利用可能になるまでに遅延を経験する可能性があります。
GPT-5の発表と並行して、OpenAIの財務状況に関する報道が浮上しました。ブルームバーグは、同社が従業員株式の二次売却に関する予備的な協議を行っており、これによりOpenAIの評価額は約5000億ドルに達する可能性があると報じました。Thrive Capitalを含む既存の投資家は、これらの購入への参加を検討していると伝えられています。もしこれが最終決定されれば、ソフトバンクが主導した400億ドルの資金調達ラウンドで確立された以前の3000億ドルという同社の帳簿上の評価額を大幅に引き上げることになります。また、OpenAIが最近、この過剰応募の資金調達の第二弾として、追加で83億ドルを確保したことも報じられました。このような二次売却は、従業員に重要な流動性を提供し、MetaやAnthropicのような競合他社との激しい競争の中で人材の定着を助ける可能性があります。さらに、ブルームバーグは、OpenAIとマイクロソフトが、現在の契約が2030年に期限切れになる前に、マイクロソフトの株式保有とOpenAIの基盤技術へのアクセスを含む複雑な関係を再交渉していると報じました。このパートナーシップは、ライバル関係、戦略的連携、相互依存の複雑な相互作用として特徴づけられています。非営利の親会社が営利目的の運営会社を監督するというOpenAI独自のハイブリッド型利益モデルは進化を続けており、運営部門が公益法人となる可能性を含め、構造変更に関する議論が進行中です。この戦略的な議論は、急速なユーザー増加を背景に展開されており、ChatGPTは3月の5億人から今週には週次アクティブユーザーが7億人に達すると予測されています。
創設時の名称と一致する動きとして、OpenAIはgpt-ossという新しいオープンウェイトモデルのファミリーもリリースしました。Hugging FaceとGitHubでApache 2.0ライセンスの下、200億および1200億パラメータのバージョンが利用可能で、これらのモデルはより広範なアクセシビリティへの重要な一歩を表しています。OpenAIは、gpt-ossモデルが「推論タスクにおいて同サイズのオープンモデルを上回り、強力なツール使用能力を示し、消費者向けハードウェアでの効率的な展開に最適化されている」と述べています。これらは、強化学習とOpenAIの最先端の内部モデルから得られた技術の組み合わせを使用してトレーニングされました。どちらの新しいモデルも、TransformerアーキテクチャとMixture-of-Experts(MoE)アプローチを採用しており、入力処理に必要なアクティブパラメータの数を削減し、効率を向上させています。80GB GPUを必要とするgpt-oss-120bモデルは、データセンターおよびハイエンドデスクトップ向けに設計されており、コア推論ベンチマークでOpenAIのo4-miniとほぼ同等の性能を達成しています。わずか16GBのメモリしか必要としない小型のgpt-oss-20bは、ほとんどの消費者向けデスクトップやラップトップで実行でき、オンデバイスのユースケースやローカル推論に適しており、OpenAIのo3-miniに匹敵する結果を提供します。gpt-ossのオープンウェイトの性質は、研究者に前例のない柔軟性を提供し、独自のハードウェアでモデルを実行し、再現可能な実験を行い、内部動作を検査し、ドメイン固有のデータでモデルをファインチューニングし、データプライバシーを確保し、コストを削減しながら他の研究室と比較することを可能にします。モデルの完全な思考連鎖を公開し、推論の深さを調整する能力を含むこの透明性は、分子設計や気候モデリングなどの分野における再現可能な研究を加速することを目的としています。OpenAIはgpt-ossのリリースを、「健全なオープンモデルエコシステム」への不可欠な一歩と見なしており、開発者に研究開発のためのより多くの選択肢を提供することでホスト型モデルを補完し、最終的にAIを「誰もが広く利用でき、恩恵を受けられる」ようにすることを目指しています。