OpenAI、オープンウェイトLLMを発表:gpt-oss-120B(ノートPC)とgpt-oss-20B(スマホ)
OpenAIは、2つの新しいオープンウェイト言語モデル、gpt-oss-120Bとgpt-oss-20Bのリリースを発表しました。これは、同社のAI配布へのアプローチにおける重要な転換点となります。この動きにより、誰もがこれらのモデルをダウンロード、検査、ファインチューニングし、自身のハードウェアで実行できるようになり、研究者、開発者、愛好家にとって、透明性、カスタマイズ性、計算能力の新時代を促進します。
OpenAIの新たな方向性
これまで、OpenAIは高性能なAIモデルを開発する一方で、その基盤となる技術をほぼ独占的に保持していました。しかし、寛容なApache 2.0ライセンスの下でgpt-oss-120Bとgpt-oss-20Bをリリースしたことは、顕著な変化を示しています。このオープンソースのアプローチにより、ユーザーはクラウドAPIにのみ依存することなく、企業環境から個人デバイスまで、OpenAIレベルのモデルをローカルにデプロイできるようになります。
モデルの紹介:機能とアクセシビリティ
gpt-oss-120B: この大型モデルは1,170億のパラメータを持ち、エキスパート混合(MoE)アーキテクチャを利用しています。これにより、効率化のためにトークンごとに約51億のパラメータが活性化されます。その性能は、実際のベンチマークにおいてOpenAIのo4-miniと同等か、あるいはそれを上回ると報告されています。このモデルは、Nvidia H100や80GBクラスのカードといった単一のハイエンドGPUで動作するように設計されており、大規模なサーバーファームは不要です。
主な機能には、思考の連鎖(chain-of-thought)とエージェント的推論が含まれており、研究の自動化、技術文書作成、コード生成などのタスクに適しています。ユーザーは「推論の努力」(低、中、高)を設定して、パワーとリソース消費のバランスを取ることができます。さらに、gpt-oss-120Bは最大128,000トークンの広範なコンテキストウィンドウを誇り、書籍全体に相当する大量のテキストを処理できます。また、ファインチューニングとローカル推論が容易であり、完全なデータプライバシーとレート制限なしのデプロイ制御を提供します。
gpt-oss-20B: 210億のパラメータ(およびトークンごとに36億のアクティブパラメータ、MoEも活用)を持つgpt-oss-20Bは、より小型のモデルとしては堅牢な性能を提供し、推論タスクにおいてo3-miniとo4-miniの間に位置付けられます。特筆すべき機能は、わずか16GBのRAMを搭載したノートPCを含む消費者向けハードウェアで動作できることであり、これにより、携帯電話やローカルPCで動作可能な最も強力なオープンウェイト推論モデルの1つとなっています。
このモデルは、低遅延でプライベートなデバイス上AIに特化して最適化されており、スマートフォン(Qualcomm Snapdragonを含む)、エッジデバイス、およびクラウドに依存しないローカル推論を必要とするシナリオをサポートします。大型モデルと同様に、gpt-oss-20Bはエージェント機能を備えており、APIの使用、構造化出力の生成、オンデマンドでのPythonコード実行が可能です。
技術的基盤:効率性と移植性
両方のgpt-ossモデルは、**エキスパート混合(MoE)**アーキテクチャを活用しています。この設計は、処理される各トークンに対して選択された少数の「エキスパート」サブネットワークのみを活性化し、モデルが膨大な総パラメータ数を持つ一方で、控えめなメモリ使用量と高速な推論速度を維持することを可能にします。これにより、現代の消費者向けおよび企業向けハードウェアにおいて非常に効率的です。
さらに、これらのモデルにはネイティブMXFP4量子化が組み込まれています。これは、精度を損なうことなくメモリフットプリントを大幅に削減する技術です。この最適化は、gpt-oss-120Bが単一の高度なGPUに収まるため、またgpt-oss-20BがノートPC、デスクトップ、さらにはモバイルデバイスで快適に動作するために不可欠です。
実世界への影響と応用
これらのオープンウェイトモデルのリリースは、さまざまなセクターに広範な影響を与えます。
- 企業向け: モデルをオンプレミスでデプロイする能力は、特に金融、医療、法律などの機密性の高い業界において、データプライバシー、セキュリティ、コンプライアンスの強化を保証します。これにより、ブラックボックスのクラウドAIへの依存が解消され、組織はLLMワークフローを完全に制御できるようになります。
- 開発者向け: AI機能を実験、ファインチューニング、拡張するための比類ない自由を提供します。開発者はAPI制限や定期的なSaaS料金なしで作業でき、レイテンシとコストを完全に制御できます。
- コミュニティ向け: モデルはHugging FaceやOllamaなどのプラットフォームで容易に入手でき、迅速なダウンロードとデプロイを促進し、コミュニティ主導のイノベーションを加速します。
オープンウェイトモデルの新たなベンチマークを設定
gpt-oss-120Bは、OpenAIのo4-miniのようなトップティアの商用モデルに匹敵する性能レベルを達成した、初の自由に利用可能なオープンウェイトモデルとして際立っています。gpt-oss-20Bのバリアントは、デバイス上AIの性能ギャップを埋め、ローカル大規模言語モデルで可能なことの境界を押し広げ、この分野における重要なイノベーションを促進すると期待されています。
OpenAIのGPT-OSSのリリースは、高度なAI能力を開放するというコミットメントを示しています。最先端の推論、ツール使用、エージェント機能を検査およびデプロイ可能にすることで、OpenAIは、より広範なメーカー、研究者、企業のコミュニティに対し、これらのモデルを使用するだけでなく、積極的に構築し、反復し、進化させるよう促しています。