AI大手、新モデル発表:OpenAI、Anthropic、Googleが更新
先週、人工知能の分野では、業界の巨人であるOpenAI、Anthropic、Googleがそれぞれ基盤モデルの重要なアップグレードを発表し、AIの推論、コーディング、問題解決能力の限界を押し広げました。これらのリリースは、イノベーションの加速とAI競争最前線における激しい競争を浮き彫りにしています。
OpenAIは2025年8月5日、2つの新しい「オープンウェイト」推論モデル、gpt-oss-120bとgpt-oss-20bのリリースにより、「オープンソース原則」への注目すべき回帰を果たしました。トレーニングデータはプロプライエタリであるため完全なオープンソースではありませんが、これらのモデルは公開アクセス可能なパラメータを提供し、開発者が独自のインフラでカスタマイズおよび展開することを可能にします。より大規模なgpt-oss-120b(1170億パラメータ)は、高性能タスク向けに設計されており、単一の80GB GPUで効率的に動作し、OpenAI独自のo4-miniと主要な推論ベンチマークでほぼ同等の性能を達成します。よりコンパクトなgpt-oss-20b(210億パラメータ)は、わずか16GBのメモリを持つエッジデバイスやパーソナルコンピュータ向けに最適化されており、o3-miniに匹敵する性能を提供します。両モデルはApache 2.0ライセンスの下でリリースされ、高度な推論、コーディング、競技数学、健康関連のクエリに優れており、ツール利用と調整可能な推論努力をさらにサポートします。そのMixture-of-Experts(MoE)アーキテクチャは、高速かつ費用対効果の高い推論に貢献し、研究、開発、企業アプリケーション向けの多用途ツールとなっています。
一方、Anthropicは2025年8月5日にClaude Opus 4.1を発表しました。これは、フラッグシップモデルであるClaude Opus 4の漸進的でありながら影響力のあるアップグレードです。この新しいイテレーションはコーディング性能を大幅に向上させ、SWE-bench VerifiedベンチマークでOpus 4の72.5%から74.5%という印象的なスコアを達成しました。Opus 4.1は、高度な推論とエージェント機能も誇り、詳細な調査、データ分析、および複雑な多段階の問題を高い精度で解決することに長けています。長期間にわたるタスクを処理し、膨大なデータセットから洞察を統合する能力は、さまざまな分野での戦略的意思決定のための強力な仮想コラボレーターとしての地位を確立しています。このモデルは、有料のClaudeユーザー、AnthropicのAPI、Amazon Bedrock、Google Cloud Vertex AIを通じて利用可能であり、前モデルと同じ価格設定を維持しています。
負けじと、Googleは2025年8月1日から、Gemini 2.5 Ultraモデルの高度な推論モードであるGemini 2.5 Deep Think AIを展開しました。Deep Thinkは画期的な「並列思考」アーキテクチャを導入し、Geminiが人間がブレインストーミングをするように、複数のアイデアを同時に生成および評価することを可能にします。この革新的なアプローチはGeminiに拡張された「思考時間」を提供し、創造性、戦略的計画、反復開発、高度なコーディングを必要とする複雑な問題を解決する能力を大幅に向上させます。このモデルは、2025年国際数学オリンピックで金メダルを獲得したバリエーションの一つであり、Humanity’s Last ExamやLiveCodeBench V6などの主要ベンチマークで、OpenAIのo3やxAIのGrok 4などのライバルに対して優れた性能を示しています。現在、Gemini 2.5 Deep ThinkはGoogle AI Ultraサブスクライバーのみが利用可能であり、近い将来、信頼できるテスター向けに広範なAPIアクセスが計画されています。
これらの同時リリースは、AI開発における極めて重要な瞬間を浮き彫りにしています。主要企業が推論、効率性、アクセシビリティの限界を押し広げています。モデルがより高性能で専門的になるにつれて、焦点は実用的な展開と、オープンなアクセシビリティとプロプライエタリな優位性の間の微妙なバランスへと移行しています。これらのAIの強力な進化は、今後数年間で産業を再構築し、人間とコンピュータの相互作用を再定義することを約束します。