GoogleのGemini 2.5 Deep Think AIモデル、数学オリンピックで金メダル獲得
Googleは、新しい人工知能モデル「Gemini 2.5 Deep Think」を発表しました。これは、Google AI Ultraの購読者が利用できるようになっています。この高度なモデルは、すでに顕著な推論能力を発揮しており、特に2025年の国際数学オリンピックで金メダルを獲得しました。時間制限のある試験形式の条件下で、Deep Thinkは大会のショートリストから4つの証明問題を成功裏に解決し、最高の人間の競技者の成績に匹敵しました。
Deep Thinkの核となる革新は、真に並列な仮説ストリームを運用する能力にあります。単一の線形パスを追求する従来のAIシステムとは異なり、Deep Thinkは複数の「エージェント」を生成し、同時にさまざまな解決策の軌跡を探求します。このマルチエージェントアプローチは、疎混合エキスパート(MoE)アーキテクチャと組み合わせることで、モデルが専門化されたサブネットワーク間で情報を動的にルーティングすることを可能にします。この設計は、膨大な計算能力を提供しつつ、推論コストを制御し、パス依存性を軽減し、より創造的な問題解決を促進します。
技術的に、Gemini 2.5 Deep Thinkは、100万トークンという大規模なコンテキストウィンドウを誇り、1回のセッションで最大192,000トークンを生成できます。これらの仕様により、詳細なコードベース監査、拡張された記号推論、包括的なマルチモーダル調査ワークフローなどの複雑なタスクに特に適しています。そのトレーニングには、専門的な定理証明コーパスと強化学習データセットが組み込まれており、体系的で段階的な推論が奨励されました。さらに、テキスト、視覚、音声、ビデオを含むマルチモーダル設計は、多様なドメインにわたる統合された推論の基盤を築きます。
このモデルの能力は、2025年の国際数学オリンピックで最も説得力のある形で示されました。Deep Thinkの並列エージェントフレームワークにより、複数の証明戦略を同時に探求することが可能になり、単一パスのベースラインモデルと比較して解決時間が50%以上大幅に短縮されました。また、精度と解法の優雅さの両方で、以前の密なデコーダープロトタイプを上回りました。
Googleは、Deep ThinkのAPIを段階的に展開する予定で、「ツールあり」と「ツールなし」の両方のバリアントを提供し、明確な使用クォータとコスト管理ガイドラインを併記します。Gemini Pro UIユーザーの場合、Ultra購読者は、限定されたDeep Thinkのセッションを毎日利用できる専用のトグルを見つけることができます。開発者は、その高い計算要件に合わせて調整された使用量ベースの料金モデルの下で、Gemini APIを介してその機能を間もなく統合できるようになります。
Gemini 2.5 Deep Thinkの導入は、AI開発における大きな転換点を示しており、モノリシックなヒューリスティックスに依存するのではなく、複数の解決策のパスを自律的に探索し評価できるシステムを予告しています。国際数学オリンピックでのその成功は、その計算能力だけでなく、人間の専門家と同様の戦略的推論能力も強調しています。AIコミュニティがこの飛躍を受け入れるにつれて、モデルの持続可能性、公平なアクセス、そして次世代の推論エンジンが科学技術のフロンティアを責任を持って推進するために必要なガバナンスフレームワークに関して、重要な議論が間違いなく浮上するでしょう。