Gemini 2.5 Deep Think:並列AIで創造的問題解決へ
Googleは、並列思考と拡張された計算時間を活用する革新的なアプローチにより、複雑な創造的問題に取り組むために設計された洗練された人工知能モデル、Gemini 2.5 Deep Thinkを発表しました。Google AI Ultraサブスクリプションの一部として利用可能なDeep Thinkは、創造性、戦略的計画、そして綿密な段階的アプローチを要求する課題のために特別に設計されています。これには、反復的な設計と開発、画期的な科学的・数学的発見、高度なアルゴリズム作成などの複雑なタスクが含まれます。
現在利用可能なDeep Thinkのイテレーションは、2025年国際数学オリンピック(IMO)で金メダルを獲得したモデルの重要な最適化と改良を表しています。その非常に競争の激しいイベント中、Gemini Deep Thinkの高度なバリアントは、6つの難しい問題のうち5つを完璧に解決し、注目すべき合計35ポイントを獲得しました。これは金メダルに値する卓越したスコアです。競技専用バージョンは複雑な問題の推論に何時間も費やすことができましたが、新しい公開リリースは、推論の深さをある程度犠牲にして速度を向上させ、日常のアプリケーションにより実用的になっています。
この進歩は、2024年のIMOでのGoogleのAIのパフォーマンスと比較して、GoogleのAIへの取り組みにとって大きな飛躍を意味します。前年、AlphaProofやAlphaGeometryのようなモデルは、人間が自然言語から専門のドメイン固有言語に問題を最初に翻訳する必要があり、それでも解決策を生成するのに最大3日かかりました。対照的に、Deep Thinkはこのプロセスを大幅に効率化します。
Gemini Deep Thinkの核となるのは、問題に対する複数の潜在的な解決策を同時に生成することです。推論プロセス全体を通じて、これらの代替案を継続的に修正および結合し、反復的に最適な回答に収束します。この並列探索と洗練には、著しく拡張された推論時間枠が必要となるため、リアルタイムチャットのような即時かつインタラクティブなアプリケーションにはあまり適していません。Googleは、この集中的な計算要件のため、ユーザーが応答時間の遅延やタイムアウトの問題に遭遇する可能性があることを認めています。
Deep ThinkをGeminiファミリー内の他のモデルとさらに区別しているのは、そのユニークなトレーニング方法論です。モデルがこれらの長時間の推論パスを利用するよう積極的に促す新しい強化学習技術が組み込まれており、これにより多数の仮説を同時にテストおよび検証できます。さらに、このモデルは、複雑な数学問題に対する高品質の解決策の細心の注意を払ってキュレーションされたコーパスにアクセスしてトレーニングされており、問題解決能力がさらに向上しています。
Googleは、Gemini 2.5 Deep ThinkがLiveCodeBench V6やHumanity’s Last Examを含むいくつかの重要な評価で最先端のパフォーマンスを達成し、新しいベンチマークを設定していると主張しています。しかし、早期導入者は、有料ユーザーであっても利用可能なクエリ数が制限されているという重大な実用上の制限に気づいています。当初は1日あたり5回に制限されていましたが、この制限は後に10回に倍増されました。一部の観察者は、この制限を、モデルの実行にかかる膨大な計算費用、おそらくGemini Proモデルの大規模なクラスターを並行して運用することに匹敵する費用を示す強力な兆候であると解釈しています。
Geminiシリーズの他のモデルと同様に、Deep Thinkはスパースな混合専門家(MoE)アーキテクチャに基づいて構築されています。また、テキスト、視覚、オーディオ入力をシームレスに処理できるネイティブなマルチモーダルサポートも誇っています。このモデルは、印象的な100万トークンの入力コンテキストウィンドウと192,000トークンの出力ウィンドウを備えており、膨大な量の情報を処理する能力を示しています。AI Ultraサブスクライバーに提供される最適化されたバージョンに加えて、Googleは競技用バリアントもより広範な研究コミュニティに提供しており、この分野でのさらなる革新と研究を促進しています。