GoogleのAIモデル「Gemini Deep Think」月額250ドルで提供開始

Gizmodo

Googleは、高度なAI推論モデル「Gemini 2.5 Deep Think」を一般公開しました。このモデルは、複数のAIエージェントを動員してブレインストーミングを行い、精度を高め、より創造的なソリューションを育成する技術を採用している点で際立っています。

Googleによると、Gemini 2.5 Deep Thinkは、いくつかの主要なAIベンチマークテストで優れた性能を示しました。特に、このモデルの研究用バリアントは、今年の国際数学オリンピック(IMO)で金メダル基準を達成し、6つの複雑な問題のうち5つを完全に解決しました。この特定の研究モデルは、解決に長時間の処理を要しましたが、現在日常的に利用可能なバージョンは大幅に高速に動作し、IMOの銅メダルレベルに匹敵する性能を提供します。

この新しいモデルへのアクセスには、月額250ドルのGoogle AI Ultraサブスクリプションが必要です。加入者は、GeminiアプリケーションのモデルドロップダウンメニューからGemini 2.5 Proを選択した後、プロンプトバー内のオプションを切り替えることで「Deep Think」を有効にできます。

5月のGoogle I/O開発者会議で初めてプレビューされたこのモデルについて、Googleは本日リリースされたバージョンが「大幅な改善」を表していると述べています。この進歩は、貴重なテスターからのフィードバックと、ベンチマーク性能の大幅な向上によるものです。

Googleは、Deep Thinkが複雑な問題に取り組むために「並列思考」技術を利用していると詳しく説明しています。この方法は、さまざまな角度や潜在的な解決策を同時に検討することで、人間の問題解決を模倣します。同社はブログ投稿で、このアプローチによりGeminiが「一度に多くのアイデアを生成し、それらを同時に検討し、さらには時間をかけて異なるアイデアを修正または組み合わせ、最終的に最良の答えに到達する」ことができると説明しました。

さらに、Googleは、モデルがより広範な推論パスを探索することを奨励するために、新しい強化学習技術を開発しました。このプロセスは、Deep Thinkを時間をかけてより堅牢で直感的な問題解決者に進化させることを目的としています。Googleは、これらの機能により、このモデルがコーディング、ウェブ開発、科学研究などの要求の厳しいアプリケーションに特に役立つと主張しています。

競合ベンチマークでは、Gemini 2.5 Deep Thinkは、「人類最後の試験」(Humanity’s Last Exam、HLE)で競合モデルを上回ったと報じられています。HLEは、数学、科学から人文科学までをカバーする2,500問の専門知識ベンチマークです。このモデルはテストで34.8%のスコアを達成し、OpenAI o3の20.3%とGrok 4の25.4%を上回りました。

Googleはまた、金メダルを獲得したGemini 2.5 Deep Thinkのバージョンを、選ばれた数学者や学者グループと共有する計画を発表しました。この取り組みは、高度なモデルが彼らの研究にどのように役立つかを探求することを目的としており、このグループからのフィードバックは、モデルの将来のイテレーションを情報提供し、洗練するために活用される予定です。