谷歌Gemini Deep Think AI模型每月250美元震撼上线

谷歌已向公众开放其高度先进的AI推理模型Gemini 2.5 Deep Think。该模型通过利用多个AI代理进行头脑风暴，从而提升准确性并催生更具创造性的解决方案，以此脱颖而出。

据谷歌称，Gemini 2.5 Deep Think在多项关键AI基准测试中表现出色。值得一提的是，该模型的一个研究变体在今年的国际数学奥林匹克（IMO）中达到了金牌标准，完美解决了六个复杂问题中的五个。虽然该特定的研究模型在解决问题时需要较长的处理时间，但现在可供日常使用的版本运行速度显著加快，性能相当于IMO的铜牌水平。

要访问此新模型，需要订阅谷歌AI Ultra，每月费用为250美元。订阅者可以在Gemini应用程序中从模型下拉菜单中选择Gemini 2.5 Pro后，通过提示栏中的选项切换来激活“Deep Think”。

该模型于5月在谷歌I/O开发者大会上首次亮相，谷歌表示今天发布的版本代表着“显著改进”。这一进步归因于宝贵的测试人员反馈以及基准性能的实质性提升。

谷歌详细阐述了Deep Think如何利用“并行思维”技术来处理复杂问题。这种方法模仿了人类解决问题的方式，即同时考虑各种角度和潜在解决方案。该公司在一篇博客文章中解释说，这种方法使Gemini能够“一次生成许多想法并同时考虑它们，甚至随着时间的推移修改或组合不同的想法，最终得出最佳答案。”

此外，谷歌开发了新的强化学习技术，以鼓励模型探索更广泛的推理路径。这一过程旨在将Deep Think逐步发展成为一个更强大、更直观的问题解决者。谷歌声称这些能力使该模型特别适用于编码、网页开发和科学研究等高要求应用。

在竞争性基准测试中，据报道Gemini 2.5 Deep Think在“人类的终极考试”（Humanity’s Last Exam，HLE）中超越了竞争对手的模型。HLE是一个包含2500个问题的专业基准测试，涵盖数学、科学到人文学科。该模型在测试中取得了34.8%的得分，超过了OpenAI o3的20.3%和Grok 4的25.4%。

谷歌还宣布计划与一群精选的数学家和学者分享获得金牌的Gemini 2.5 Deep Think版本。这项举措旨在探索该高级模型如何帮助他们的研究，并计划利用这群人的反馈来改进模型的未来迭代。

谷歌Gemini Deep Think AI模型每月250美元震撼上线

相关文章

使用 Google Gemini 与 SAGE 框架构建自适应 AI 代理

DeepMind发布Genie 3：AI“世界模型”突破，实时生成高一致性互动3D世界

DeepMind发布Genie 3：交互式世界模型，迈向通用人工智能新里程碑