谷歌Gemini应用推出Deep Think AI:Ultra订阅者专属,赋能复杂问题解决

Deepmind

谷歌宣布在其Gemini应用中推出一项名为Deep Think的先进问题解决功能,该功能仅限Google AI Ultra订阅者专享。这项新能力旨在增强Gemini处理复杂挑战的能力,它借鉴了尖端AI研究所开发的技术。

Deep Think在Gemini的早期版本基础上实现了显著飞跃,融入了早期测试者的反馈和最新突破。它是2025年国际数学奥林匹克(IMO)金牌标准模型的变体。虽然完整的IMO模型在处理高度复杂问题时需要大量的处理时间,但集成到Gemini应用中的版本已经过优化,以提高速度和日常可用性,在内部评估中,其在2025年IMO基准测试中展现出青铜级性能。

Deep Think的核心在于通过采用并行处理技术来延长Gemini的“思考时间”。就像人类探索问题多个角度一样,这种方法允许Gemini同时生成并考虑大量的想法、假设和潜在解决方案。它可以在得出最优答案之前,随着时间的推移修改或组合不同的概念。这种延长的推理时间,加上新颖的强化学习技术,鼓励模型发展出更直观、更有效的问题解决策略。

这项增强的能力使Deep Think成为处理各种高要求任务的强大工具:

  • 迭代开发与设计: Deep Think在需要逐步构建和完善的任务中表现出色,例如改进网页开发项目的美观性和功能性。

  • 科学与数学发现: 其解决高度复杂问题的能力使其对研究人员极具价值。它可以协助 формуulate 和探索数学猜想,或浏览复杂的科学文献,从而可能加速发现的步伐。

  • 算法开发与编码: 该功能在具有挑战性的编码问题中表现尤为突出,这些问题要求精确的问题 формуulate、仔细权衡以及对时间复杂度的理解。

Deep Think的性能通过其在挑战性基准测试上的最先进结果得到进一步验证。在与其他未集成工具的模型进行比较时,Gemini 2.5 Deep Think在LiveCodeBench V6(衡量竞争性编码能力)和“人类的最后一考”(评估包括科学和数学在内的各种领域专业知识的基准)上均取得了顶尖表现。

在公开发布的同时,谷歌还向选定的数学家和学者群体提供了在IMO上获得金牌标准的官方Gemini 2.5 Deep Think模型的访问权限。这项举措旨在收集关于高级模型如何增强他们的研究和探究的反馈,从而为未来的改进提供信息。

谷歌强调其对负责任AI开发的持续承诺。在Deep Think的训练和部署生命周期中,安全和伦理考量贯穿始终。测试表明,与Gemini 2.5 Pro相比,Deep Think在内容安全性和语调客观性方面有所改善,尽管它表现出更高的拒绝良性请求的倾向。随着AI问题解决能力的进步,谷歌正在对与复杂性增加相关的风险进行更深入的分析,包括前沿安全评估和针对关键能力水平的计划性缓解措施。有关Gemini 2.5 Deep Think安全结果的更多详细信息可在其专用模型卡中查阅。

Google AI Ultra订阅者今天即可在Gemini应用中访问Deep Think。用户在选择2.5 Pro模型时,可以通过在提示栏中切换“Deep Think”来启用该功能。它与代码执行和Google搜索等现有工具无缝集成,并且能够生成显著更长的响应。展望未来,谷歌计划在未来几周内通过Gemini API向一组信任的测试人员发布带有和不带集成工具的Deep Think,旨在探索其在开发者和企业应用中的可用性。

此次发布标志着谷歌在构建更实用、更强大AI的使命中迈出了重要一步,重申了其利用Gemini推动人类知识前沿的承诺。