谷歌Gemini Deep Think AI模型每月250美元震撼上线
谷歌已向公众开放其高度先进的AI推理模型Gemini 2.5 Deep Think。该模型通过利用多个AI代理进行头脑风暴,从而提升准确性并催生更具创造性的解决方案,以此脱颖而出。
据谷歌称,Gemini 2.5 Deep Think在多项关键AI基准测试中表现出色。值得一提的是,该模型的一个研究变体在今年的国际数学奥林匹克(IMO)中达到了金牌标准,完美解决了六个复杂问题中的五个。虽然该特定的研究模型在解决问题时需要较长的处理时间,但现在可供日常使用的版本运行速度显著加快,性能相当于IMO的铜牌水平。
要访问此新模型,需要订阅谷歌AI Ultra,每月费用为250美元。订阅者可以在Gemini应用程序中从模型下拉菜单中选择Gemini 2.5 Pro后,通过提示栏中的选项切换来激活“Deep Think”。
该模型于5月在谷歌I/O开发者大会上首次亮相,谷歌表示今天发布的版本代表着“显著改进”。这一进步归因于宝贵的测试人员反馈以及基准性能的实质性提升。
谷歌详细阐述了Deep Think如何利用“并行思维”技术来处理复杂问题。这种方法模仿了人类解决问题的方式,即同时考虑各种角度和潜在解决方案。该公司在一篇博客文章中解释说,这种方法使Gemini能够“一次生成许多想法并同时考虑它们,甚至随着时间的推移修改或组合不同的想法,最终得出最佳答案。”
此外,谷歌开发了新的强化学习技术,以鼓励模型探索更广泛的推理路径。这一过程旨在将Deep Think逐步发展成为一个更强大、更直观的问题解决者。谷歌声称这些能力使该模型特别适用于编码、网页开发和科学研究等高要求应用。
在竞争性基准测试中,据报道Gemini 2.5 Deep Think在“人类的终极考试”(Humanity’s Last Exam,HLE)中超越了竞争对手的模型。HLE是一个包含2500个问题的专业基准测试,涵盖数学、科学到人文学科。该模型在测试中取得了34.8%的得分,超过了OpenAI o3的20.3%和Grok 4的25.4%。
谷歌还宣布计划与一群精选的数学家和学者分享获得金牌的Gemini 2.5 Deep Think版本。这项举措旨在探索该高级模型如何帮助他们的研究,并计划利用这群人的反馈来改进模型的未来迭代。