谷歌AI基础设施承压：Gemini需求激增，算力告急！

谷歌的人工智能（AI）基础设施目前正因其最新AI模型的需求激增而承受巨大压力。这一挑战导致用户对该公司一些最先进的AI功能访问受限。

谷歌产品经理Logan Kilpatrick最近回应了用户关于Gemini 2.5 Pro Deep Think访问受限的投诉。Kilpatrick解释说，该模型的发布受到限制，因为它需要“海量的计算资源才能运行”。这种巨大的处理需求正值谷歌为AI工作负载定制设计的张量处理单元（TPU）已满负荷运行之时。

据Kilpatrick称，TPU正努力跟上由多种因素驱动的“大规模增长”。这些因素包括谷歌新视频生成模型Veo的广泛采用、标准版Gemini 2.5 Pro使用量的增加，以及AI功能向数亿用户的更广泛推广。

用户的不满源于这样一个事实：尽管Gemini 2.5 Pro Deep Think在基准测试中表现出色，但其实际使用却因访问限制而受阻。即使是Gemini Ultra等高级订阅服务的用户也报告称，由于谷歌系统应对不断升级的计算需求，他们每天只能进行少量请求。

谷歌AI基础设施承压：Gemini需求激增，算力告急！

相关文章

英伟达AI芯片非法出口案开审，公司拒设“自毁开关”引安全争议

美国打击下，两名中国人因走私英伟达AI芯片至中国被捕

美国探索AI芯片加装定位追踪器，遏制对华流出