谷歌AI基础设施承压:Gemini需求激增,算力告急!
谷歌的人工智能(AI)基础设施目前正因其最新AI模型的需求激增而承受巨大压力。这一挑战导致用户对该公司一些最先进的AI功能访问受限。
谷歌产品经理Logan Kilpatrick最近回应了用户关于Gemini 2.5 Pro Deep Think访问受限的投诉。Kilpatrick解释说,该模型的发布受到限制,因为它需要“海量的计算资源才能运行”。这种巨大的处理需求正值谷歌为AI工作负载定制设计的张量处理单元(TPU)已满负荷运行之时。
据Kilpatrick称,TPU正努力跟上由多种因素驱动的“大规模增长”。这些因素包括谷歌新视频生成模型Veo的广泛采用、标准版Gemini 2.5 Pro使用量的增加,以及AI功能向数亿用户的更广泛推广。
用户的不满源于这样一个事实:尽管Gemini 2.5 Pro Deep Think在基准测试中表现出色,但其实际使用却因访问限制而受阻。即使是Gemini Ultra等高级订阅服务的用户也报告称,由于谷歌系统应对不断升级的计算需求,他们每天只能进行少量请求。