GoogleのAIインフラがひっ迫:Gemini需要急増で計算能力限界に

Decoder

Googleの人工知能(AI)インフラは現在、最新のAIモデルに対する需要の急増により、大きな負担に直面しています。この課題により、同社の最も高度なAI機能の一部にアクセスできるユーザーが限られています。

Googleのプロダクトマネージャーであるローガン・キルパトリックは最近、Gemini 2.5 Pro Deep Thinkへのアクセスが制限されているというユーザーからの苦情に対応しました。キルパトリックは、このモデルのリリースが制約されているのは、「実行に大量の計算能力を必要とする」ためだと説明しました。この膨大な処理需要は、AIワークロードに不可欠なGoogleのカスタム設計されたTensor Processing Units(TPU)がすでに最大容量で稼働している時に発生しています。

キルパトリックによると、TPUはいくつかの要因によって推進される「大規模な成長」に追いつくのに苦労しています。これには、Googleの新しい動画生成モデルVeoの広範な採用、標準版Gemini 2.5 Proの使用量の増加、そして数億人のユーザーへのAI機能の広範な展開が含まれます。

ユーザーの不満は、Gemini 2.5 Pro Deep Thinkがベンチマークで強力なパフォーマンスを示しているにもかかわらず、アクセス制限によってその実用的な使用が妨げられているという事実に起因しています。Gemini Ultraのようなプレミアム層の購読者でさえ、Googleのシステムがエスカレートする計算需要に対応しているため、1日あたり数回のリクエストに制限されていると報告しています。

GoogleのAIインフラがひっ迫:Gemini需要急増で計算能力限界に - OmegaNext AIニュース