Nvidiaの新型Blackwell GPU、小型ワークステーションのAI性能を飛躍的に向上

Theregister

Nvidiaは、Blackwellアーキテクチャを採用した2つの新しいコンパクトGPU、RTX Pro 4000 Small Form Factor (SFF) とRTX Pro 2000を発表しました。これらは、厳格な70ワットの電力エンベロープ内で、プロフェッショナルなビジュアライゼーションとローカルAIワークロードに高いパフォーマンスを提供するために設計されています。ブリティッシュコロンビア州バンクーバーで開催されたSiggraphカンファレンスで発表された両カードは、ハーフハイトのデュアルスロットクーラーデザインを共有しており、スペースに制約のあるワークステーションに適しています。

物理的なプロファイルは似ていますが、2つのカードは異なる性能ティアに対応しています。RTX Pro 4000 SFFは、8,960個のCUDAコアを搭載し、RTX Pro 2000の4,352個のコアの2倍以上の処理能力を誇ります。Nvidiaは、RTX Pro 4000 SFFが前世代製品と比較して大幅な性能向上を達成し、レイトレーシング機能が約1.7倍、AI性能が2.5倍高速になったと主張しています。AI専用プロセッサである280個のTensorコアを搭載し、このチップは最大770テラFLOPSのFP4性能を発揮できます。これは浮動小数点演算で2.51倍の改善を示しますが、このゲインの多くは純粋なアーキテクチャの強化ではなく、FP4(4ビット浮動小数点)精度への移行によるものであることに注意することが重要です。FP8(8ビット浮動小数点)に正規化すると、チップの速度向上は25パーセントに近くなります。

RTX Pro 4000 SFFが真に輝くのはメモリ帯域幅であり、特に大規模言語モデル(LLM)でのローカルAI推論にとって重要な要素です。24GBのGDDR7メモリが432GB/sの帯域幅を提供することで、このカードはLLMでトークンを生成する速度がNvidiaの以前の製品よりも約54パーセント速くなると予測されています。

RTX Pro 2000は、兄弟モデルよりも性能は劣りますが、控えめな70Wの消費電力にもかかわらず、プロフェッショナルなビジュアライゼーションタスクで顕著な性能向上を約束します。Nvidiaは、ユーザーがAda Generationの前世代製品と比較して、3Dモデリングで1.6倍、コンピューター支援設計(CAD)で1.4倍、レンダリングで1.6倍の高速化を期待できると示しています。AIワークロードに関しては、RTX Pro 2000は、より消費電力の大きい製品には及ばないものの、決して劣るわけではなく、最大545テラFLOPSの疎なFP4演算と、16GBのGDDR7メモリによって供給される280GB/sのメモリ帯域幅を提供します。

これらの新しいコンパクトGPUは、Nvidiaの既存のBlackwellワークステーションラインナップを補完するもので、これには3月のGTCカンファレンスで発表された96GB RTX Pro 6000も含まれます。さらに、Siggraphでは、Nvidiaは600W RTX Pro 6000サーバーエディションカードを2枚搭載できる2Uサーバープラットフォームも展示しました。各カードは最大4ペタFLOPSの疎なFP4性能を提供します。RTX Pro 4000 SFFとRTX Pro 2000は、今年後半にPNYとTD SYNNEXの販売代理店から入手可能になり、BOXX、Dell、HP、LenovoなどのメーカーのOEMシステムにも統合されます。より強力なRTX Pro 6000サーバーカードを搭載したサーバーシステムは、Cisco、Dell、HPE、Lenovo、Supermicroなどからすでに提供されています。