DeepSeek R2延期:ファーウェイ製チップ問題でNVIDIA利用へ
DeepSeekが開発を進めていた大規模言語モデル「R2」のリリースが延期されたと報じられており、この遅延はファーウェイのAscendプロセッサに起因する持続的な性能問題が原因とされています。フィナンシャル・タイムズが報じたこの動向は、米国技術を国産ソリューションで代替しようとする中国の野心的な取り組みが直面する大きな課題を浮き彫りにしています。
AIコミュニティで大きな注目を集めたDeepSeekのR1モデルの成功を受け、中国政府関係者は、NVIDIA製プロセッサを継続使用するのではなく、後続のR2開発には国産のAscendチップを利用するよう同スタートアップを奨励したと報じられています。しかし、DeepSeekはAscendチップを使用してR2のトレーニングプロセスを試みた際、実質的な技術的障害に直面しました。これらの困難により、同社は集中的なトレーニング段階でNVIDIA製チップに戻ることを余儀なくされましたが、推論段階(トレーニング済みモデルを新しいデータに適用するプロセス)では引き続きファーウェイ製プロセッサを使用する計画です。
この戦略的転換は、中国国内における輸出規制の進化と国内圧力という広範な状況の中で行われました。米国の輸出規制の最近の調整により、特定のNVIDIAおよびAMD製GPU、具体的にはNVIDIA H20とAMD MI308の中国への出荷が許可されました。これらのチップは、中国国内で開発されたGPUとほぼ同等の性能を提供するように設計されていると報じられています。同時に、中国当局が企業に対し、米国製GPUへの継続的な依存の正当性を求めるなど、監視を強化しているとの報告もあります。
フィナンシャル・タイムズが引用した情報源によると、ファーウェイのプロセッサはNVIDIAの製品と比較して、安定性の問題、チップ間接続の遅さ、付属ソフトウェアの劣悪さなど、いくつかの重大な欠陥を示しました。これらの障害を克服するために、ファーウェイの技術者チームがDeepSeekと現場で直接協力したと報じられています。これらの協調的な努力にもかかわらず、Ascendプロセッサでのトレーニングの成功は達成できませんでした。
この状況は、国家戦略目標、技術的能力、市場の現実との複雑な相互作用を浮き彫りにしています。中国は重要技術の自給自足を積極的に追求していますが、DeepSeekの事例は、高度なAIアクセラレータにおける性能差が依然として大きな障壁であることを示唆しています。フィナンシャル・タイムズの報告によると、DeepSeekのR2モデルは、おそらくNVIDIAハードウェアでのトレーニング成功後、今後数週間以内にリリースされる可能性があります。