DeepSeek、R2 AI訓練でNvidiaに回帰:ファーウェイ製チップ故障で遅延
DeepSeekが新型AIモデルR2をファーウェイのAscendチップで訓練するという野心的な計画は頓挫し、同社はNvidiaの技術に戻ることを余儀なくされ、モデルのローンチが遅れました。この挫折は、北京が技術的自給自足を目指す中で直面する、揺るぎない技術的現実を浮き彫りにしています。
1月にR1モデルを成功裏に発表した後、DeepSeekは国産ハードウェアを採用することで国家的な大義を推進するというかなりのプレッシャーにさらされました。フィナンシャル・タイムズ紙に語った状況を直接知る3人によると、指示は明確でした。Nvidiaのチップよりもファーウェイのチップを優先することです。
しかし、DeepSeekが新しいR2モデルの実際の訓練を開始した際、同社はファーウェイのAIチップで「持続的な技術的問題」に遭遇したと報じられています。これらの問題は非常に根本的であり、プロジェクトは停止に追い込まれました。状況に詳しい情報源は、これらの克服できない課題が、モデルの5月ローンチ計画を中止した主な理由であり、急速に進化する市場でDeepSeekを不利な立場に置いたと述べました。
この障害の重要性を理解するためには、AIの訓練と推論を区別することが不可欠です。訓練は非常に要求の厳しい段階であり、何年にもわたる集中的な大学レベルの学習に似ており、膨大な計算能力と揺るぎない安定性を必要とします。対照的に、推論は比較的負荷の少ないタスクであり、卒業生に質問するようなものです。訓練されたモデルを新しいデータに適用することを含みます。DeepSeekは、ファーウェイのチップが最終試験(推論)には十分かもしれないが、大学のコース(訓練)の厳格な要求にはまだ対応できていないことを発見しました。その結果、同社は重要な訓練段階のためにNvidiaのより堅牢なシステムに戻る以外に選択肢はありませんでした。情報源によると、DeepSeekのチームは、ファーウェイのチップを使用して、より要求の少ない推論段階向けにR2モデルを最適化しようと試みているとのことです。
問題の深刻さは、ファーウェイの直接介入によって強調されました。2つの情報源は、ファーウェイが自社のエンジニアチームをDeepSeekのオフィスに派遣し、R2モデルを彼らのチップで動作させるのを支援したことを確認しました。しかし、これらの専門家資源が現場にいても、成功した訓練の実行は依然として困難でした。
業界オブザーバーは、この結果が全く驚くべきことではないと広く認識しています。今年初め、ファーウェイのCEOである任正非自身が、米国が「ファーウェイの成果を誇張した」と認め、同社は「まだそれほど偉大ではない」と述べており、同社の最高のチップが依然として最先端の代替品より1世代遅れていることを認めています。
これらの技術的限界にもかかわらず、北京は引き続きテクノロジー大手に対し、国産ハードウェアを優先するよう積極的に奨励しています。フィナンシャル・タイムズは、中国企業が現在、Nvidiaの輸出規制に準拠したH20チップ(中国での販売が承認された性能の低いバリアント)の注文を正当化することを義務付けられていると報じています。この戦略は国内のチャンピオンを育成することを目的としていますが、意図せず企業に技術的に最適とは言えない選択を強制し、その結果、グローバルな競争力を阻害する可能性があります。
ファーウェイのチップがもたらす課題に加えて、DeepSeekの創設者である梁文峰は、R2モデルの全体的な進捗に不満を表明したと伝えられており、チームに対し、より高い目標を設定し、AI業界のリーダーの中に同社の地位を確保できる製品を開発するよう促しています。
最終的に、DeepSeekの経験は、AIの覇権をめぐる世界的な競争において、工学原理と性能の現実が、トップダウンの指示や国家の誇りよりも優先されることが多いという強力な教訓となります。中国が技術的独立の追求において長期的な視点を持っている一方で、当面の間、AIハードウェアにおける性能の王座はNvidiaがしっかりと保持しています。