DeepSeek、AIモデルのファーウェイ製チップ学習に失敗し発表延期

Arstechnica

中国の人工知能企業DeepSeekは、ファーウェイの昇騰(Ascend)プロセッサーを使用した学習を試みる中で、持続的な技術的困難に直面したため、新しいR2モデルの発表を延期したと報じられています。この遅延は、外国、特に米国の技術を国産の代替品に置き換えるという北京の野心的な推進が直面している重大な障壁を浮き彫りにします。

状況に詳しい情報筋によると、中国当局はDeepSeekに対し、1月にR1モデルを発表した後、主流のNvidiaシステムから離れてR2モデルにファーウェイの昇騰チップを採用するよう奨励していました。しかし、DeepSeekは昇騰チップを用いたR2モデルの集中的な学習段階で、すぐに問題に直面しました。その結果、同社は重要な学習プロセスにはNvidiaのチップを使用し、訓練済みモデルが知識を適用して予測や応答を生成する、より要求の低い推論段階(例えばチャットボットの問い合わせなど)にはファーウェイのチップを温存することになりました。

ファーウェイのハードウェアに関する技術的な問題は、R2モデルの発表が5月から延期された主な原因であり、この遅延は競合他社に先行を許すことになりました。業界関係者は、性能の様々な差異を指摘しており、ファーウェイを含む中国製チップが、重要な分野で依然として米国の同等品に遅れをとっていると述べています。これらの欠点には、安定性の問題、チップ間接続の遅さ、Nvidiaの製品と比較して堅牢性に劣る付属ソフトウェアなどが報告されています。

ファーウェイはR2モデルの昇騰チップ上での開発を支援するためにエンジニアチームをDeepSeekのオフィスに派遣しましたが、共同の努力は成功した学習実行には至りませんでした。DeepSeekは、推論における昇騰とのモデル互換性を確保するため、ファーウェイと引き続き協力していると報じられており、可能な限り国産ハードウェアへの継続的なコミットメントを示しています。

これらの課題は社内でも注目されています。DeepSeekの創業者である梁文峰氏は、R2の進捗に不満を表明しており、急速に進化するAI分野で同社の競争優位性を維持できる高度なモデルを開発するためにより多くの時間とリソースを求めていると伝えられています。チップ関連の遅延に加えて、R2の発表は、更新されたモデルのデータラベリング要件が予想よりも長引いたことにも影響を受けました。これらの挫折にもかかわらず、中国メディアの報道では、モデルは今後数週間でまだリリースされる可能性があると示唆されています。

DeepSeekの苦境のより広範な背景には、北京が技術的自立を強化していることがあります。フィナンシャル・タイムズ紙は最近、中国のテクノロジー企業がNvidiaのH20チップの注文を正当化する必要があると報じました。これは、ファーウェイや寒武紀などの企業からの国内代替品を促進することを明確に目的とした動きです。この圧力は、進行中の地政学的競争において、自国開発技術に置かれる戦略的重要性を示します。

カリフォルニア大学バークレー校のAI研究者であるRitwik Gupta氏は、AI市場の動的な性質について、「モデルは簡単に交換できるコモディティである」とコメントしました。彼は、アリババのQwen3を強力で柔軟な代替品として挙げ、DeepSeekの推論能力を持つ学習アルゴリズムなどのコアコンセプトをうまく統合し、それらをより効率的にしていると述べました。ファーウェイのAIエコシステムを密接に監視しているGupta氏は、同社が学習目的で昇騰チップに「成長痛」を経験していることを認めました。しかし、彼はファーウェイの長期的な見通しについて楽観的であり、「今日、ファーウェイで学習された主要なモデルが見られないからといって、将来それが起こらないという意味ではありません。それは時間の問題です」と述べています。

一方、米中技術競争の中心的なプレーヤーであるNvidiaは、最近、米国政府と収益分配契約を結び、H20チップの中国への販売を再開することに合意しました。このチップメーカーは、勝利するAIエコシステムを構築する上での開発者の重要性を強調し、「市場全体と開発者を明け渡すことは、アメリカの経済と国家安全保障を損なうだけだ」と主張しました。DeepSeekとファーウェイのいずれも、この件に関するコメントの要求に応じていません。