深度探索R2 AI训练重回英伟达:华为芯片故障致延期,中国技术自给自足遇挫

Artificialintelligence

深度探索(DeepSeek)雄心勃勃地计划使用华为昇腾芯片训练其新型人工智能模型R2,但该计划受挫,迫使这家中国人工智能公司转回英伟达的技术,并推迟了模型的发布。这一挫折凸显了顽固的技术现实,这些现实可能挑战北京推动技术自给自足的努力。

在1月份成功推出R1模型后,深度探索面临巨大压力,需通过采用国产硬件来捍卫国家事业。据三位直接了解情况的人士向《金融时报》透露,指令明确:优先使用华为芯片而非英伟达芯片。

然而,当深度探索开始实际训练其新型R2模型时,据报道该公司在华为AI芯片上遇到了“持续的技术问题”。这些问题非常根本性,导致项目停滞。一位熟悉情况的消息人士表示,这些难以克服的挑战是取消模型原定于5月发布的主要原因,使深度探索在一个快速发展的市场中处于不利地位。

要理解这一障碍的重要性,区分AI训练和推理至关重要。训练是极其严苛的阶段,类似于多年密集的大学水平学习,需要巨大的计算能力和坚定的稳定性。相比之下,推理是相对轻松的任务,就像向毕业生提问一样——它涉及将训练好的模型应用于新数据。深度探索发现,虽然华为的芯片可能足以应对期末考试(推理),但它们尚无法处理大学课程的严苛要求(训练)。因此,该公司别无选择,只能转回英伟达更强大的系统进行关键的训练阶段。消息人士指出,深度探索的团队仍在尝试使用华为芯片优化R2模型以适应要求较低的推理阶段。

华为的直接干预凸显了问题的严重性。两位消息人士证实,华为派出了自己的工程师团队前往深度探索的办公室,协助R2模型在其芯片上运行。然而,即使有这些专家资源在现场,成功的训练运行仍然难以实现。

业内观察人士普遍认为,这一结果并不完全令人意外。今年早些时候,华为首席执行官任正非本人承认,美国“夸大了华为的成就”,并且该公司“还没有那么伟大”,承认其最好的芯片仍然落后于领先替代品一代。

尽管存在这些技术限制,北京仍继续积极鼓励其科技巨头青睐本地硬件。《金融时报》报道称,中国公司现在被迫解释订购英伟达符合出口规定的H20芯片的原因,这是一种获准在中国销售的性能较低的变体。这一策略旨在培养国内龙头企业,但可能在无意中迫使公司做出技术上次优的选择,从而可能阻碍其全球竞争力。

除了华为芯片带来的挑战,深度探索创始人梁文锋据报道对R2模型的整体进展表示不满,敦促其团队设定更高目标,开发出能确保公司在AI行业领导者中地位的产品。

最终,深度探索的经验有力地提醒我们,在全球AI霸权竞赛中,工程原理和性能现实往往胜过自上而下的指令和民族自豪感。尽管中国在追求技术独立方面着眼长远,但在可预见的未来,AI硬件的性能桂冠仍牢牢掌握在英伟达手中。