深度探索R2 AI训练重回英伟达：华为芯片故障致延期，中国技术自给自足遇挫

深度探索（DeepSeek）雄心勃勃地计划使用华为昇腾芯片训练其新型人工智能模型R2，但该计划受挫，迫使这家中国人工智能公司转回英伟达的技术，并推迟了模型的发布。这一挫折凸显了顽固的技术现实，这些现实可能挑战北京推动技术自给自足的努力。

在1月份成功推出R1模型后，深度探索面临巨大压力，需通过采用国产硬件来捍卫国家事业。据三位直接了解情况的人士向《金融时报》透露，指令明确：优先使用华为芯片而非英伟达芯片。

然而，当深度探索开始实际训练其新型R2模型时，据报道该公司在华为AI芯片上遇到了“持续的技术问题”。这些问题非常根本性，导致项目停滞。一位熟悉情况的消息人士表示，这些难以克服的挑战是取消模型原定于5月发布的主要原因，使深度探索在一个快速发展的市场中处于不利地位。

要理解这一障碍的重要性，区分AI训练和推理至关重要。训练是极其严苛的阶段，类似于多年密集的大学水平学习，需要巨大的计算能力和坚定的稳定性。相比之下，推理是相对轻松的任务，就像向毕业生提问一样——它涉及将训练好的模型应用于新数据。深度探索发现，虽然华为的芯片可能足以应对期末考试（推理），但它们尚无法处理大学课程的严苛要求（训练）。因此，该公司别无选择，只能转回英伟达更强大的系统进行关键的训练阶段。消息人士指出，深度探索的团队仍在尝试使用华为芯片优化R2模型以适应要求较低的推理阶段。

华为的直接干预凸显了问题的严重性。两位消息人士证实，华为派出了自己的工程师团队前往深度探索的办公室，协助R2模型在其芯片上运行。然而，即使有这些专家资源在现场，成功的训练运行仍然难以实现。

业内观察人士普遍认为，这一结果并不完全令人意外。今年早些时候，华为首席执行官任正非本人承认，美国“夸大了华为的成就”，并且该公司“还没有那么伟大”，承认其最好的芯片仍然落后于领先替代品一代。

尽管存在这些技术限制，北京仍继续积极鼓励其科技巨头青睐本地硬件。《金融时报》报道称，中国公司现在被迫解释订购英伟达符合出口规定的H20芯片的原因，这是一种获准在中国销售的性能较低的变体。这一策略旨在培养国内龙头企业，但可能在无意中迫使公司做出技术上次优的选择，从而可能阻碍其全球竞争力。

除了华为芯片带来的挑战，深度探索创始人梁文锋据报道对R2模型的整体进展表示不满，敦促其团队设定更高目标，开发出能确保公司在AI行业领导者中地位的产品。

最终，深度探索的经验有力地提醒我们，在全球AI霸权竞赛中，工程原理和性能现实往往胜过自上而下的指令和民族自豪感。尽管中国在追求技术独立方面着眼长远，但在可预见的未来，AI硬件的性能桂冠仍牢牢掌握在英伟达手中。

深度探索R2 AI训练重回英伟达：华为芯片故障致延期，中国技术自给自足遇挫

相关文章

OpenAI开源核心AI模型：科技竞争战略大转折

AMD发布笔记本端侧AI模型生成器，图像秒级生成

DeepSeek AI模型华为芯片训练受挫，发布延期