深度智元AI模型受阻:华为芯片训练遇困,凸显英伟达依赖

Ft

中国人工智能初创公司深度智元(DeepSeek)雄心勃勃地推动其下一代AI模型R2使用国产华为半导体进行训练,但此举遭遇了重大障碍,导致模型发布延迟,并鲜明地凸显了全球AI产业对英伟达(Nvidia)先进芯片技术的根深蒂固的依赖。深度智元的R2模型原定于2025年5月发布,但在使用华为昇腾(Ascend)芯片进行训练时遇到了“持续的”技术挑战,迫使该公司不得不重新转向英伟达硬件来完成这一关键过程。

这一挫折凸显了在中国企业寻求技术自给自足的道路上,面对美国不断升级的先进芯片技术出口管制所面临的巨大障碍。北京一直积极鼓励国内AI公司减少对外国供应商(尤其是美国供应商)的依赖,以培育国内生态系统。深度智元在2025年1月成功发布了其R1模型(主要依赖英伟达H20芯片)之后,也曾被敦促在其后续项目中采用华为昇腾处理器。

尽管华为派遣了一支工程师团队协助深度智元,但在昇腾芯片上成功完成训练仍遥不可及。虽然深度智元仍在与华为合作,以确保R2模型在推理任务上与昇腾兼容,但核心训练(需要巨大的计算能力和强大的软件环境)仍离不开英伟达。这种情况并非深度智元独有;业内人士普遍承认,包括华为昇腾系列在内的中国制造芯片在稳定性、芯片间互联以及至关重要的软件生态系统成熟度等关键领域仍落后于英伟达的产品。据报道,华为旨在与英伟达无处不在的CUDA抗衡的CANN平台,也给开发者带来了困难和不稳定性。

英伟达在AI芯片市场经久不衰的主导地位主要源于其全面的CUDA平台。这一专有并行计算框架提供了无与伦比的软件生态系统,提供卓越的性能、广泛的开发工具和广泛的行业支持,已成为AI开发的事实标准。即使竞争对手的芯片能够提供可比的原始处理能力,英伟达为深度学习优化的CUDA内核也能确保更高的利用率,使其GPU成为大规模AI模型训练的首选。硬件与软件的集成协同作用,以NVLink等技术为例,进一步巩固了英伟达的优势地位,使得其他硬件若没有同样成熟且广泛采用的软件堆栈,将极难有效竞争。

深度智元面临的挑战凸显了中美之间正在进行的“芯片战争”的更广泛影响。虽然美国的出口管制旨在限制中国获取尖端AI技术,但它们也无意中刺激了中国在半导体领域进行本土创新和自力更生的动力。然而,性能差距依然存在,包括字节跳动、腾讯和阿里巴巴等科技巨头在内的中国公司,仍然严重依赖英伟达的H20芯片进行其先进AI模型训练。目前的局面生动地说明,尽管有大量的政府投资和政策压力,但弥合这一技术鸿沟,特别是在AI芯片训练及其配套软件生态系统这一复杂领域,是一项需要多年才能完成的工作。深度智元R2模型的延迟发布,鲜明地提醒着人们,在地缘政治抱负与人工智能快速发展世界中先进技术开发的实际现实之间,存在着错综复杂的平衡。