DeepSeek: Le modèle IA échoue sur puces Huawei, lancement retardé

Arstechnica

La firme chinoise d’intelligence artificielle DeepSeek aurait reporté le lancement de son nouveau modèle R2, un revers attribué à des difficultés techniques persistantes rencontrées lors de la tentative de l’entraîner à l’aide des processeurs Ascend de Huawei. Ce retard souligne les obstacles significatifs auxquels Pékin est confronté dans sa volonté ambitieuse de remplacer la technologie étrangère, en particulier américaine, par des alternatives nationales.

Des sources proches de la situation indiquent que les autorités chinoises avaient encouragé DeepSeek à adopter les puces Ascend de Huawei pour son modèle R2, après le lancement de son modèle R1 en janvier, l’éloignant ainsi des systèmes Nvidia prédominants. Cependant, DeepSeek a rapidement rencontré des problèmes lors de la phase d’entraînement intensif de son modèle R2 avec les puces Ascend. En conséquence, l’entreprise a eu recours à l’utilisation de puces Nvidia pour le processus d’entraînement crucial, réservant les puces de Huawei pour l’étape d’inférence moins exigeante — où un modèle entraîné applique ses connaissances pour générer des prédictions ou des réponses, comme une requête de chatbot.

Les problèmes techniques avec le matériel de Huawei ont été la cause principale du report du lancement du modèle R2 depuis mai, un délai qui a permis aux rivaux de gagner du terrain. Les initiés de l’industrie soulignent une série de disparités de performance, notant que les puces chinoises, y compris celles de Huawei, sont toujours à la traîne par rapport à leurs homologues américaines dans des domaines critiques. Ces déficiences incluraient, selon les rapports, des problèmes de stabilité, une connectivité inter-puces plus lente et un logiciel d’accompagnement moins robuste par rapport aux offres de Nvidia.

Bien que Huawei ait dépêché une équipe d’ingénieurs dans les bureaux de DeepSeek pour aider au développement du modèle R2 sur les puces Ascend, les efforts de collaboration n’ont pas abouti à un entraînement réussi. DeepSeek travaillerait toujours avec Huawei pour assurer la compatibilité du modèle avec Ascend pour l’inférence, ce qui indique un engagement continu envers le matériel national lorsque cela est faisable.

Les défis n’ont pas passé inaperçus en interne. Le fondateur de DeepSeek, Liang Wenfeng, a exprimé son insatisfaction quant aux progrès du R2, faisant apparemment pression pour obtenir plus de temps et de ressources afin de développer un modèle avancé capable de maintenir l’avantage concurrentiel de l’entreprise dans le paysage de l’IA en rapide évolution. En plus des retards liés aux puces, le lancement du R2 a également été impacté par des exigences d’étiquetage des données plus longues que prévu pour son modèle mis à jour. Malgré ces revers, les médias chinois suggèrent que le modèle pourrait encore être publié dans les semaines à venir.

Le contexte plus large des difficultés de DeepSeek est la poussée intensifiée de Pékin vers l’autonomie technologique. Le Financial Times a récemment rapporté que les entreprises technologiques chinoises sont désormais tenues de justifier leurs commandes de puces H20 de Nvidia, une mesure visant explicitement à promouvoir les alternatives nationales d’entreprises comme Huawei et Cambricon. Cette pression souligne l’importance stratégique accordée à la technologie locale dans la compétition géopolitique actuelle.

Ritwik Gupta, chercheur en IA à l’Université de Californie, Berkeley, a commenté la nature dynamique du marché de l’IA, notant que “les modèles sont des commodités qui peuvent être facilement échangées”. Il a cité le Qwen3 d’Alibaba comme une alternative puissante et flexible qui a intégré avec succès les concepts fondamentaux de DeepSeek, tels que son algorithme d’entraînement capable de raisonnement, les rendant plus efficaces. Gupta, qui surveille de près l’écosystème IA de Huawei, a reconnu que l’entreprise connaît des “douleurs de croissance” avec les puces Ascend à des fins d’entraînement. Cependant, il reste optimiste quant aux perspectives à long terme de Huawei, déclarant : “Ce n’est pas parce que nous ne voyons pas aujourd’hui de modèles de pointe entraînés sur Huawei que cela n’arrivera pas à l’avenir. C’est une question de temps.”

Pendant ce temps, Nvidia, un acteur central de la rivalité technologique entre les États-Unis et la Chine, a récemment accepté un accord de partage de revenus avec le gouvernement américain pour reprendre les ventes de ses puces H20 à la Chine. Le fabricant de puces a souligné l’importance des développeurs dans la construction d’un écosystème IA gagnant, arguant que “céder des marchés entiers et des développeurs ne ferait que nuire à la sécurité économique et nationale américaine”. Ni DeepSeek ni Huawei n’ont répondu aux demandes de commentaires sur la question.