DeepSeek délaisse Huawei pour Nvidia: L'échec des puces retarde l'IA R2
Le plan ambitieux de DeepSeek de former son nouveau modèle d’intelligence artificielle, R2, sur les puces Ascend de Huawei a échoué, forçant la firme chinoise d’IA à revenir à la technologie de Nvidia et retardant le lancement du modèle. Ce revers met en lumière les réalités techniques inéluctables qui peuvent défier la poussée de Pékin vers l’autosuffisance technologique.
Après le lancement réussi de son modèle R1 en janvier, DeepSeek s’est retrouvée sous une pression considérable pour défendre la cause nationale en adoptant du matériel domestique. Selon trois personnes ayant une connaissance directe de la situation, s’exprimant au Financial Times, la directive était sans ambiguïté : privilégier les puces de Huawei par rapport à celles de Nvidia.
Cependant, lorsque DeepSeek a commencé l’entraînement réel de son nouveau modèle R2, la société aurait rencontré des « problèmes techniques persistants » avec les puces d’IA de Huawei. Ces problèmes se sont avérés si fondamentaux que le projet a été mis à l’arrêt. Une source familière avec la situation a indiqué que ces défis insurmontables étaient la raison principale de l’abandon du lancement du modèle prévu en mai, laissant DeepSeek désavantagée sur un marché en évolution rapide.
Pour saisir l’importance de cet obstacle, il est crucial de distinguer entre l’entraînement et l’inférence en IA. L’entraînement est la phase profondément exigeante, comparable à des années d’apprentissage intensif de niveau universitaire, nécessitant une immense puissance de calcul et une stabilité inébranlable. L’inférence, en revanche, est la tâche comparativement moins ardue, comme poser une question à un diplômé – elle implique l’application d’un modèle entraîné à de nouvelles données. DeepSeek a découvert que si les puces de Huawei pouvaient être adéquates pour l’examen final (inférence), elles n’étaient pas encore capables de gérer les exigences rigoureuses du cours universitaire (entraînement). Par conséquent, l’entreprise n’a eu d’autre recours que de revenir aux systèmes plus robustes de Nvidia pour l’étape critique de l’entraînement. Des sources indiquent que l’équipe de DeepSeek tente toujours d’optimiser le modèle R2 pour l’étape d’inférence moins exigeante en utilisant des puces Huawei.
La gravité du problème a été soulignée par l’intervention directe de Huawei. Deux sources ont confirmé que Huawei a envoyé sa propre équipe d’ingénieurs dans les bureaux de DeepSeek pour aider à rendre le modèle R2 opérationnel sur leurs puces. Pourtant, même avec ces ressources expertes sur place, une exécution d’entraînement réussie est restée insaisissable.
Les observateurs de l’industrie reconnaissent largement que ce résultat n’est pas entièrement surprenant. Plus tôt cette année, le PDG de Huawei, Ren Zhengfei, a lui-même concédé que les États-Unis avaient « exagéré les réalisations de Huawei » et que l’entreprise « n’est pas encore si grande », admettant que ses meilleures puces ont toujours une génération de retard par rapport aux alternatives de pointe.
Malgré ces limitations techniques, Pékin continue d’encourager activement ses géants technologiques à privilégier le matériel local. Le Financial Times a rapporté que les entreprises chinoises sont désormais contraintes de justifier les commandes du puce H20 de Nvidia, conforme à l’exportation, qui est une variante moins puissante approuvée pour la vente en Chine. Cette stratégie vise à cultiver des champions nationaux, mais peut involontairement forcer les entreprises à faire des choix techniquement sous-optimaux, entravant potentiellement leur compétitivité mondiale.
Au-delà des défis posés par les puces de Huawei, le fondateur de DeepSeek, Liang Wenfeng, aurait exprimé son mécontentement quant aux progrès globaux du modèle R2, exhortant son équipe à viser plus haut et à développer un produit capable d’assurer la position de l’entreprise parmi les leaders de l’industrie de l’IA.
En fin de compte, l’expérience de DeepSeek sert de puissant rappel que dans la course mondiale à la suprématie de l’IA, les principes d’ingénierie et les réalités de performance l’emportent souvent sur les directives descendantes et la fierté nationale. Bien que la Chine joue le long terme dans sa quête d’indépendance technologique, dans un avenir prévisible, la couronne de la performance en matière de matériel d’IA reste fermement entre les mains de Nvidia.