Nvidia H20 de retour, Huawei booste les puces IA: Tensions USA-Chine

Aiwire

Le paysage des relations entre les États-Unis et la Chine en matière d’intelligence artificielle a connu des développements significatifs cette semaine, marqués par le nouvel accès de Nvidia au marché chinois, les avancées de Huawei en matière de matériel d’IA domestique et une pénalité substantielle infligée à Cadence Design Systems pour violations des exportations. Ces événements soulignent la concurrence continue et l’équilibre complexe entre le progrès technologique, la sécurité nationale et les intérêts économiques.

Nvidia reprend ses livraisons de H20 vers la Chine

Nvidia a obtenu l’approbation pour reprendre l’expédition de ses accélérateurs d’IA H20 aux constructeurs de cloud chinois, une inversion d’une interdiction d’exportation antérieure. Cette décision intervient après des négociations qui seraient liées au commerce des minéraux de terres rares, malgré les critiques de certains législateurs américains qui mettent en garde contre l’érosion potentielle du leadership technologique américain. Le H20, bien que moins puissant que les puces phares H100 ou Blackwell de Nvidia, reste l’accélérateur d’IA le plus avancé que Nvidia est légalement autorisé à exporter vers la Chine, conçu spécifiquement pour se conformer aux contrôles d’exportation américains.

Suite à l’approbation, Nvidia a passé une commande de 300 000 puces H20 AI auprès de TSMC, s’ajoutant à un stock existant de 600 000 à 700 000 unités, indiquant une forte demande de la part des clients chinois. Des géants technologiques chinois tels que Tencent, ByteDance et Alibaba avaient précédemment passé d’importantes commandes de H20 et attendent l’approbation de licence du Département du Commerce, que Nvidia anticipe d’obtenir prochainement. Cependant, les responsables américains n’ont pas encore formellement confirmé ces approbations. Le PDG de Nvidia, Jensen Huang, a déclaré que la production future de H20 dépendrait de la demande du marché, notant que le redémarrage de la fabrication de plaquettes pourrait prendre jusqu’à neuf mois en raison des annulations de capacité pendant la pause d’exportation. Cette reprise des expéditions est considérée par l’administration Trump comme un compromis stratégique visant à assurer l’accès des États-Unis aux exportations chinoises de terres rares.

Huawei déploie des capacités d’IA domestiques avec CloudMatrix 384

Dans une démonstration claire de la poussée de la Chine vers des solutions d’IA domestiques, Huawei a discrètement dévoilé son cluster d’IA CloudMatrix 384 lors de la Conférence mondiale sur l’intelligence artificielle à Shanghai la semaine dernière. Ce système, propulsé par 384 des NPU Ascend 910C propriétaires de Huawei, est positionné comme une alternative domestique aux racks GB200 NVL72 basés sur Blackwell de Nvidia. Le CloudMatrix 384 utilise un tissu maillé UB unique, reliant un nombre significativement plus élevé d’accélérateurs que le système comparable de Nvidia.

Sur le papier, le CloudMatrix 384 affiche des performances impressionnantes, produisant environ 40 % de débit FP16 de plus qu’un NVL72, bien que chaque puce Ascend ne délivre qu’environ un tiers de la performance par puce d’un GPU B200. Huawei compense cet écart de performance des puces individuelles en utilisant un plus grand nombre de processeurs et en incorporant de la mémoire à large bande passante supplémentaire pour un mouvement de données plus rapide. Cette conception, cependant, entraîne une consommation d’énergie substantiellement plus élevée, environ 600 kW, soit environ quatre fois celle d’un NVL72, et un coût unitaire plus élevé d’environ 8,2 millions de dollars par supernœud de 16 racks, plus du double du prix catalogue de Nvidia.

Le logiciel reste un défi important pour Huawei. Bien que sa pile compatible MindSpore/PyTorch prenne désormais en charge ONNX et d’autres frameworks LLM populaires, elle est toujours à la traîne par rapport à l’écosystème CUDA bien établi de Nvidia. Huawei investit activement dans des “abstractions de niveau supérieur” pour simplifier la migration de code et promeut des “charges de travail prioritaires pour la Chine” comme le LLM DeepSeek-R1, optimisées pour le matériel Ascend. Malgré ces efforts, le coût et la complexité de la migration des bases de code existantes des GPU Nvidia continuent de ralentir l’adoption généralisée des systèmes Huawei. Le CloudMatrix de Huawei semble cibler les grands centres de données d’IA soutenus par l’État en Chine, qui pourraient privilégier les chaînes d’approvisionnement nationales et la performance plutôt que l’efficacité énergétique ou l’interopérabilité mondiale.

Cadence fait face à une pénalité pour violations des exportations

Alors que les entreprises chinoises progressent dans leur matériel d’IA domestique, les régulateurs américains font preuve d’une application plus stricte des règles d’exportation. Cadence Design Systems a accepté de plaider coupable et de payer plus de 140 millions de dollars en pénalités criminelles et civiles combinées pour avoir vendu des logiciels et du matériel d’automatisation de conception électronique (EDA) à l’Université Nationale de Technologie de Défense (NUDT) de Chine via des sociétés écrans entre 2015 et 2021. La NUDT figure sur la liste des entités du Département du Commerce américain depuis février 2015, en raison de la suspicion que ses supercalculateurs soutiennent la simulation d’explosions nucléaires et les activités militaires.

L’accord de plaidoyer comprend une période de probation de trois ans, la confiscation et des rapports de conformité stricts. Les enquêteurs ont révélé que les filiales de Cadence ont effectué au moins 56 exportations illégales et ont ensuite transféré des outils à Phytium Technology, un autre fabricant de puces lié à la NUDT. Cette affaire met en lumière la double approche de Washington : autoriser certaines exportations de technologies limitées, comme le H20 de Nvidia, tout en appliquant simultanément des sanctions strictes pour les violations afin de dissuader les transferts illicites de technologies sensibles. Le gouvernement américain souligne l’importance de protéger le savoir-faire technologique américain contre les mauvaises mains, en particulier en ce qui concerne les applications militaires.

Implications plus larges pour les relations d’IA entre les États-Unis et la Chine

Ces développements récents soulignent la dynamique complexe et évolutive des relations d’IA entre les États-Unis et la Chine. Les États-Unis visent à maintenir leur leadership technologique par le biais de contrôles d’exportation, tandis que la Chine poursuit agressivement l’autosuffisance et l’innovation domestique en matière de matériel et de logiciel d’IA. La réintégration des puces H20 de Nvidia sur le marché chinois, aux côtés du puissant système CloudMatrix de Huawei, illustre la concurrence continue pour les parts de marché et la suprématie technologique. Parallèlement, les actions d’application de la loi contre des entreprises comme Cadence signalent un engagement continu des États-Unis à empêcher le transfert non autorisé de technologies sensibles susceptibles de renforcer les capacités militaires de la Chine. La “course à l’IA” entre les deux nations n’est pas seulement économique, mais a également d’importantes implications géopolitiques et de sécurité nationale, influençant les stratégies militaires, les opérations de renseignement et la dynamique du pouvoir mondial.