Nvidia développe le B30A, une puce IA pour la Chine, plus puissante que H20

Indianexpress

Nvidia, le principal concepteur mondial de puces d’intelligence artificielle, développerait une nouvelle puce d’IA plus puissante spécifiquement pour le marché chinois. Cette décision intervient malgré les tensions géopolitiques persistantes et les contrôles d’exportation américains stricts visant à restreindre l’accès de la Chine aux technologies de pointe.

La nouvelle puce, provisoirement baptisée B30A, serait basée sur l’architecture avancée Blackwell de Nvidia, représentant un bond significatif par rapport au modèle H20, qui est actuellement la puce Nvidia la plus puissante légalement autorisée à la vente en Chine. Alors que le H20 utilise l’ancienne architecture Hopper de la société, le B30A est conçu avec une configuration à matrice unique (single-die). Cela signifie que ses composants centraux sont intégrés sur une seule pièce de silicium, un choix de conception qui devrait offrir environ la moitié de la puissance de calcul brute de la B300, la carte accélératrice phare à double matrice de Nvidia. Cependant, le B30A intégrera de la mémoire à large bande passante (HBM) et la technologie NVLink propriétaire de Nvidia, des fonctionnalités cruciales pour la transmission rapide des données entre les processeurs, similaires à la H20.

Des sources familières avec le dossier indiquent que les spécifications du B30A sont toujours en cours de finalisation, mais Nvidia vise à fournir des échantillons aux clients chinois pour des tests dès le mois prochain. Ce développement se déroule dans un contexte de relations commerciales complexes entre les États-Unis et la Chine, où l’accès aux puces d’IA avancées reste un point central de discorde. Malgré les récentes suggestions du président américain Donald Trump selon lesquelles une version réduite des puces Nvidia de nouvelle génération pourrait être autorisée en Chine — sous réserve d’un accord où Nvidia et son rival AMD partageraient 15 % de leurs revenus provenant de certaines ventes de puces avancées en Chine avec le gouvernement américain —, l’approbation réglementaire pour le B30A est loin d’être assurée. Des préoccupations profondes persistent à Washington concernant l’octroi à la Chine d’un accès excessif aux capacités d’intelligence artificielle avancées.

Les législateurs américains, de tout l’échiquier politique, expriment leur appréhension que même les versions restreintes de puces d’IA avancées puissent saper les efforts américains pour maintenir leur avance en intelligence artificielle. Inversement, Nvidia soutient que le maintien d’une présence sur le marché chinois est crucial. L’entreprise estime qu’il est vital de maintenir l’engagement des développeurs chinois avec ses puces et son écosystème logiciel pour les empêcher de migrer entièrement vers des alternatives nationales, telles que celles proposées par Huawei. Huawei a réalisé des progrès significatifs dans le développement de puces, ses derniers modèles égalant, selon les rapports, Nvidia dans certains aspects de la puissance de calcul, bien que les analystes notent qu’il est toujours en retard dans des domaines critiques comme le support de l’écosystème logiciel et la bande passante mémoire.

Les efforts de Nvidia pour naviguer dans cet équilibre délicat sont compliqués davantage par de récentes allégations des médias d’État chinois, qui ont suggéré que les puces américaines pourraient poser des risques de sécurité. Les autorités chinoises auraient mis en garde les entreprises technologiques nationales contre l’achat de la H20, une affirmation que Nvidia réfute, assurant que ses puces ne comportent aucun risque de “porte dérobée”. La H20 elle-même a eu un parcours turbulent ; développée spécifiquement pour la Chine suite aux restrictions d’exportation de 2023, ses ventes ont été brusquement interrompues en avril de cette année, pour que Nvidia reçoive la permission de reprendre les ventes en juillet.

Au-delà de la B30A, Nvidia se prépare également à expédier une autre nouvelle puce spécifique à la Chine, la RTX6000D, également basée sur son architecture Blackwell. Cette puce est principalement conçue pour les tâches d’inférence d’IA, qui impliquent l’application de modèles d’IA à des données du monde réel. Le RTX6000D devrait être moins cher que le H20, reflétant ses spécifications plus modestes et ses exigences de fabrication plus simples. De manière cruciale, sa conception adhère scrupuleusement aux seuils du gouvernement américain, présentant une mémoire GDDR conventionnelle et une bande passante mémoire de 1 398 gigaoctets par seconde, juste en dessous du seuil de 1,4 téraoctet établi par les restrictions d’avril qui avaient précédemment entraîné l’arrêt des ventes de la H20. De petits lots du RTX6000D devraient être livrés aux clients chinois en septembre, illustrant davantage la manœuvre stratégique de Nvidia pour maintenir sa part de marché tout en se conformant aux contrôles d’exportation en évolution.