DeepSeek R2 Retardé : Problèmes de Puces Huawei Forcent l'Usage de NVIDIA

Insideainews

La sortie du modèle de langage étendu R2 de DeepSeek, très attendu, aurait été retardée, un revers attribué à des problèmes de performance persistants avec les processeurs Ascend de Huawei. Ce développement, tel que rapporté par le Financial Times, souligne les défis importants auxquels Pékin est confronté dans sa volonté ambitieuse de remplacer la technologie américaine par des solutions développées localement.

Suite au succès antérieur du modèle R1 de DeepSeek, qui avait suscité une attention considérable au sein de la communauté de l’IA, des fonctionnaires du gouvernement chinois auraient encouragé la startup à utiliser des puces Ascend nationales pour son développement ultérieur du R2, plutôt que de continuer avec les processeurs NVIDIA. Cependant, DeepSeek a rencontré des obstacles techniques substantiels pendant le processus d’entraînement du R2 en tentant d’utiliser les puces Ascend. Ces difficultés ont finalement contraint l’entreprise à revenir aux puces NVIDIA pour la phase d’entraînement intensive, tout en prévoyant toujours d’utiliser les processeurs de Huawei pour l’étape d’inférence – le processus d’application du modèle entraîné à de nouvelles données.

Ce pivot stratégique intervient dans un contexte plus large d’évolution des réglementations d’exportation et de pressions internes en Chine. Des ajustements récents aux règles d’exportation américaines ont permis l’expédition de certaines GPU NVIDIA et AMD, spécifiquement les NVIDIA H20 et AMD MI308, vers la Chine. Ces puces seraient conçues pour offrir des performances à peu près comparables à celles des GPU développées en Chine. Parallèlement, il est rapporté que les autorités chinoises examinent de plus en plus les entreprises, leur demandant des justifications pour leur dépendance continue aux GPU de fabrication américaine.

Des sources citées par le Financial Times ont indiqué que les processeurs Huawei présentaient plusieurs déficiences critiques par rapport aux offres de NVIDIA, notamment des problèmes de stabilité, une connectivité inter-puces plus lente et des logiciels d’accompagnement inférieurs. Dans un effort pour surmonter ces obstacles, une équipe de techniciens de Huawei aurait collaboré directement avec DeepSeek sur site. Malgré ces efforts concertés, une exécution d’entraînement réussie sur les processeurs Ascend n’a pas pu être réalisée.

La situation met en lumière l’interaction complexe entre les objectifs stratégiques nationaux, les capacités technologiques et les réalités du marché. Alors que la Chine poursuit agressivement l’autosuffisance dans les technologies critiques, le cas DeepSeek suggère que l’écart de performance dans les accélérateurs d’IA avancés reste un obstacle significatif. Le rapport du Financial Times indique que le modèle R2 de DeepSeek pourrait encore être publié dans les semaines à venir, vraisemblablement après son entraînement réussi sur le matériel NVIDIA.

DeepSeek R2 Retardé : Problèmes de Puces Huawei Forcent l'Usage de NVIDIA - OmegaNext Actualités IA