DeepSeek R2 verzögert: Huawei-Chip-Probleme erzwingen NVIDIA-Nutzung

Insideainews

Die Veröffentlichung des mit Spannung erwarteten R2 Large Language Models von DeepSeek wurde Berichten zufolge verzögert, ein Rückschlag, der auf anhaltende Leistungsprobleme mit Huaweis Ascend-Prozessoren zurückgeführt wird. Diese Entwicklung, wie die Financial Times berichtet, unterstreicht die erheblichen Herausforderungen, denen Peking bei seinem ehrgeizigen Vorhaben gegenübersteht, amerikanische Technologie durch heimische Lösungen zu ersetzen.

Nach dem früheren Erfolg von DeepSeeks R1-Modell, das in der KI-Community beträchtliche Aufmerksamkeit erregte, haben chinesische Regierungsbeamte das Startup Berichten zufolge ermutigt, für die spätere R2-Entwicklung heimische Ascend-Chips zu verwenden, anstatt weiterhin NVIDIA-Prozessoren zu nutzen. DeepSeek stieß jedoch während des R2-Trainingsprozesses auf erhebliche technische Hürden, als versucht wurde, die Ascend-Chips zu verwenden. Diese Schwierigkeiten zwangen das Unternehmen letztendlich dazu, für die intensive Trainingsphase auf NVIDIA-Chips zurückzugreifen, während Huawei-Prozessoren weiterhin für die Inferenzphase – den Prozess der Anwendung des trainierten Modells auf neue Daten – geplant sind.

Diese strategische Neuausrichtung erfolgt inmitten einer breiteren Landschaft sich entwickelnder Exportvorschriften und innenpolitischer Zwänge innerhalb Chinas. Jüngste Anpassungen der US-Exportregeln haben den Versand bestimmter NVIDIA- und AMD-GPUs, insbesondere der NVIDIA H20 und AMD MI308, nach China ermöglicht. Diese Chips sollen Berichten zufolge eine Leistung bieten, die grob mit den in China entwickelten GPUs vergleichbar ist. Gleichzeitig gibt es Berichte, dass chinesische Behörden Unternehmen zunehmend unter die Lupe nehmen und Begründungen für ihre fortgesetzte Abhängigkeit von in Amerika hergestellten GPUs verlangen.

Von der Financial Times zitierte Quellen wiesen darauf hin, dass die Huawei-Prozessoren im Vergleich zu NVIDIAs Angeboten mehrere kritische Mängel aufwiesen, darunter Stabilitätsprobleme, langsamere Inter-Chip-Konnektivität und minderwertige Begleitsoftware. Um diese Hindernisse zu überwinden, arbeitete Berichten zufolge ein Team von Huawei-Technikern direkt vor Ort mit DeepSeek zusammen. Trotz dieser konzertierten Bemühungen konnte ein erfolgreicher Trainingslauf auf den Ascend-Prozessoren nicht erreicht werden.

Die Situation verdeutlicht das komplexe Zusammenspiel zwischen nationalen strategischen Zielen, technologischen Fähigkeiten und Marktgegebenheiten. Während China aggressiv die Selbstversorgung mit kritischen Technologien anstrebt, deutet der Fall DeepSeek darauf hin, dass die Leistungslücke bei fortschrittlichen KI-Beschleunigern ein erhebliches Hindernis bleibt. Der Bericht der Financial Times deutet darauf hin, dass DeepSeeks R2-Modell in den kommenden Wochen noch veröffentlicht werden könnte, vermutlich nach erfolgreichem Training auf NVIDIA-Hardware.