DeepSeek: KI-Modell scheitert an Huawei-Chip-Training, Start verzögert

Arstechnica

Das chinesische Künstliche-Intelligenz-Unternehmen DeepSeek hat Berichten zufolge die Einführung seines neuen R2-Modells verschoben. Dieser Rückschlag wird anhaltenden technischen Schwierigkeiten zugeschrieben, die beim Versuch, das Modell mit Huaweis Ascend-Prozessoren zu trainieren, auftraten. Die Verzögerung unterstreicht die erheblichen Hürden, denen Peking in seinem ehrgeizigen Bestreben gegenübersteht, ausländische, insbesondere US-amerikanische, Technologie durch heimische Alternativen zu ersetzen.

Quellen, die mit der Situation vertraut sind, weisen darauf hin, dass chinesische Behörden DeepSeek nach der Veröffentlichung seines R1-Modells im Januar ermutigt hatten, Huaweis Ascend-Chips für sein R2-Modell zu verwenden, um es von den vorherrschenden Nvidia-Systemen wegzulenken. DeepSeek stieß jedoch während der intensiven Trainingsphase seines R2-Modells mit Ascend-Chips schnell auf Probleme. Folglich griff das Unternehmen auf Nvidia-Chips für den entscheidenden Trainingsprozess zurück und behielt Huaweis Chips für die weniger anspruchsvolle Inferenzphase – wo ein trainiertes Modell sein Wissen anwendet, um Vorhersagen oder Antworten zu generieren, wie z.B. bei einer Chatbot-Anfrage.

Die technischen Probleme mit Huaweis Hardware waren der Hauptgrund für die Verschiebung des R2-Modellstarts von Mai, eine Verzögerung, die es Konkurrenten ermöglichte, Boden gutzumachen. Brancheninsider verweisen auf eine Reihe von Leistungsunterschieden und stellen fest, dass chinesische Chips, einschließlich der von Huawei, in kritischen Bereichen immer noch hinter ihren US-amerikanischen Pendants zurückbleiben. Diese Mängel umfassen Berichten zufolge Stabilitätsprobleme, langsamere Inter-Chip-Konnektivität und weniger robuste Begleitsoftware im Vergleich zu Nvidias Angeboten.

Obwohl Huawei ein Team von Ingenieuren in die Büros von DeepSeek entsandte, um bei der Entwicklung des R2-Modells auf Ascend-Chips zu unterstützen, führten die gemeinsamen Anstrengungen nicht zu einem erfolgreichen Trainingsdurchlauf. DeepSeek arbeitet Berichten zufolge weiterhin mit Huawei zusammen, um die Kompatibilität des Modells mit Ascend für die Inferenz sicherzustellen, was ein anhaltendes Engagement für heimische Hardware, wo immer dies machbar ist, zeigt.

Die Herausforderungen sind intern nicht unbemerkt geblieben. DeepSeek-Gründer Liang Wenfeng hat seine Unzufriedenheit mit dem Fortschritt des R2 ausgedrückt und Berichten zufolge mehr Zeit und Ressourcen für die Entwicklung eines fortschrittlichen Modells gefordert, das die Wettbewerbsfähigkeit des Unternehmens in der sich schnell entwickelnden KI-Landschaft aufrechterhalten kann. Zusätzlich zu den chipbedingten Verzögerungen wurde der R2-Start auch durch länger als erwartete Datenkennzeichnungsanforderungen für sein aktualisiertes Modell beeinträchtigt. Trotz dieser Rückschläge deuten chinesische Medienberichte darauf hin, dass das Modell in den kommenden Wochen noch veröffentlicht werden könnte.

Der breitere Kontext für DeepSeeks Schwierigkeiten ist Pekings verstärktes Streben nach technologischer Selbstständigkeit. Die Financial Times berichtete kürzlich, dass chinesische Technologieunternehmen nun ihre Bestellungen von Nvidias H20-Chips begründen müssen, eine Maßnahme, die ausdrücklich darauf abzielt, heimische Alternativen von Unternehmen wie Huawei und Cambricon zu fördern. Dieser Druck unterstreicht die strategische Bedeutung, die der Eigenentwicklung von Technologie im anhaltenden geopolitischen Wettbewerb beigemessen wird.

Ritwik Gupta, ein KI-Forscher an der University of California, Berkeley, kommentierte die dynamische Natur des KI-Marktes und stellte fest, dass „Modelle Güter sind, die leicht ausgetauscht werden können“. Er zitierte Alibabas Qwen3 als eine leistungsstarke und flexible Alternative, die DeepSeeks Kernkonzepte, wie seinen resonanzfähigen Trainingsalgorithmus, erfolgreich integriert hat, wodurch sie effizienter wurden. Gupta, der Huaweis KI-Ökosystem genau überwacht, räumte ein, dass das Unternehmen mit Ascend-Chips für Trainingszwecke „Wachstumsschmerzen“ erlebt. Er bleibt jedoch optimistisch hinsichtlich Huaweis langfristiger Aussichten und erklärt: „Nur weil wir heute keine führenden Modelle auf Huawei trainiert sehen, bedeutet das nicht, dass dies in Zukunft nicht geschehen wird. Es ist eine Frage der Zeit.“

Unterdessen hat Nvidia, ein zentraler Akteur in der technologischen Rivalität zwischen den USA und China, kürzlich eine Umsatzbeteiligungsvereinbarung mit der US-Regierung getroffen, um den Verkauf seiner H20-Chips an China wieder aufzunehmen. Der Chiphersteller hat die Bedeutung von Entwicklern beim Aufbau eines erfolgreichen KI-Ökosystems betont und argumentiert, dass „die Preisgabe ganzer Märkte und Entwickler nur der amerikanischen Wirtschafts- und nationalen Sicherheit schaden würde“. Weder DeepSeek noch Huawei reagierten auf Anfragen zur Stellungnahme in dieser Angelegenheit.