DeepSeek kehrt zu Nvidia zurück: Huawei-Chip-Ausfall verzögert KI-Training von R2
DeepSeeks ehrgeiziger Plan, sein neues KI-Modell R2 auf Huaweis Ascend-Chips zu trainieren, ist ins Stocken geraten. Dies zwingt das chinesische KI-Unternehmen dazu, auf Nvidias Technologie zurückzugreifen und verzögert den Start des Modells. Dieser Rückschlag unterstreicht die unnachgiebigen technischen Realitäten, die Beijings Bestreben nach technologischer Selbstversorgung herausfordern können.
Nach dem erfolgreichen Start seines R1-Modells im Januar sah sich DeepSeek unter erheblichem Druck, die nationale Sache durch die Einführung heimischer Hardware zu unterstützen. Laut drei Personen mit direkter Kenntnis der Situation, die mit der Financial Times sprachen, war die Anweisung eindeutig: Huaweis Chips gegenüber Nvidias Chips zu priorisieren.
Als DeepSeek jedoch mit dem eigentlichen Training seines neuen R2-Modells begann, stieß das Unternehmen Berichten zufolge auf „anhaltende technische Probleme“ mit Huaweis KI-Chips. Diese Probleme erwiesen sich als so fundamental, dass das Projekt zum Stillstand kam. Eine mit der Situation vertraute Quelle deutete an, dass diese unüberwindbaren Herausforderungen der Hauptgrund für die Streichung des für Mai geplanten Starts des Modells waren, was DeepSeek in einem sich schnell entwickelnden Markt benachteiligt.
Um die Bedeutung dieses Hindernisses zu erfassen, ist es entscheidend, zwischen KI-Training und Inferenz zu unterscheiden. Training ist die zutiefst anspruchsvolle Phase, vergleichbar mit jahrelangem intensivem Universitätsstudium, die immense Rechenleistung und unerschütterliche Stabilität erfordert. Inferenz hingegen ist die vergleichsweise weniger anstrengende Aufgabe, wie einem Absolventen eine Frage zu stellen – es geht darum, ein trainiertes Modell auf neue Daten anzuwenden. DeepSeek stellte fest, dass Huaweis Chips zwar für die Abschlussprüfung (Inferenz) ausreichen könnten, aber noch nicht in der Lage waren, die strengen Anforderungen des Universitätskurses (Training) zu bewältigen. Folglich hatte das Unternehmen keine andere Wahl, als für die kritische Trainingsphase auf Nvidias robustere Systeme zurückzugreifen. Quellen deuten darauf hin, dass DeepSeeks Team immer noch versucht, das R2-Modell für die weniger anspruchsvolle Inferenzphase mit Huawei-Chips zu optimieren.
Die Schwere des Problems wurde durch Huaweis direktes Eingreifen unterstrichen. Zwei Quellen bestätigten, dass Huawei sein eigenes Ingenieurteam zu DeepSeeks Büros entsandte, um dabei zu helfen, das R2-Modell auf ihren Chips zum Laufen zu bringen. Doch selbst mit diesen Expertenressourcen vor Ort blieb ein erfolgreicher Trainingslauf schwer fassbar.
Branchenbeobachter erkennen weithin an, dass dieses Ergebnis nicht ganz überraschend ist. Anfang dieses Jahres gab Huaweis CEO Ren Zhengfei selbst zu, dass die USA „Huaweis Errungenschaften übertrieben“ hätten und dass das Unternehmen „noch nicht so großartig ist“, und räumte ein, dass seine besten Chips immer noch eine Generation hinter den führenden Alternativen zurückliegen.
Trotz dieser technischen Einschränkungen ermutigt Peking seine Technologiegiganten weiterhin aktiv, lokale Hardware zu bevorzugen. Die Financial Times hat berichtet, dass chinesische Firmen nun gezwungen sind, Bestellungen für Nvidias exportkonformen H20-Chip zu rechtfertigen, eine weniger leistungsstarke Variante, die für den Verkauf in China zugelassen ist. Diese Strategie zielt darauf ab, nationale Champions zu fördern, kann Unternehmen aber unbeabsichtigt zu technisch suboptimalen Entscheidungen zwingen, was ihre globale Wettbewerbsfähigkeit potenziell behindert.
Über die Herausforderungen durch Huaweis Chips hinaus soll DeepSeek-Gründer Liang Wenfeng Berichten zufolge seine Unzufriedenheit mit dem Gesamtfortschritt des R2-Modells geäußert haben und sein Team aufgefordert haben, höhere Ziele zu setzen und ein Produkt zu entwickeln, das die Position des Unternehmens unter den KI-Branchenführern sichern kann.
Letztendlich dient DeepSeeks Erfahrung als eindringliche Erinnerung daran, dass im globalen Rennen um die KI-Vorherrschaft Ingenieurprinzipien und Leistungsrealitäten oft Top-Down-Anweisungen und nationalen Stolz übertreffen. Während China bei seinem Streben nach technologischer Unabhängigkeit langfristig plant, bleibt die Leistungskrone in der KI-Hardware auf absehbare Zeit fest bei Nvidia.