DeepSeek KI-Modell verzögert: Huawei-Chip-Training scheitert
Der ehrgeizige Vorstoß des chinesischen Startups für künstliche Intelligenz DeepSeek, sein KI-Modell der nächsten Generation, R2, mithilfe heimischer Huawei-Halbleiter zu trainieren, ist auf ein erhebliches Hindernis gestoßen. Dies verzögert die Veröffentlichung und unterstreicht deutlich die tief verwurzelte Abhängigkeit der globalen KI-Industrie von Nvidias fortschrittlicher Chip-Technologie. Ursprünglich für eine Markteinführung im Mai 2025 vorgesehen, stieß DeepSeeks R2-Modell während seiner Trainingsphase mit Huaweis Ascend-Chips auf “anhaltende” technische Herausforderungen, was das Unternehmen zwang, für diesen entscheidenden Prozess auf Nvidia-Hardware zurückzugreifen.
Dieser Rückschlag verdeutlicht die gewaltigen Hürden, denen chinesische Firmen bei ihrem Streben nach technologischer Selbstversorgung inmitten eskalierender US-Exportkontrollen für fortschrittliche Chip-Technologie gegenüberstehen. Peking hat lokale KI-Unternehmen aktiv ermutigt, ihre Abhängigkeit von ausländischen, insbesondere amerikanischen, Lieferanten zu reduzieren und einheimische Ökosysteme zu fördern. DeepSeek gehörte nach dem erfolgreichen Start seines R1-Modells im Januar 2025, das weitgehend auf Nvidias H20-Chips basierte, zu jenen, die aufgefordert wurden, Huaweis Ascend-Prozessoren für ihre nachfolgenden Projekte zu nutzen.
Obwohl Huawei ein Team von Ingenieuren zur Unterstützung von DeepSeek entsandte, erwies sich ein erfolgreicher Trainingslauf auf dem Ascend-Chip als schwer fassbar. Während DeepSeek weiterhin mit Huawei zusammenarbeitet, um die Kompatibilität des R2-Modells mit Ascend für Inferenzaufgaben sicherzustellen, bleibt das Kerntraining, das immense Rechenleistung und eine robuste Softwareumgebung erfordert, an Nvidia gebunden. Diese Situation ist nicht einzigartig für DeepSeek; Brancheninsider bestätigen weitgehend, dass chinesische Chips, einschließlich Huaweis Ascend-Serie, in kritischen Bereichen wie Stabilität, Inter-Chip-Konnektivität und, entscheidend, der Reife des Software-Ökosystems immer noch hinter Nvidias Angeboten zurückbleiben. Huaweis CANN-Plattform, die als Rivale zu Nvidias allgegenwärtigem CUDA gedacht ist, hat Berichten zufolge Schwierigkeiten und Instabilität für Entwickler mit sich gebracht.
Nvidias anhaltende Dominanz auf dem KI-Chip-Markt beruht hauptsächlich auf seiner umfassenden CUDA-Plattform. Dieses proprietäre Parallel-Computing-Framework bietet ein unvergleichliches Software-Ökosystem mit unübertroffener Leistung, umfangreichen Entwicklertools und breiter Branchenunterstützung, die zum De-facto-Standard für die KI-Entwicklung geworden ist. Selbst wenn konkurrierende Chips eine vergleichbare Rohverarbeitungsleistung bieten können, gewährleisten Nvidias für Deep Learning optimierte CUDA-Kerne überlegene Auslastungsraten, was seine GPUs zur bevorzugten Wahl für das Training großer KI-Modelle macht. Die integrierte Hardware-Software-Synergie, veranschaulicht durch Technologien wie NVLink, festigt Nvidias Vormachtstellung weiter und macht es für alternative Hardware unglaublich schwierig, ohne einen ähnlich ausgereiften und weit verbreiteten Software-Stack effektiv zu konkurrieren.
Die Herausforderungen, denen sich DeepSeek gegenübersieht, unterstreichen die umfassenderen Auswirkungen des anhaltenden “Chip-Krieges” zwischen den USA und China. Während die US-Exportkontrollen darauf abzielen, Chinas Zugang zu modernster KI-Technologie einzuschränken, haben sie auch unbeabsichtigt Chinas Streben nach indigener Innovation und Selbstständigkeit in seinem Halbleitersektor angekurbelt. Die Leistungs Lücke bleibt jedoch bestehen, wobei chinesische Firmen, einschließlich Technologiegiganten wie ByteDance, Tencent und Alibaba, immer noch stark auf Nvidias H20-Chips für ihr fortschrittliches KI-Modelltraining angewiesen sind. Das aktuelle Szenario veranschaulicht anschaulich, dass trotz erheblicher staatlicher Investitionen und politischem Druck die Überbrückung dieser technologischen Kluft, insbesondere im komplexen Bereich des KI-Chip-Trainings und des dazugehörigen Software-Ökosystems, ein mehrjähriges Unterfangen ist. DeepSeeks verzögerter R2-Start dient als deutliche Erinnerung an das komplizierte Gleichgewicht zwischen geopolitischen Bestrebungen und den praktischen Realitäten der fortschrittlichen Technologieentwicklung in der sich schnell entwickelnden Welt der künstlichen Intelligenz.