DeepSeek V3.1: Mächtige Open-Source-KI fordert OpenAI heraus

Venturebeat

Die Landschaft der künstlichen Intelligenz erlebt mit der jüngsten Veröffentlichung von DeepSeek V3.1, einem kolossalen Open-Source-KI-Modell mit 685 Milliarden Parametern von Chinas DeepSeek, einen erheblichen Umbruch. Die am 19. August 2025 veröffentlichte neue Iteration wird den globalen Wettbewerb in der generativen KI intensivieren und etablierte Akteure wie OpenAI und Anthropic direkt herausfordern, indem sie bahnbrechende Leistung und zugängliche Technologie bietet.

DeepSeek V3.1 kommt mit einer Reihe von Verbesserungen, die darauf abzielen, die Grenzen großer Sprachmodelle zu erweitern. Ein herausragendes Merkmal ist sein erweitertes Kontextfenster, das bis zu 128.000 Tokens verarbeiten kann, was etwa 96.000 Wörtern entspricht – dem Äquivalent von zwei 200-seitigen englischen Romanen. Diese beträchtliche Kapazität ermöglicht es dem Modell, größere Informationsmengen zu verarbeiten, umfangreichere und kohärentere Gespräche zu führen und nuanciertere Antworten zu liefern, indem es ein besseres Kontextverständnis beibehält. Darüber hinaus beansprucht DeepSeek erhebliche Fortschritte bei den Denkfähigkeiten, wobei Tests eine Verbesserung von bis zu 43 % beim mehrstufigen Denken im Vergleich zum Vorgänger zeigen, obwohl einige Bewertungen weiterhin Herausforderungen bei hochabstrakten oder ethischen Dilemmata nahelegen. Das Modell bietet auch eine überragende mehrsprachige Unterstützung, ist in über 100 Sprachen mit nahezu nativer Genauigkeit versiert und weist eine berichtete Reduzierung von Halluzinationen um 38 % auf, was seine faktische Zuverlässigkeit erhöht.

Die Veröffentlichung von DeepSeek V3.1 unter der permissiven MIT-Lizenz auf Hugging Face unterstreicht das Engagement für die Open-Source-Philosophie, wodurch es kostenlos zum Download und zur Nutzung verfügbar ist. Dieser Ansatz stimmt mit Chinas breiterer Strategie überein, die globale Akzeptanz seiner KI-Technologien zu fördern, wobei die breite Zugänglichkeit gegenüber unmittelbaren proprietären Gewinnen priorisiert wird. Das Unternehmen hat zuvor seine Fähigkeit bewiesen, fortschrittliche KI zu einem Bruchteil der Kosten seiner westlichen Gegenstücke zu entwickeln; zum Beispiel wurde berichtet, dass sein V3-Modell für nur 6 Millionen US-Dollar trainiert wurde, ein starker Kontrast zu den geschätzten 100 Millionen US-Dollar, die OpenAI 2023 für GPT-4 ausgegeben hat. Diese Kosteneffizienz, die mit deutlich weniger Rechenleistung erreicht wird, positioniert DeepSeek als einen beeindruckenden Disruptor in der KI-Branche.

Bei Leistungsbenchmarks zeigt DeepSeek V3.1 in mehreren entscheidenden Bereichen einen Wettbewerbsvorteil. Es hat starke Ergebnisse im allgemeinen Sprachverständnis (MMLU) gezeigt, wo seine V3-Iteration 88,5 % erzielte und damit GPT-4o von OpenAI leicht übertraf. Bei Kodierungsaufgaben, insbesondere beim HumanEval-Benchmark, übertraf DeepSeek V3 sowohl Claude 3.5 Sonnet als auch GPT-4o. Bei komplexeren Software-Engineering-Aufgaben (SWE-bench Verified) und bestimmten mathematischen Herausforderungen hinkt DeepSeek V3.1 jedoch immer noch den Top-Proprietärmodellen hinterher, was Bereiche für zukünftige Verfeinerungen aufzeigt.

DeepSeek, im Juli 2023 von Liang Wenfeng gegründet und vom chinesischen Hedgefonds High-Flyer finanziert, hat sich schnell zu einem wichtigen Akteur im KI-Bereich entwickelt. Das Unternehmen erregte Anfang des Jahres internationale Aufmerksamkeit, als sein DeepSeek-R1-Chatbot kurzzeitig die meist heruntergeladene kostenlose App im Apple iPhone Store in den USA wurde und sogar ChatGPT übertraf. Dieser schnelle Aufstieg war nicht ohne Prüfung; US-Senatoren haben Bedenken hinsichtlich potenzieller Datensicherheitslücken und des Risikos geäußert, dass chinesische Open-Source-KI-Modelle vom chinesischen Militär ausgenutzt werden könnten. DeepSeek und seine Cloud-Partner, darunter AWS, Microsoft Azure und Google Cloud, haben einige dieser Bedenken ausgeräumt, indem sie sicherstellten, dass Modelle wie R1, die auf ihren Plattformen gehostet werden, lokalisiert sind, um zu verhindern, dass Daten nach China gesendet werden. Während die KI-Community gespannt auf die Veröffentlichung von DeepSeeks nächster großer Iteration, R2, wartet, festigt das neueste Angebot des Unternehmens seine Position als mächtige und kostengünstige Kraft in der sich entwickelnden Landschaft der offenen künstlichen Intelligenz.