KI-Giganten präsentieren neue Modelle: OpenAI, Anthropic, Google
Die Landschaft der künstlichen Intelligenz erlebte in der vergangenen Woche eine Flut bedeutender Fortschritte, als die Industriegiganten OpenAI, Anthropic und Google jeweils wichtige Upgrades ihrer grundlegenden Modelle vorstellten und damit die Grenzen der KI-Fähigkeiten in den Bereichen Denken, Codierung und Problemlösung erweiterten. Diese Veröffentlichungen unterstreichen das beschleunigte Innovationstempo und den intensiven Wettbewerb an der Spitze des KI-Rennens.
OpenAI kehrte am 5. August 2025 mit der Veröffentlichung zweier neuer „Open-Weight“-Denkmodelle, gpt-oss-120b und gpt-oss-20b, bemerkenswert zu seinen „Open-Source-Prinzipien“ zurück. Obwohl sie nicht vollständig Open Source sind, da die Trainingsdaten weiterhin proprietär bleiben, bieten diese Modelle öffentlich zugängliche Parameter, die es Entwicklern ermöglichen, sie anzupassen und auf ihrer eigenen Infrastruktur bereitzustellen. Der größere gpt-oss-120b mit 117 Milliarden Parametern ist für Hochleistungsaufgaben konzipiert und kann effizient auf einer einzigen 80-GB-GPU ausgeführt werden, wobei er bei wichtigen Denk-Benchmarks nahezu Parität mit OpenAIs proprietärem o4-mini erreicht. Der kompaktere gpt-oss-20b mit 21 Milliarden Parametern ist für Edge-Geräte und Personal Computer mit nur 16 GB Arbeitsspeicher optimiert und liefert eine Leistung, die mit o3-mini vergleichbar ist. Beide Modelle, die unter der Apache 2.0-Lizenz veröffentlicht wurden, zeichnen sich durch fortgeschrittenes Denken, Codierung, kompetitive Mathematik und gesundheitsbezogene Abfragen aus und unterstützen zudem die Werkzeugnutzung sowie anpassbaren Denkaufwand. Ihre Mixture-of-Experts (MoE)-Architektur trägt zu einer schnellen und kostengünstigen Inferenz bei, was sie zu vielseitigen Werkzeugen für Forschung, Entwicklung und Unternehmensanwendungen macht.
Unterdessen enthüllte Anthropic am 5. August 2025 Claude Opus 4.1, ein inkrementelles, aber wirkungsvolles Upgrade seines Flaggschiffmodells Claude Opus 4. Diese neue Iteration verbessert die Codierungsleistung erheblich und erreicht beeindruckende 74,5 % auf dem SWE-bench Verified-Benchmark, eine Steigerung gegenüber den 72,5 % von Opus 4. Opus 4.1 verfügt auch über fortschrittliche Denk- und Agentenfunktionen und erweist sich als geschickt bei eingehender Forschung, Datenanalyse und der Bewältigung komplexer, mehrstufiger Probleme mit erhöhter Präzision. Seine Fähigkeit, Langzeitaufgaben zu bewältigen und Erkenntnisse aus riesigen Datensätzen zu synthetisieren, positioniert es als leistungsstarken virtuellen Kollaborateur für strategische Entscheidungsfindungen in verschiedenen Bereichen. Das Modell ist für zahlende Claude-Nutzer und über die Anthropic-API, Amazon Bedrock und Google Cloud Vertex AI verfügbar und behält die gleiche Preisgestaltung wie sein Vorgänger bei.
Um nicht übertroffen zu werden, führte Google ab dem 1. August 2025 Gemini 2.5 Deep Think AI ein, einen erweiterten Denkmodus für sein Gemini 2.5 Ultra-Modell. Deep Think führt eine bahnbrechende „paralleles Denken“-Architektur ein, die es Gemini ermöglicht, mehrere Ideen zu generieren und gleichzeitig zu bewerten, ähnlich wie beim menschlichen Brainstorming. Dieser innovative Ansatz verschafft Gemini eine verlängerte „Denkzeit“, was seine Fähigkeit, komplexe Probleme zu lösen, die Kreativität, strategische Planung, iterative Entwicklung und fortgeschrittene Codierung erfordern, erheblich steigert. Das Modell, eine Variante davon, die bei der Internationalen Mathematik-Olympiade 2025 Goldmedaillenstandard erreichte, hat bei wichtigen Benchmarks wie Humanity’s Last Exam und LiveCodeBench V6 eine überlegene Leistung gegenüber Rivalen wie OpenAIs o3 und xAIs Grok 4 gezeigt. Derzeit ist Gemini 2.5 Deep Think ausschließlich für Google AI Ultra-Abonnenten verfügbar, wobei in naher Zukunft ein breiterer API-Zugriff für vertrauenswürdige Tester geplant ist.
Diese gleichzeitigen Starts verdeutlichen einen entscheidenden Moment in der KI-Entwicklung, in dem führende Unternehmen die Grenzen in Bezug auf Denken, Effizienz und Zugänglichkeit verschieben. Da Modelle leistungsfähiger und spezialisierter werden, verlagert sich der Fokus auf die praktische Bereitstellung und das nuancierte Gleichgewicht zwischen offener Zugänglichkeit und proprietärem Vorteil. Die kontinuierliche Entwicklung dieser KI-Kraftpakete verspricht, Industrien neu zu gestalten und die Mensch-Computer-Interaktion in den kommenden Jahren neu zu definieren.