OpenAIs GPT-5 startet: Weniger Halluzinationen, iterative Fortschritte
OpenAI hat sein neuestes und fortschrittlichstes Modell für künstliche Intelligenz, GPT-5, vorgestellt, was einen bedeutenden Schritt in der ehrgeizigen Vision des Unternehmens für KI darstellt. Von CEO Sam Altman als vergleichbar mit dem Gespräch mit einem persönlichen Experten beschrieben, der Anwendungen auf Abruf generieren kann, zielt GPT-5 darauf ab, eine Ära einzuläuten, die von “Software auf Abruf” geprägt ist. Die Ankündigung, die während einer umfassenden Präsentation mit Code-Demonstrationen gemacht wurde, hob die angeblichen Verbesserungen des Modells in kritischen Bereichen wie Kodierung, Schreiben, Mathematik und visueller Wahrnehmung hervor, zusammen mit einer bemerkenswerten Reduzierung von sachlichen Ungenauigkeiten und irreführenden Ausgaben.
Im Gegensatz zu seinen Vorgängern ist GPT-5 kein einzelnes monolithisches Modell, sondern ein ausgeklügeltes Ensemble. OpenAIs System leitet Benutzeranfragen intelligent an verschiedene zugrunde liegende Modelle weiter, basierend auf Faktoren wie der Benutzerabsicht und der Komplexität der Anfrage. Zum Beispiel könnten unkomplizierte Anfragen an ein kleineres, effizienteres Modell geleitet werden, das für schnelle, weniger “nachdenkliche” Antworten konzipiert ist, während komplizierte oder nuancierte Aufgaben ein größeres, tiefer denkendes Modell aktivieren könnten. Dieses dynamische Routing ist typischerweise automatisiert, obwohl zahlende Benutzer die Möglichkeit haben werden, die tiefere Denkfunktionalität dauerhaft zu aktivieren. OpenAI gibt an, dass dieser Routing-Mechanismus kontinuierlich durch neue Eingabesignale verfeinert wird, wodurch seine Fähigkeit verbessert wird, das optimale Modell für jede Anfrage zu erkennen und wann eine tiefere Denkweise einzuschalten ist. Trotz dieser aktuellen Architektur plant das Unternehmen letztendlich, diese unterschiedlichen Komponenten in einem einzigen Modell zu konsolidieren.
Über seine adaptive Struktur hinaus behauptet OpenAI, dass dieses Design die Effizienz erheblich steigert. Das Unternehmen behauptet, GPT-5 ziehe mehr Wert aus weniger Rechenaufwand. In internen Bewertungen erzielt GPT-5, wenn es seine Denkfähigkeiten einsetzt, angeblich eine vergleichbare Leistung wie sein Vorgänger, OpenAI o3, während es 50 bis 80 Prozent weniger Ausgabetokens bei verschiedenen Aufgaben generiert, einschließlich visuellem Denken, automatisierter Kodierung und wissenschaftlicher Problemlösung auf Hochschulniveau.
Der Zugang zu GPT-5 variiert je nach Benutzerstufe. ChatGPT Free- und Plus-Abonnenten erhalten Zugang zum Standard GPT-5 und einer kompakten “Mini”-Version. Pro- und Enterprise-Benutzer profitieren von einer “Pro”-Variante, die für erweitertes Denken entwickelt wurde, während diejenigen, die über die API interagieren, Zugang zu einer kostengünstigen “Nano”-Version neben den Standard- und Mini-Modellen haben werden.
Trotz der großen Behauptungen und beeindruckenden Demonstrationen, die während des Starts gezeigt wurden, zeichnen die veröffentlichten Benchmark-Ergebnisse ein nuancierteres Bild, das oft eher inkrementelle als revolutionäre Fortschritte suggeriert. Im AIME 2025 Mathematik-Benchmark zum Beispiel übertraf GPT-5 Pro das frühere Flaggschiffmodell o3 nur um 1,6 Punkte bei Verwendung externer Tools und um 7,8 Punkte ohne sie. Für Free-Tier-Nutzer ist das Upgrade von GPT-4o auf den Standard GPT-5 jedoch erheblich und zeigt einen Vorsprung von 57,5 Punkten. Ähnliche bescheidene Zuwächse wurden in anderen Mathematik-Benchmarks beobachtet. Die Leistung bei hochrangigen akademischen Herausforderungen, wie einem wissenschaftlichen Quiz auf Doktoranden-Niveau und “Humanity’s Last Exam”, zeigte ebenfalls Verbesserungen im einstelligen Bereich gegenüber Modellen der vorherigen Generation. Wo GPT-5 sich wirklich auszeichnete, war in einem Benchmark für Konversationsagenten, wo es signifikante Fortschritte in seiner Fähigkeit zur Werkzeugnutzung und zum Befolgen komplexer Anweisungen demonstrierte. Greg Brockman, Präsident von OpenAI, räumte die Herausforderung ein, den Fortschritt allein durch Benchmarks zu messen, und bemerkte: “Wenn man sich in einem Benchmark zwischen 98% und 99% bewegt, bedeutet das, dass man etwas anderes braucht, um wirklich zu erfassen, wie großartig das Modell ist.”
Die vielleicht überzeugendsten Verbesserungen in GPT-5 liegen in seiner erhöhten Zuverlässigkeit, insbesondere bei der Eindämmung der Tendenz großer Sprachmodelle, zu “halluzinieren” oder Informationen zu fabrizieren. OpenAI berichtet, dass die Antworten von GPT-5 etwa 45 Prozent weniger anfällig für sachliche Fehler sind als GPT-4o. Wenn seine Denkfähigkeiten eingesetzt werden, steigt diese Zahl auf eine beeindruckende Reduzierung von 80 Prozent bei sachlichen Ungenauigkeiten im Vergleich zu OpenAI o3. Das Unternehmen hat auch strenge Bewertungen implementiert, um trügerisches Verhalten zu erkennen und zu mindern, bei dem Modelle fälschlicherweise die Aufgabenerfüllung behaupten oder übermäßiges Vertrauen in unsichere Antworten ausdrücken könnten. Bei Tests mit realen Chat-Daten sank die Rate trügerischer Antworten von 4,8 Prozent bei o3 auf 2,1 Prozent bei GPT-5s Denkausgaben.
An der kritischen Sicherheitsfront hat OpenAI neue Protokolle für den Umgang mit sensiblen Anfragen eingeführt. Anstatt einfach abzulehnen, potenziell zweifelhafte Prompts zu beantworten – eine häufige Einschränkung, die oft durch cleveres Prompt-Engineering umgangen wird –, ist GPT-5 darauf ausgelegt, die umfassendste mögliche Antwort zu geben, während es strenge Sicherheitsparameter einhält. Zum Beispiel könnte das Modell, anstatt eine Frage zum Entzünden einer flüchtigen Verbindung direkt abzulehnen, Anleitungen geben, wo die Informationen zu finden sind, begleitet von klaren Warnungen bezüglich der damit verbundenen Risiken.
Zusätzlich bietet OpenAI vier neue optionale Persönlichkeiten für seine ChatGPT-Oberfläche an: Zyniker, Roboter, Zuhörer und Nerd. Diese Persönlichkeiten, die zunächst auf Text-Chats beschränkt sind, wobei Sprachfunktionen für später geplant sind, ermöglichen es den Benutzern, den Kommunikationsstil der KI an ihre Vorlieben anzupassen. Mark Chen, Chief Research Officer bei OpenAI, betonte, dass diese Persönlichkeiten sorgfältig kalibriert wurden, um übermäßig schmeichelnde oder kriecherische Interaktionen mit Benutzern zu vermeiden.
Die GPT-5-Modellfamilie ist jetzt über ChatGPT für Free-, Plus- und Pro-Benutzer zugänglich, wobei die Verfügbarkeit in der kommenden Woche auf Unternehmens- und Bildungsbenutzer ausgeweitet wird. Die Preise für ChatGPT-Abonnements bleiben konstant: 20 US-Dollar pro Monat für die Plus-Stufe und 200 US-Dollar pro Monat für die unbegrenzte Pro-Stufe. Fachleute haben auch weiterhin die Möglichkeit, über die API von OpenAI auf die Modelle zuzugreifen.