OpenAI räumt GPT-5-Probleme ein, GPT-4o für Nutzer zurück
Sam Altman, Mitbegründer und CEO von OpenAI, hat öffentlich erhebliche Herausforderungen nach der kürzlichen Einführung von GPT-5, dem neuen Flaggschiff-Sprachmodell (LLM) des Unternehmens, eingeräumt. Als OpenAIs bisher leistungsstärkstes und fähigstes Modell angepriesen, war dessen Start von einer Reihe von Problemen überschattet, darunter fehlerhafte Modellwechsel, inkonsistente Leistung und weit verbreitete Nutzerverwirrung. Diese Probleme haben OpenAI dazu veranlasst, einige Plattformänderungen teilweise rückgängig zu machen, insbesondere den Nutzerzugang zu früheren Modellen wie GPT-4o wiederherzustellen.
In einem offenen Austausch mit Nutzern auf Reddit und X (ehemals Twitter) gab Altman zu, dass der Start „etwas holpriger war, als wir gehofft hatten“. Er führte Fehler in den Leistungsdiagrammen, die während des OpenAI GPT-5-Livestreams gezeigt wurden, auf menschliches Versagen zurück und bemerkte, dass „Leute lange gearbeitet haben und sehr müde waren“. Während der begleitende Blogbeitrag und die Systemkarte korrekt waren, verkomplizierten diese Fehltritte einen Start, der bereits von frühen Anwendern und Entwicklern kritisch beäugt wurde. OpenAI hat seither die GPT-5-Ratenbegrenzungen für ChatGPT Plus-Nutzer verdoppelt und wird Plus-Nutzern weiterhin erlauben, sich für GPT-4o zu entscheiden, wobei die Nutzung überwacht wird, während überlegt wird, wie lange ältere Modelle unterstützt werden sollen.
Eine Hauptursache für die Störung war laut Altman eine Fehlfunktion in OpenAIs neuem automatischen „Router“. Dieses System ist darauf ausgelegt, Benutzeranfragen einer von vier GPT-5-Varianten – regulär, mini, nano und pro – zuzuweisen, mit einem optionalen „Denkmodus“ für komplexere Denkaufgaben. Altman enthüllte, dass eine entscheidende Komponente dieses Systems, der „Autoswitcher“, „einen Großteil des Tages außer Betrieb war“, was dazu führte, dass GPT-5 „viel dümmer“ erschien als beabsichtigt. Als Reaktion darauf plant OpenAI, die Modell-Entscheidungsgrenze für eine bessere Leistung anzupassen und die Transparenz zu erhöhen, indem angezeigt wird, welches Modell auf eine bestimmte Anfrage reagiert. Ein Update der Benutzeroberfläche ist ebenfalls in Planung, um das manuelle Auslösen des Denkmodus zu erleichtern.
Obwohl OpenAIs interne Benchmarks darauf hindeuten, dass GPT-5 die Spitze der großen Sprachmodelle anführt, haben die realen Nutzererfahrungen ein anderes Bild gezeichnet. Seit dem Start haben zahlreiche Nutzer Beispiele geteilt, in denen GPT-5 grundlegende Fehler in Mathematik-, Logik- und Codierungsaufgaben machte. Zum Beispiel veröffentlichte der Datenwissenschaftler Colin Fraser Screenshots, die illustrierten, dass GPT-5 fälschlicherweise annahm, dass 8.888 periodisch gleich 9 ist, während ein anderer Nutzer sein Versagen bei einem einfachen Algebra-Problem hervorhob. Auch Entwickler äußerten ihre Enttäuschung, wobei einige berichteten, dass GPT-5 bei „One-Shot“-Programmieraufgaben, die das genaue Abschließen einer Aufgabe aus einer einzigen Anfrage erfordern, schlechter abschnitt als das neue Claude Opus 4.1 des rivalisierenden KI-Labors Anthropic. Darüber hinaus stellte das Sicherheitsunternehmen SPLX fest, dass GPT-5 weiterhin anfällig für Prompt-Injection- und verschleierte Logik-Angriffe bleibt, es sei denn, seine Sicherheitsebene wird erheblich verstärkt.
Mit ChatGPT, das wöchentlich 700 Millionen Nutzer bedient, behauptet OpenAI seine Position als größter Akteur im Bereich der generativen KI nach Publikum. Diese immense Skalierung hat jedoch erhebliche Wachstumsschmerzen mit sich gebracht. Altman bemerkte, dass der API-Verkehr innerhalb von 24 Stunden nach dem GPT-5-Start verdoppelt wurde, was zur Plattforminstabilität beitrug. Während OpenAI dies durch die Verdopplung der Ratenbegrenzungen für ChatGPT Plus-Nutzer und die kontinuierliche Anpassung seiner Infrastruktur basierend auf Feedback abmildern will, haben diese frühen Fehltritte – verstärkt durch verwirrende Änderungen der Nutzererfahrung und hochkarätige Startfehler – eine Öffnung für Wettbewerber geschaffen, um Boden gutzumachen. Der Druck auf OpenAI wächst, zu demonstrieren, dass GPT-5 einen substanziellen Sprung nach vorne darstellt und nicht nur ein inkrementelles Update ist. Basierend auf dem anfänglichen Rollout bleiben viele Nutzer unüberzeugt.