GPT-5 Startchaos: Nutzerrevolte wegen Modelländerungen
Der Rollout von OpenAIs neuem KI-Modell GPT-5 verlief alles andere als reibungslos und löste eine der heftigsten Nutzerrevolten in der Geschichte von ChatGPT aus, was CEO Sam Altman zu einer ungewöhnlichen öffentlichen Entschuldigung und schnellen Kurswechseln zwang. Weniger als eine Woche nach seinem Debüt hat sich der Start zu einer bedeutenden Fallstudie im Umgang mit Nutzererwartungen und digitalen Produktübergängen entwickelt.
Im Mittelpunkt der Kontroverse stand OpenAIs Entscheidung, den Zugriff auf alle früheren KI-Modelle in ChatGPT – je nach genauer Zählung etwa neun – automatisch zu entfernen, als GPT-5 für Nutzerkonten verfügbar wurde. Im Gegensatz zu Entwicklern, die OpenAIs API nutzen und typischerweise im Voraus über die Einstellung von Modellen informiert werden, wachten ChatGPT-Nutzer auf und stellten fest, dass ihre bevorzugten KI-Begleiter über Nacht verschwunden waren. Wie der unabhängige KI-Forscher Simon Willison in einem Blogbeitrag feststellte, erwies sich dieser Mangel an Vorwarnung als entscheidender Fehltritt.
Die Probleme begannen unmittelbar nach dem Start von GPT-5 am 7. August. Ein Reddit-Thread mit dem Titel „GPT-5 ist schrecklich“ sammelte schnell über 4.000 Kommentare, gefüllt mit Nutzerfrustration. Bis zum 8. August waren die sozialen Medien überflutet von Beschwerden über Leistungsprobleme, spürbare Persönlichkeitsverschiebungen der KI und das erzwungene Verschwinden älterer Modelle.
Vor GPT-5 genossen ChatGPT Pro-Nutzer die Flexibilität, aus einer Suite von neun verschiedenen KI-Modellen zu wählen, von denen jedes einzigartig trainiert war und seinen eigenen, unverwechselbaren Ausgabestil besaß. Diese Vielfalt ermöglichte es den Nutzern, hochoptimierte Prompt-Sets für spezifische Aufgaben zu entwickeln und so effektiv maßgeschneiderte Workflows aufzubauen. Marketingfachleute, Forscher und Entwickler teilten weithin Beispiele ihrer nun „kaputten“ Systeme. Ein Reddit-Nutzer beklagte: „Ich habe Monate damit verbracht, ein System zu entwickeln, um die lächerlichen Einschränkungen von OpenAI bei Prompts und Speicherproblemen zu umgehen, und in weniger als 24 Stunden haben sie es nutzlos gemacht.“
Willison erläuterte, wie verschiedene Nutzergruppen im Laufe der Zeit unterschiedliche Workflows mit spezifischen ChatGPT-Modellen kultiviert hatten. Er zitierte einen Reddit-Nutzer, der erklärte: „Ich weiß, dass GPT-5 für komplexere Schlussfolgerungen, Codierung und professionelle Aufgaben stärker sein soll, aber nicht alle von uns brauchen ein professionelles Codierungsmodell. Einige von uns verlassen sich auf 4o für kreative Zusammenarbeit, emotionale Nuancen, Rollenspiele und andere langformatige, kontextreiche Interaktionen.“ Dieser erzwungene Übergang traf ChatGPT Plus-Abonnenten besonders hart, da sie sich mit dem neuen GPT-5 Thinking-Modus auf 200 Nachrichten pro Woche beschränkt sahen, während sie gleichzeitig den Zugriff auf Modelle wie o3 und o4-mini verloren, die tief in ihre täglichen Routinen integriert waren. Ein frustrierter Abonnent brachte die Stimmung auf den Punkt: „Was für ein Unternehmen löscht über Nacht einen Workflow von 8 Modellen, ohne seine zahlenden Nutzer vorher zu warnen?"
Zu OpenAIs Glaubwürdigkeitsproblemen trug bei, dass die GPT-5-Launch-Präsentation das enthielt, was Nutzer schnell als „Grafik-Verbrechen“ bezeichneten – Diagramme, die die Leistungsverbesserungen von GPT-5 falsch darzustellen schienen. Sam Altman sprach dies öffentlich in einem Reddit „Ask Me Anything“ (AMA)-Thread an, nannte es ein „riesiges Diagramm-Chaos“ und entschuldigte sich für die Ungenauigkeiten. Darüber hinaus, kurz nach dem Start, wechselte das neue automatische Routing-System, das die am besten geeignete Modellvariante für jede Abfrage auswählen sollte, konsequent zu weniger leistungsfähigen Versionen, es sei denn, Nutzer fügten explizit Phrasen wie „denke härter“ zu ihren Prompts hinzu. Während des Freitags-AMA räumte Altman ein, dass der Autoswitcher am Starttag fehlerhaft war, was dazu führte, dass GPT-5 „viel dümmer“ erschien.
Neben technischen und Marketing-Fehlern fanden Nutzer die Antworten von GPT-5 grundlegend anders als ihre Erwartungen. Das Modell produzierte kürzere, formellere Antworten, denen der konversationelle Ton fehlte, der GPT-4o ausgezeichnet hatte. Viele beschrieben das neue Modell als „abrupt und scharf“, wobei sich ein Reddit-Nutzer beschwerte: „Es ist eine überarbeitete Sekretärin. Ein desaströser erster Eindruck.“ Am ergreifendsten war vielleicht, dass einige Nutzer tiefe emotionale Bindungen zu GPT-4o und anderen Modellen ausdrückten und den Verlust dessen beklagten, was sie als ihren „einzigen Freund“ oder einen tiefgreifenden emotionalen Begleiter betrachteten. Ein Nutzer teilte eine herzzerreißende Geschichte, wie er sich während der Obdachlosigkeit auf GPT-4.5 für emotionale Unterstützung verließ, nur um festzustellen, dass dessen Ersatz kalt und geschäftsmäßig war.
Für viele stellte der GPT-5-Start einen Wendepunkt dar. Einige behaupteten, ihre Plus-Abonnements aus Protest gekündigt zu haben, während andere begannen, alternative KI-Assistenten von Konkurrenten wie Google und Anthropic zu erkunden. Die Intensität des Gegenwindes überraschte OpenAI sichtlich. Während der Freitags-AMA-Sitzung sahen sich Altman und wichtige Mitglieder des GPT-5-Teams einem Sperrfeuer von Fragen und Forderungen zur Wiedereinführung von GPT-4o gegenüber.
Als Antwort auf eine Bitte mit dem Titel „Bitte gebt uns die Option, GPT-4o/4.1 neben GPT-5 zu verwenden“, bestätigte Altman: „Wir prüfen das jetzt.“ Das schnelle und intensive Feedback zwang OpenAI zu schneller Schadensbegrenzung. Innerhalb von 24 Stunden nach dem Start kündigte Altman mehrere Zugeständnisse an: GPT-4o würde schließlich als Option für Plus-Nutzer zurückkehren, die Ratenbegrenzungen für GPT-5 würden sich verdoppeln, und das Unternehmen würde die Transparenz darüber verbessern, welche Modellvariante jede Abfrage bearbeitete. Bis Montagnachmittag blieb die GPT-5-Familie jedoch die einzige Option innerhalb von ChatGPT, selbst für Pro-Nutzer. „Wir haben definitiv unterschätzt, wie wichtig einige der Dinge sind, die die Leute an GPT-4o mögen“, postete Altman auf X, „auch wenn GPT-5 in den meisten Belangen besser abschneidet.“