OpenAI veröffentlicht neue Open-Weight gpt-oss Sprachmodelle

Openai

OpenAI hat die Veröffentlichung von gpt-oss-120b und gpt-oss-20b bekannt gegeben, zwei neue, hochmoderne Open-Weight Sprachmodelle, die darauf ausgelegt sind, robuste Leistung in der realen Welt zu geringen Kosten zu liefern. Diese Modelle sind unter der permissiven Apache 2.0 Lizenz verfügbar. Dieser Schritt markiert OpenAIs erste Veröffentlichung von Open-Weight großen Sprachmodellen seit GPT-2 im Jahr 2019 und signalisiert einen bedeutenden Schritt in Richtung breiterer Zugänglichkeit im KI-Ökosystem.

Die gpt-oss Modelle sind darauf ausgelegt, in Reasoning-Aufgaben zu glänzen und zeigen starke Fähigkeiten im Werkzeugeinsatz, wodurch sie ähnlich große offene Modelle übertreffen. Das größere gpt-oss-120b Modell, das 116,8 Milliarden Gesamtparameter mit 5,1 Milliarden aktiven Parametern pro Token aufweist, erreicht auf Kern-Reasoning-Benchmarks nahezu Parität mit OpenAIs proprietärem o4-mini Modell. Bemerkenswert ist, dass dieses leistungsstarke Modell für den effizienten Betrieb auf einer einzelnen 80 GB GPU optimiert ist.

Für zugänglichere Bereitstellungen liefert das gpt-oss-20b Modell mit 20,9 Milliarden Gesamtparametern und 3,6 Milliarden aktiven Parametern eine Leistung, die mit OpenAIs o3-mini vergleichbar ist. Entscheidend ist, dass dieses kleinere Modell auf Consumer-Hardware mit nur 16 GB Speicher betrieben werden kann, was es ideal für On-Device-Anwendungsfälle, lokale Inferenz und schnelle Entwicklung ohne kostspielige Infrastruktur macht. Beide Modelle nutzen ein 4-Bit-Quantisierungsschema (MXFP4) für ihre Mixture-of-Experts (MoE)-Gewichte, was den Speicherbedarf erheblich reduziert und eine effiziente Inferenz ermöglicht.

Die gpt-oss Modelle sind textbasierte autoregressive Mixture-of-Experts (MoE) Transformer, die auf den grundlegenden GPT-2- und GPT-3-Architekturen aufbauen. Sie sind für die nahtlose Integration in Agenten-Workflows konzipiert und zeichnen sich durch außergewöhnliche Befolgung von Anweisungen, fortgeschrittenen Werkzeugeinsatz wie Websuche und Python-Code-Ausführung sowie anpassbare Reasoning-Fähigkeiten aus, einschließlich der Möglichkeit, den Reasoning-Aufwand für Aufgaben mit unterschiedlichen Komplexitäts- oder Latenzanforderungen anzupassen. Entwickler können auch von vollständigem Chain-of-Thought (CoT) und strukturierten Ausgaben profitieren, was eine größere Kontrolle und Transparenz über die Prozesse der Modelle bietet. Über das allgemeine Reasoning hinaus zeigen diese Modelle besondere Stärke in Bereichen wie Wettbewerbsmathematik, Codierung und gesundheitsbezogenen Anfragen und übertreffen sogar einige proprietäre Modelle bei Benchmarks wie HealthBench.

Diese Veröffentlichung ist eine bemerkenswerte Entwicklung in der sich entwickelnden KI-Landschaft, in der Open-Weight Modelle den Zugang zu leistungsstarken KI-Technologien zunehmend demokratisieren. Indem OpenAI diese Modelle unter der Apache 2.0 Lizenz verfügbar macht, ermöglicht es Entwicklern und Organisationen, KI auf ihrer eigenen Infrastruktur herunterzuladen, zu feinabzustimmen und bereitzustellen, wodurch die Abhängigkeit von anbieterspezifischen APIs reduziert und eine größere Kontrolle und Anpassung gefördert wird. Dieser Wandel steht im Einklang mit einem breiteren Branchentrend, bei dem Open-Weight Systeme die Leistungslücke zu geschlossenen Modellen schließen, Eintrittsbarrieren senken und Innovation durch Gemeinschaftskollaboration beschleunigen. Die gpt-oss Modelle sind auf Hugging Face zum Download verfügbar und können auch über Amazon Bedrock und Amazon SageMaker AI auf AWS sowie über Ollama abgerufen werden.

OpenAI betont, dass Sicherheit ein grundlegender Aspekt ihres Ansatzes zur Modellveröffentlichung bleibt, insbesondere bei offenen Modellen, bei denen das Potenzial für Missbrauch besteht, sobald sie öffentlich zugänglich sind. Die gpt-oss Modelle wurden umfassenden Sicherheitstrainings und -bewertungen unterzogen, einschließlich der Prüfung von adversariell feinabgestimmten Versionen. Obwohl sie standardmäßig darauf ausgelegt sind, die Sicherheitsrichtlinien von OpenAI einzuhalten, weist das Unternehmen darauf hin, dass Entwickler und Unternehmen, die diese Modelle nutzen, zusätzliche Schutzmaßnahmen implementieren müssen, um die systemweiten Schutzmaßnahmen zu replizieren, die typischerweise in den über die OpenAI-API bereitgestellten Modellen integriert sind. Dies spiegelt eine gemeinsame Verantwortung für den ethischen Einsatz wider, da die KI-Fähigkeiten immer weiter verbreitet werden.