OpenAI: Kostenlose, anpassbare KI-Modelle fordern Meta heraus
OpenAI hat die Veröffentlichung eigener frei verfügbarer Modelle für künstliche Intelligenz angekündigt und damit eine strategische Verschiebung eingeleitet, um im sich schnell entwickelnden KI-Landschaft mit Meta und DeepSeek zu konkurrieren. Der Entwickler hinter ChatGPT stellt zwei „Open-Weight“-Großsprachmodelle, gpt-oss-120b und gpt-oss-20b-two, zum kostenlosen Download und zur Anpassung durch Benutzer bereit. Diese Initiative steht im Gegensatz zu OpenAIs Flaggschiff ChatGPT, das auf einem „geschlossenen“ Modell basiert, das von externen Benutzern nicht verändert werden kann.
Dieser Schritt von OpenAI spiegelt Metas Ansatz mit seinen Llama-Modellen wider, die ebenfalls auf ähnlicher Basis angeboten werden. Sam Altman, CEO von OpenAI, äußerte sich begeistert über den Beitrag zur wachsenden Sammlung frei zugänglicher KI-Modelle und betonte deren Fundament in „demokratischen Werten“ und ihr Potenzial für „weiten Nutzen“. Er erklärte, dass die Bereitstellung dieser Modelle, das Ergebnis von Milliarden von Dollar an Forschung, für die Welt darauf abzielt, den Zugang zu KI zu demokratisieren.
Diese Ansicht wird von Mark Zuckerberg, Metas CEO, geteilt, der ebenfalls argumentierte, dass die freie Verfügbarkeit und Anpassbarkeit von Modellen den Zugang zu den Vorteilen und Möglichkeiten der KI erweitert und verhindert, dass sich die Macht auf wenige Unternehmen konzentriert. Meta hat jedoch auch angedeutet, dass bei der Anwendung dieses Ansatzes auf hoch entwickelte KI-Modelle Vorsicht geboten sein könnte.
Zur Wettbewerbslandschaft trägt DeepSeek, ein chinesischer Rivale von OpenAI und Meta, bei, der ebenfalls leistungsstarke Modelle veröffentlicht hat, die kostenlos heruntergeladen und angepasst werden können.
OpenAI behauptet, dass seine neuen gpt-oss-Modelle eine überlegene Leistung bei Schlussfolgerungsaufgaben im Vergleich zu ähnlich großen Modellen aufweisen. Insbesondere das größere gpt-oss-120b-Modell erreichte Berichten zufolge eine nahezu gleiche Kern-Schlussfolgerungsleistung wie OpenAIs o4-mini-Modell. In Bezug auf die Sicherheit erklärte OpenAI, dass während der Tests „bösartig feinabgestimmte“ Versionen der Modelle erstellt wurden, um biologische und Cybersicherheitsbedrohungen zu simulieren, aber diese Versionen „nicht in der Lage waren, hohe Fähigkeitsniveaus“ für solche Schäden zu erreichen.
Das Aufkommen leistungsstarker, frei verfügbarer und anpassbarer KI-Modelle hat bei einigen Experten Bedenken hervorgerufen. Sie warnen, dass solche Modelle bei Missbrauch potenziell angepasst werden könnten, um ernsthaften Schaden zu verursachen, einschließlich der Entwicklung von Biowaffen.
Die Terminologie bezüglich der Modellzugänglichkeit variiert. Meta definiert seine Llama-Modelle als „Open Source“, was impliziert, dass ihre Trainingsdatensätze, Architektur und Trainingscode zusammen mit den kostenlosen Download- und Anpassungsoptionen bereitgestellt werden. Die Open Source Initiative, eine in den USA ansässige Branchenorganisation, argumentiert jedoch, dass die von Meta auferlegten Einschränkungen bei der Nutzung ihrer Modelle verhindern, dass sie als vollständig Open Source qualifiziert werden. OpenAI hingegen verwendet den Begriff „Open Weight“, was bedeutet, dass das Modell zwar feinabgestimmt werden kann, seine internen Funktionsweisen jedoch für den Entwickler nicht vollständig transparent sind – ein Schritt unterhalb von vollständigem Open Source.
Die Ankündigung von OpenAI erfolgt inmitten anhaltender Spekulationen über die potenzielle Veröffentlichung von GPT-5, einer neuen Version des grundlegenden Modells für ChatGPT. Sam Altman, CEO von OpenAI, teilte kürzlich einen Screenshot, der vom neuesten KI-Modell des Unternehmens zu stammen schien.
In der Zwischenzeit hat Google auch seine neuesten Fortschritte in Richtung allgemeiner künstlicher Intelligenz (AGI) mit einem neuen „Weltmodell“ namens Genie 3 dargelegt. Dieses von Google DeepMind entwickelte Modell ermöglicht es KI-Systemen, in überzeugenden Simulationen der realen Welt zu interagieren. Google deutet an, dass Genie 3 maßgeblich zur Ausbildung von Robotern und autonomen Fahrzeugen beitragen könnte, indem es ihnen ermöglicht, mit realistischen Nachbildungen von Umgebungen wie Lagerhäusern zu interagieren. Google DeepMind postuliert, dass solche „Weltmodelle“ ein entscheidender Schritt zur Erreichung von AGI sind – einem hypothetischen KI-Niveau, bei dem ein System die meisten Aufgaben auf menschlichem Niveau ausführen kann, anstatt nur spezialisierte Funktionen, und potenziell sogar menschliche Arbeitsplätze übernehmen könnte. Es wird erwartet, dass diese Modelle eine bedeutende Rolle bei der Entwicklung von KI-Agenten spielen werden, welche Systeme sind, die Aufgaben autonom ausführen sollen.