Google startet Gemini Deep Think AI für paralleles Denken

Techcrunch

Google DeepMind hat mit der Einführung von Gemini 2.5 Deep Think begonnen, einem fortschrittlichen KI-Argumentationsmodell, das darauf ausgelegt ist, die Problemlösung durch gleichzeitiges Erforschen und Bewerten mehrerer Ideen zu verbessern. Diese neue Funktion, die dann die optimale Antwort aus diesen Erkundungen auswählt, ist ab diesem Freitag für Abonnenten von Googles 250 US-Dollar pro Monat teurem Ultra-Abonnement innerhalb der Gemini-App zugänglich.

Erstmals auf der Google I/O 2025 im Mai vorgestellt, markiert Gemini 2.5 Deep Think Googles erstes öffentlich verfügbares Multi-Agenten-Modell. Diese Systeme arbeiten, indem sie mehrere KI-Agenten einsetzen, die eine einzige Frage parallel bearbeiten. Obwohl diese Methode deutlich mehr Rechenressourcen als ein Einzel-Agenten-Ansatz erfordert, liefert sie typischerweise genauere und umfassendere Antworten.

Eine Variante von Gemini 2.5 Deep Think gewann in diesem Jahr eine Goldmedaille bei der Internationalen Mathematik-Olympiade (IMO). Neben der öffentlichen Veröffentlichung von Gemini 2.5 Deep Think stellt Google das spezifische IMO-Gewinnermodell einer ausgewählten Gruppe von Mathematikern und Akademikern zur Verfügung. Das Unternehmen weist darauf hin, dass dieses spezialisierte KI-Modell Stunden statt Sekunden oder Minuten benötigt, um seine Denkprozesse abzuschließen, anders als die meisten verbraucherorientierten KIs. Google hofft, dass dies die Forschung fördert und Feedback zur Verfeinerung von Multi-Agenten-Systemen für akademische Anwendungen liefert.

Google behauptet, dass Gemini 2.5 Deep Think eine wesentliche Verbesserung gegenüber der auf der I/O vorgestellten Version darstellt. Das Unternehmen hebt auch die Entwicklung „neuartiger Reinforcement-Learning-Techniken“ hervor, um die Nutzung der Denkpfade des Modells zu optimieren. In einem Blogbeitrag erklärte Google, dass „Deep Think Menschen helfen kann, Probleme anzugehen, die Kreativität, strategische Planung und schrittweise Verbesserungen erfordern.“

Beim Humanity’s Last Exam (HLE), einem strengen Test zur Bewertung der KI-Kompetenz anhand Tausender Crowdsourcing-Fragen in Mathematik, Geisteswissenschaften und Naturwissenschaften, erreichte Gemini 2.5 Deep Think ohne externe Hilfsmittel eine Punktzahl von 34,8 %. Diese Leistung übertrifft xAIs Grok 4 mit 25,4 % und OpenAIs o3 mit 20,3 %. Darüber hinaus übertraf Googles Modell die Konkurrenz bei LiveCodeBench 6, einem anspruchsvollen Benchmark für kompetitive Codierungsaufgaben, mit 87,6 % im Vergleich zu Grok 4s 79 % und OpenAIs o3s 72 %.

Gemini 2.5 Deep Think lässt sich nahtlos in Tools wie Codeausführung und Google Search integrieren und ist in der Lage, „viel längere Antworten“ als herkömmliche KI-Modelle zu generieren. Googles interne Tests zeigen, dass das Modell detailliertere und ästhetisch verfeinerte Ergebnisse für Webentwicklungsaufgaben liefert als andere KI-Systeme, was Forschern potenziell helfen und Entdeckungsprozesse beschleunigen könnte.

Die Einführung von Multi-Agenten-Systemen scheint ein wachsender Trend unter führenden KI-Laboren zu sein. Elon Musks xAI hat kürzlich Grok 4 Heavy eingeführt, sein eigenes Multi-Agenten-System, das branchenführende Leistung über mehrere Benchmarks hinweg beansprucht. Ähnlich wird OpenAIs unveröffentlichtes KI-Modell, das ebenfalls eine Goldmedaille bei der diesjährigen Internationalen Mathematik-Olympiade gewann, Berichten zufolge ein Multi-Agenten-System sein. Anthropic’s Research Agent, bekannt für die Erstellung umfassender Forschungsberichte, wird ebenfalls von einer Multi-Agenten-Architektur angetrieben.

Trotz ihrer starken Leistungsfähigkeit sind Multi-Agenten-Systeme erheblich rechenintensiver und folglich teurer im Betrieb als traditionelle KI-Modelle. Diese wirtschaftliche Realität deutet darauf hin, dass Technologieunternehmen diese fortschrittlichen Systeme möglicherweise weiterhin ihren Premium-Abonnementstufen vorbehalten werden, eine Strategie, die jetzt sowohl von xAI als auch von Google angewendet wird.

In den kommenden Wochen plant Google, ausgewählten Testern über die Gemini API Zugang zu Gemini 2.5 Deep Think zu gewähren, um Einblicke zu gewinnen, wie Entwickler und Unternehmen sein Multi-Agenten-System nutzen könnten.