Google startet Gemini 2.5 Deep Think für AI Ultra-Abonnenten

Arstechnica

Google hat Gemini 2.5 Deep Think, sein bisher fortschrittlichstes Modell für künstliche Intelligenz, exklusiv für Abonnenten seines 250 US-Dollar pro Jahr kostenden AI Ultra-Plans zugänglich gemacht. Deep Think wurde im Mai auf der I/O-Konferenz vorgestellt und ist nun innerhalb der Gemini-App und der Weboberfläche verfügbar, obwohl es eher als spezialisiertes Werkzeug denn als primäre Menüoption positioniert ist.

Deep Think wurde entwickelt, um komplexeste Anfragen zu bewältigen. Es baut auf der Grundlage von Gemini 2.5 Pro auf, indem es seine „Denkzeit“ durch verbesserte parallele Analyse erheblich verlängert. Google erklärt, dass dies der KI ermöglicht, mehrere Lösungsansätze für ein Problem zu erkunden, sogar verschiedene Hypothesen neu zu bewerten und neu zu kombinieren, um qualitativ hochwertigere Ergebnisse zu generieren. Aufgrund seiner intensiven Rechenanforderungen können Antworten von Deep Think mehrere Minuten dauern.

Diese verlängerte Verarbeitungszeit verbessert Berichten zufolge die Fähigkeiten der KI in verschiedenen Bereichen, darunter Designästhetik, wissenschaftliches Denken und komplexe Programmieraufgaben. Googles interne Benchmarks zeigen, dass Deep Think nicht nur den Standard Gemini 2.5 Pro, sondern auch konkurrierende Modelle wie OpenAI o3 und Grok 4 übertrifft. Eine bemerkenswerte Leistung ist sein Abschneiden bei „Humanity’s Last Exam“, einer anspruchsvollen Sammlung von 2.500 multimodalen Fragen aus über 100 Fachgebieten. Deep Think erzielte bei diesem Test 34,8 Prozent und übertraf damit andere Modelle, die typischerweise bei etwa 20 bis 25 Prozent ihren Höhepunkt erreichen.

Mathematik ist ein besonderer Schwerpunkt für Deep Think, das eine starke Leistung im AIME-Benchmark gezeigt hat. Google hob kürzlich eine speziell trainierte Version von Deep Think hervor, die stundenlang verarbeiten kann und eine Goldmedaille bei der Internationalen Mathematik-Olympiade (IMO) erreichte – ein Novum für eine KI. Während diese fortschrittliche IMO-Version derzeit auf vertrauenswürdige Tester beschränkt ist, ist das heute veröffentlichte Standard-Deep Think-Modell immer noch in der Lage, bei der IMO-Prüfung 2025 den Bronzemedaillenstatus zu erreichen.

Trotz der Premium-Abonnementkosten hat Google eine tägliche Abfragelimite für Deep Think-Nutzer eingeführt, obwohl die genaue Anzahl nicht bekannt gegeben wurde und Änderungen unterliegen kann. Google plant, Deep Think schließlich über eine API verfügbar zu machen, um Entwicklern einen kostenpflichtigen Dienst für umfassenderen Zugang anzubieten.