Alexa+ KI-Upgrade: Ist Amazons Smart Assistant endlich schlauer?
Amazons virtueller Assistent Alexa ist seit langem ein fester Bestandteil in Smart Homes und wird hauptsächlich für einfache Aufgaben wie Musikwiedergabe, Timer-Einstellung und Wettervorhersagen verwendet. Das Aufkommen ausgefeilter generativer künstlicher Intelligenz, insbesondere der fließenden Konversationsfähigkeiten, die seit 2023 von Systemen wie ChatGPT demonstriert werden, signalisierte jedoch eine unvermeidliche Evolution für Sprachassistenten. Amazon stimmte dem zu und begann ein ehrgeiziges, mehrjähriges Unterfangen, Alexa mit einem neuen KI-Gehirn zu versehen, das auf denselben großen Sprachmodellen (LLMs) basiert, die auch modernste Chatbots antreiben. Diese umfassende Überarbeitung, die Berichten zufolge von internen Kämpfen und technischen Komplexitäten geprägt war, hat schließlich in Alexa+ gemündet, das nach einer Phase des frühen Zugangs nun breiter ausgerollt wird.
Alexa+ stellt Amazons bedeutenden Versuch dar, die dynamische Konversationsfähigkeit generativer KI mit den zuverlässigen Alltagsfunktionen zu verschmelzen, die die ursprüngliche Alexa definierten. Prime-Mitglieder erhalten ohne zusätzliche Kosten Zugang zu Alexa+, während Nicht-Prime-Abonnenten eine monatliche Gebühr von 19,99 US-Dollar zahlen müssen. Dieser Rollout fällt mit Amazons jüngster Lizenzvereinbarung mit der New York Times zusammen, die es dem Tech-Giganten ermöglicht, Inhalte der Times in seine KI-Systeme, einschließlich Alexa+, zu integrieren. (Es ist erwähnenswert, dass die New York Times gleichzeitig rechtliche Schritte gegen OpenAI und Microsoft wegen angeblicher Urheberrechtsverletzungen im Zusammenhang mit KI-Trainingsdaten unternimmt.)
Erste Tests von Alexa+ zeigen eine Mischung aus Fortschritten und bemerkenswerten Rückschritten. Positiv ist, dass die Interaktion mit der neuen Alexa unbestreitbar ansprechender ist. Ihre synthetischen Stimmen sind realistischer, weisen eine menschenähnliche Kadenz auf, und Benutzer können aus acht verschiedenen Stimmprofilen wählen. Das System bietet auch beeindruckende neue Funktionen, wie das Buchen von Restaurantreservierungen und das Generieren und Erzählen langer Geschichten für Kinder. Entscheidend ist, dass Alexa+ bei der Bearbeitung mehrstufiger Anfragen hervorragend ist und komplexe Befehle wie das gleichzeitige Einstellen mehrerer Timer oder das Entwerfen und Versenden eines Reiseplans per E-Mail gekonnt verwaltet. Eine signifikante Verbesserung der Lebensqualität ist die Eliminierung der ständigen Notwendigkeit eines Weckworts, was natürlichere, kontinuierliche Gespräche und Folgefragen ermöglicht.
Trotz dieser vielversprechenden Fortschritte wird Alexa+ derzeit von Fehlern und Inkonsistenzen geplagt, die ihre Zuverlässigkeit beeinträchtigen. In Tests hinkte sie nicht nur anderen KI-Sprachassistenten hinterher, sondern funktionierte in einigen Fällen bei grundlegenden Funktionen schlechter als die ursprüngliche Alexa. Zum Beispiel wurde ein einfacher Befehl zum Abbrechen eines Alarms, eine Routineaufgabe für das ältere System, unerklärlicherweise ignoriert. Versuche, Alexa+ eine per E-Mail zugesandte Forschungsarbeit zusammenfassen zu lassen, führten zu einer Fehlermeldung, die besagte, dass das Dokument nicht gefunden werden konnte. Besorgniserregender waren Fälle von sachlichen Ungenauigkeiten oder „Halluzinationen“, wie die falsche Identifizierung der von Wirecutter empfohlenen Reibe. In einer denkwürdigen Interaktion, als sie um Hilfe bei einer technischen Installation gebeten wurde, wurde Alexa+ verunsichert und wiederholte: „Oh, nein, meine Leitungen haben sich gekreuzt.“ Darüber hinaus waren einige beworbene Funktionen, wie eine Anwesenheitserkennungsroutine für personalisierte Begrüßungen, während der Tests noch nicht aktiv. Daniel Rausch, Amazons Vizepräsident, der Alexa und Echo beaufsichtigt, räumte diese Mängel ein und erklärte, dass das Unternehmen „einige Kanten zu schleifen“ habe, während das System skaliert wird.
Rausch erläuterte die tiefgreifenden technischen Herausforderungen der Integration generativer KI in Alexa. Die ursprüngliche Alexa basierte auf einer deterministischen, regelbasierten Architektur, bei der jede Funktion – vom Abspielen eines Songs bis zur Steuerung eines Smart Devices – individuelle Programmierung und spezifische Tool-Aufrufe erforderte. Im Gegensatz dazu sind große Sprachmodelle „stochastisch“ und arbeiten mit Wahrscheinlichkeiten, was ihnen Kreativität verleiht, aber die inhärente Zuverlässigkeit älterer Systeme opfert. Dieser grundlegende Unterschied machte eine vollständige Neuprogrammierung vieler Kernprozesse erforderlich. Frühe interne Demos zeigten eine erhebliche Latenz, wobei Alexa+ über 30 Sekunden brauchte, um auf eine einfache Anfrage wie das Abspielen eines Songs zu antworten – eine „qualvolle“ Verzögerung. Die Ausführlichkeit früher LLMs stellte ebenfalls eine Herausforderung dar; eine Anfrage zu einem Timer konnte einen 500-Wörter-Essay über die Geschichte der Küchentimer hervorrufen. Amazons Lösung beinhaltet ein Orchestrierungssystem, das Benutzeranfragen intelligent über eine Kombination von über 70 KI-Modellen leitet, darunter proprietäre Amazon-Modelle und externe Anbieter wie Anthropic’s Claude, um konversationelle Flüssigkeit mit vorhersehbaren Ergebnissen zu verbinden.
Eine weitere Barriere ist die Benutzeranpassung. Langjährige Alexa-Benutzer haben ein spezifisches „Alexa-Sprachgebrauch“ entwickelt, indem sie Anfragen in vertrauten Befehlen formulierten, die das System verstand. Alexa+, das für flüssigere, menschenähnlichere Gespräche konzipiert ist, erfordert einen anderen Interaktionsstil, der die Benutzer dazu zwingt, alte Gewohnheiten abzulegen. Obwohl die technischen Hürden erheblich sind und kein Konkurrent, einschließlich Apples Siri, diesen Code vollständig geknackt hat, entwerten die Einschränkungen von Alexa+ das Potenzial generativer KI für Sprachassistenten nicht grundsätzlich. Vielmehr unterstreichen sie die immense Schwierigkeit, Spitzentechnologie mit etablierten Altsystemen zu integrieren. Vorerst werden viele Benutzer, wie dieser Rezensent, möglicherweise auf die ältere, vorhersehbarere Version von Alexa zurückgreifen und die umfangreichen Beta-Tests anderen überlassen. Letztendlich zählt bei KI, wie auch bei menschlicher Intelligenz, die Rohfähigkeit oft weniger als ihre praktische und zuverlässige Anwendung.