Alexa+ et l'IA : l'assistant d'Amazon est-il enfin plus intelligent ?

Indianexpress

L’assistant virtuel d’Amazon, Alexa, est depuis longtemps un incontournable des maisons connectées, principalement utilisé pour des tâches simples comme jouer de la musique, régler des minuteries et fournir des prévisions météorologiques. Cependant, l’avènement de l’intelligence artificielle générative sophistiquée, en particulier les capacités conversationnelles fluides démontrées par des systèmes comme ChatGPT depuis 2023, a signalé une évolution inévitable pour les assistants vocaux. Amazon a acquiescé, s’engageant dans une ambitieuse entreprise de plusieurs années pour doter Alexa d’un nouveau cerveau IA, construit sur les mêmes grands modèles de langage (LLM) qui alimentent les chatbots de pointe. Cette refonte étendue, qui aurait été semée d’embûches internes et de complexités techniques, a finalement abouti à Alexa+, qui est maintenant déployé plus largement après une période de tests en accès anticipé.

Alexa+ représente la tentative significative d’Amazon de fusionner les prouesses conversationnelles dynamiques de l’IA générative avec les fonctionnalités quotidiennes fiables qui définissaient l’Alexa originale. Les membres Prime recevront un accès à Alexa+ sans coût supplémentaire, tandis que les abonnés non-Prime devront s’acquitter de frais mensuels de 19,99 $. Ce déploiement coïncide avec le récent accord de licence d’Amazon avec The New York Times, permettant au géant technologique d’intégrer le contenu du Times dans ses systèmes d’IA, y compris Alexa+. (Il est à noter que The New York Times poursuit simultanément des actions en justice contre OpenAI et Microsoft pour des allégations de violation de droits d’auteur liées aux données d’entraînement de l’IA).

Les premiers tests d’Alexa+ révèlent un mélange d’avancées et de régressions notables. Du côté positif, interagir avec la nouvelle Alexa est indéniablement plus engageant. Ses voix synthétiques sont plus réalistes, présentant une cadence humaine, et les utilisateurs peuvent choisir parmi huit profils vocaux distincts. Le système introduit également de nouvelles capacités impressionnantes, telles que la réservation de tables au restaurant et la génération et la narration de longues histoires pour enfants. Surtout, Alexa+ excelle dans la gestion des requêtes en plusieurs étapes, gérant habilement des commandes complexes comme la définition de plusieurs minuteries simultanément ou la rédaction et l’envoi par e-mail d’un itinéraire de voyage. Une amélioration significative de la qualité de vie est l’élimination du besoin constant d’un mot d’activation, permettant des conversations plus naturelles et continues, ainsi que des questions de suivi.

Malgré ces avancées prometteuses, Alexa+ est actuellement en proie à des bugs et des incohérences qui nuisent à sa fiabilité. Lors des tests, non seulement il était à la traîne par rapport à d’autres assistants vocaux IA, mais, dans certains cas, il fonctionnait moins bien que l’Alexa originale pour des fonctions de base. Par exemple, une simple commande d’annulation d’alarme, une tâche de routine pour l’ancien système, a été inexplicablement ignorée. Les tentatives de faire résumer un document de recherche envoyé par e-mail à Alexa+ ont abouti à un message d’erreur indiquant que le document n’a pas pu être trouvé. Plus préoccupantes étaient les instances d’inexactitudes factuelles, ou « hallucinations », telles que l’identification incorrecte de la râpe à boîte recommandée par Wirecutter. Lors d’une interaction mémorable, lorsqu’on lui a demandé de l’aide pour une installation technique, Alexa+ est devenue confuse et a répété : « Oh, non, mes fils se sont croisés. » De plus, certaines fonctionnalités annoncées, comme une routine de détection de présence pour des salutations personnalisées, n’étaient pas encore actives pendant les tests. Daniel Rausch, vice-président d’Amazon supervisant Alexa et Echo, a reconnu ces lacunes, déclarant que l’entreprise a « quelques aspérités à polir » à mesure que le système prend de l’ampleur.

Rausch a élaboré sur les profonds défis techniques de l’intégration de l’IA générative dans Alexa. L’Alexa originale a été construite sur une architecture déterministe, basée sur des règles, où chaque fonction – de la lecture d’une chanson au contrôle d’un appareil intelligent – nécessitait une programmation individuelle et des appels d’outils spécifiques. En revanche, les grands modèles de langage sont « stochastiques », fonctionnant sur des probabilités, ce qui leur confère de la créativité mais sacrifie la fiabilité inhérente des systèmes plus anciens. Cette différence fondamentale a nécessité une reconstruction complète de nombreux processus centraux. Les premières démos internes ont révélé une latence significative, Alexa+ prenant plus de 30 secondes pour répondre à une simple requête comme la lecture d’une chanson – un délai « insupportable ». La verbosité des premiers LLM posait également un défi ; une question sur un minuteur pouvait susciter un essai de 500 mots sur l’histoire des minuteurs de cuisine. La solution d’Amazon implique un système d’orchestration qui achemine intelligemment les requêtes des utilisateurs à travers une combinaison de plus de 70 modèles d’IA, y compris des modèles propriétaires d’Amazon et des fournisseurs externes comme Claude d’Anthropic, visant à combiner la fluidité conversationnelle avec des résultats prévisibles.

Une autre barrière est l’adaptation des utilisateurs. Les utilisateurs de longue date d’Alexa ont développé un « langage Alexa » spécifique, formulant des requêtes dans des commandes familières que le système comprenait. Alexa+, conçu pour une conversation plus fluide et plus humaine, exige un style d’interaction différent, obligeant les utilisateurs à désapprendre les vieilles habitudes. Bien que les obstacles techniques soient importants et qu’aucun concurrent, y compris Siri d’Apple, n’ait entièrement craqué ce code, les limitations d’Alexa+ n’invalident pas intrinsèquement le potentiel de l’IA générative pour les assistants vocaux. Au contraire, elles soulignent l’immense difficulté d’intégrer l’IA de pointe avec des systèmes hérités établis. Pour l’instant, de nombreux utilisateurs pourraient se retrouver, comme ce critique, à opter pour revenir à l’ancienne version plus prévisible d’Alexa, laissant les tests bêta étendus à d’autres. En fin de compte, avec l’IA, comme avec l’intelligence humaine, la capacité brute compte souvent moins que son application pratique et fiable.