Meta acquiert WaveForms pour booster l'IA vocale et la superintelligence
Meta Platforms a poursuivi son expansion agressive dans le domaine de l’intelligence artificielle avec l’acquisition de WaveForms, une startup audio IA spécialisée dans la technologie vocale hyperréaliste et émotionnellement intelligente. Cet accord non divulgué marque la deuxième acquisition audio IA significative de Meta en un mois, soulignant une poussée stratégique pour renforcer sa division nouvellement formée des Superintelligence Labs.
WaveForms, fondée il y a seulement huit mois en décembre 2024, s’est rapidement fait un nom dans le secteur en plein essor de la voix IA. La startup basée à San Francisco a réussi à lever 40 millions de dollars en financement de démarrage plus tôt cette année lors d’un tour mené par la célèbre société de capital-risque Andreessen Horowitz, qui a valorisé l’entreprise à 200 millions de dollars. Au cœur de son activité, WaveForms vise à résoudre le « test de Turing vocal », un défi redoutable en IA où un auditeur ne peut pas distinguer la parole humaine de la voix générée par l’IA. Leur technologie se concentre sur le développement de l’« Intelligence Générale Émotionnelle » (EGI) grâce à de grands modèles de langage audio capables d’interpréter et de reproduire les nuances émotionnelles subtiles de la parole humaine. Cette capacité sophistiquée permet des interactions plus fluides, en temps réel et émotionnellement résonnantes avec l’IA.
La startup a été cofondée par Alexis Conneau, un chercheur distingué qui a auparavant contribué à la recherche audio chez Meta et a joué un rôle pivot dans le mode vocal avancé GPT-4o d’OpenAI, et Coralie Lemaitre, une ancienne stratège publicitaire chez Google. Conneau et Lemaitre devraient tous deux rejoindre les Superintelligence Labs de Meta, intégrant directement leur expertise dans les ambitieuses initiatives d’IA du géant technologique.
Cette acquisition fait suite de près à l’achat de PlayAI par Meta en juillet, une autre startup d’IA vocale axée sur la génération de voix humaines, y compris le clonage vocal multilingue et la synthèse vocale en temps réel. L’ensemble de l’équipe PlayAI, composée d’environ 35 personnes, a rejoint Meta et rapporte désormais à Johan Schalkwyk, un ancien chercheur en IA vocale de Google qui est récemment devenu le responsable vocal au sein des Superintelligence Labs. Ces acquisitions consécutives soulignent l’effort concerté de Meta pour combler les lacunes perçues dans ses capacités audio IA, d’autant plus qu’il travaillerait à l’intégration de conversations vocales bidirectionnelles en temps réel dans son chatbot IA.
L’importance stratégique de WaveForms et PlayAI est profondément liée à la vision globale de « superintelligence personnelle » de Meta, articulée par le PDG Mark Zuckerberg. Cette vision vise à développer des systèmes d’IA qui non seulement dépassent les capacités cognitives humaines, mais sont également profondément personnalisés et accessibles à tous, potentiellement via des appareils comme les lunettes intelligentes IA de Meta. Pour y parvenir, Meta s’est lancé dans une campagne d’acquisition de talents sans précédent et un déploiement massif d’infrastructures. Les Superintelligence Labs, officiellement lancés en juillet, consolident les équipes centrales d’IA de Meta sous la direction d’Alexandr Wang, l’ancien PDG de Scale AI, que Meta a recruté en tant que Chief AI Officer après un investissement de 14,3 milliards de dollars dans son entreprise.
Au sein des Superintelligence Labs, une unité spécialisée connue sous le nom de « TBD Lab » développe déjà Llama 4.5, la prochaine génération du modèle linguistique de Meta, en mettant l’accent sur l’amélioration des compétences de raisonnement et d’agent. Meta investit des milliards dans cette entreprise, recrutant les meilleurs chercheurs en IA auprès de rivaux comme OpenAI, Google et Apple avec des packages de rémunération lucratifs, et construisant des centres de données IA colossaux, y compris le supercluster « Prometheus » de plus de 1 gigawatt. Cette stratégie agressive signale le virage de Meta qui s’éloigne de la concurrence directe avec les outils d’IA axés sur la productivité, privilégiant plutôt l’IA pour le divertissement, les connexions sociales et les fonctionnalités de style de vie, tout en visant à automatiser l’ensemble de son flux de travail publicitaire d’ici 2026.
L’acquisition de WaveForms, avec son travail pionnier dans l’IA vocale émotionnelle, positionne Meta pour créer des interactions IA plus empathiques et naturelles sur ses diverses plateformes, des médias sociaux au métavers, visant finalement à approfondir l’engagement des utilisateurs et à redéfinir le paysage de la communication humain-IA.