Meta、AI音声スタートアップWaveForms買収で超知能強化へ

Theaiinsider

Meta Platformsは、超リアルで感情豊かな音声技術に特化したAIオーディオスタートアップであるWaveFormsの買収により、人工知能の最前線への積極的な拡大を続けています。この非公開の取引は、Metaにとって1ヶ月で2度目となる重要なAIオーディオ買収であり、新設されたスーパーインテリジェンスラボ部門を強化するための戦略的な推進を強調しています。

WaveFormsは、わずか8ヶ月前の2024年12月に設立されたばかりですが、急成長するAI音声分野で急速にその名を馳せました。サンフランシスコに拠点を置くこのスタートアップは、今年初めに著名なベンチャーキャピタル企業であるAndreessen Horowitzが主導するラウンドで4000万ドルのシード資金調達に成功し、同社の評価額は2億ドルに達しました。WaveFormsの核となる目標は、「音声チューリングテスト」を解決することです。これは、聞き手が人間の音声とAIが生成した音声を区別できないというAIにおける手ごわい課題です。彼らの技術は、人間の音声における微妙な感情のニュアンスを解釈し、複製できるオーディオ大規模言語モデルを通じて、「感情一般知能」(EGI)を開発することに焦点を当てています。この洗練された機能により、AIとのよりシームレスでリアルタイムな、感情に響くインタラクションが可能になります。

このスタートアップは、Metaのオーディオ研究に以前貢献し、OpenAIのGPT-4oアドバンストボイスモードで極めて重要な役割を果たした著名な研究者であるAlexis Conneauと、元Googleの広告戦略家であるCoralie Lemaitreによって共同設立されました。ConneauとLemaitreの両氏は、Metaのスーパーインテリジェンスラボに参加し、彼らの専門知識をこのテクノロジー大手の野心的なAIイニシアチブに直接統合する予定です。

この買収は、Metaが7月にPlayAIを買収した直後に行われました。PlayAIは、多言語音声クローンやリアルタイム音声合成を含む、人間のような声を生成することに焦点を当てた別の音声AIスタートアップです。約35名からなるPlayAIチーム全体がMetaに加わり、現在は元Googleの音声AI研究者で、最近スーパーインテリジェンスラボの音声リーダーに就任したJohan Schalkwykに報告しています。これらの連続した買収は、MetaがAIオーディオ能力における認識されているギャップを埋めるための協調的な努力を強調しています。特に、同社がリアルタイムの双方向音声会話をAIチャットボットに統合する取り組みを進めていると報じられている中で、その重要性が際立ちます。

WaveFormsとPlayAIの戦略的重要性は、MetaのCEOマーク・ザッカーバーグが提唱する「パーソナルスーパーインテリジェンス」という包括的なビジョンと深く結びついています。このビジョンは、人間の認知能力を超えるだけでなく、高度にパーソナライズされ、誰もが利用できるAIシステムを開発することを目指しており、MetaのAIスマートグラスのようなデバイスを通じて実現される可能性があります。これを達成するため、Metaは前例のない人材獲得競争と大規模なインフラ構築に着手しました。7月に正式に発足したスーパーインテリジェンスラボは、Metaの主要AIチームを、元Scale AIのCEOであり、Metaが同社に143億ドルを投資した後にAI最高責任者として招いたAlexandr Wangのリーダーシップのもとで統合します。

スーパーインテリジェンスラボ内では、「TBDラボ」として知られる専門ユニットが、Metaの次世代言語モデルであるLlama 4.5の開発をすでに進めており、推論能力とエージェントスキルの強化に焦点を当てています。Metaはこの取り組みに数十億ドルを投じ、OpenAI、Google、Appleなどの競合他社から高額な報酬パッケージでトップAI研究者を引き抜き、「プロメテウス」と呼ばれる1ギガワット超のスーパークラスターを含む巨大なAIデータセンターを建設しています。この積極的な戦略は、Metaが生産性重視のAIツールとの直接競争から脱却し、エンターテイメント、ソーシャルコネクション、ライフスタイル機能のためのAIを優先することを示しており、同時に2026年までに広告ワークフロー全体を自動化することも目指しています。

WaveFormsの感情音声AIにおける先駆的な取り組みは、Metaがソーシャルメディアからメタバースに至る多様なプラットフォーム全体で、より共感的で自然なAIインタラクションを創造することを可能にし、最終的にはユーザーエンゲージメントを深め、人間とAIのコミュニケーションのあり方を再定義することを目指しています。