Google DeepMind、新「Genie 3」でAIロボットを仮想空間訓練
Google DeepMindは、人工知能システムを訓練するための現実的な仮想環境を生成できる新しい「世界モデル」Genie 3を発表しました。この開発は、このテクノロジーの巨人によると、AIが特定の機能に限定されず、人間レベルで幅広いタスクを実行できる仮説的な状態である汎用人工知能(AGI)の達成に向けた重要な一歩を表しています。
Genie 3モデルは、AIシステムが現実世界を説得力を持ってシミュレーションした環境内で相互作用することを可能にします。Googleは、例えば、非常にリアルな仮想倉庫内でロボットや自動運転車がナビゲートし学習できるようにすることで、それらの訓練に不可欠な役割を果たす可能性があると示唆しています。GoogleのAI部門であるDeepMindは、このような世界モデルが、自律的にタスクを実行するように設計されたシステムであるAIエージェントの開発にとって極めて重要な要素であると強調しています。同社は、AIエージェントがより普及し、同社がAGIに向けて進むにつれて、この技術が重要な役割を果たすと予測しています。
Genie 3は、テキストプロンプトからこれらのシミュレートされたシナリオを瞬時に作成します。ユーザーは、さらなるテキストコマンドで仮想環境を迅速に修正することもできます。例えば、スキーの斜面に鹿の群れを導入するなどです。AIの訓練以外にも、GoogleはGenie 3が人間が訓練や探索のためにさまざまなシミュレーションを体験することを可能にする可能性があると述べています。例えば、仮想スキーや山湖の周りを散歩するなどです。
Googleはジャーナリストに仮想スキーや倉庫のシナリオをデモンストレーションしましたが、同社はGenie 3がまだ完全な一般公開の準備ができていないと述べ、一連の制限を理由に発売日を提供しませんでした。これらのシミュレーションの品質は、Googleの最新のビデオ作成モデルVeo 3に匹敵すると報告されていますが、Genie 3のシミュレーションは数分間持続でき、Veo 3の8秒のクリップよりも大幅に長いです。この発表は、OpenAIのCEOであるサム・アルトマンが、今後のGPT-5モデルについて最近示唆したことに続き、AI分野での競争が激化する中で行われました。
AGIに関する議論は、自律システムがさまざまな役割を担うことでホワイトカラーの仕事に与える潜在的な影響に焦点を当てる傾向がありますが、Googleは主に世界モデルをロボット工学と自動運転車の進歩のための基礎技術と見なしています。例えば、リアルな物理学と人間との相互作用を備えたシミュレートされた倉庫は、ロボットを効果的に訓練し、安全で制御された環境でその行動を学習し洗練させることを可能にします。Googleはまた、ビデオゲームの設定内でタスクを実行できる仮想エージェントSimaを開発しましたが、Genie 3と同様に、これも一般公開されていません。
この分野の専門家は、このようなモデルの重要性を強調しています。エディンバラ大学のロボット学習と自律性の教授であるスブラマニアン・ラマムールティ教授は、世界モデルをロボット開発にとって「極めて重要」であると説明しました。彼は、「柔軟な意思決定を達成するために、ロボットは物理世界で実行する最良の行動を選択するために、異なる行動の結果を予測する必要があります」と説明しました。
サリー大学の人間中心AI研究所のアンドリュー・ロゴイスキーは、世界モデルがChatGPTのようなチャットボットを支える技術である大規模言語モデル(LLM)にも利益をもたらす可能性があると付け加えました。彼は、「実体を持たないAIに、仮想的ではあるが実体を持つ能力を提供すること」が、「世界、またはある世界を探求し、結果として能力を向上させる」ことを可能にすると信じています。この仮想的な物理的探索は、より強力でインテリジェントなAIを作成するための重要な側面を追加し、膨大な量のインターネットデータに関する既存の訓練を補完すると彼は示唆しています。Googleの研究者は以前、LLMは計画に優れているものの、人間の代わりに実際に行動する能力がしばしば欠けており、世界モデルがこのギャップを埋めるのに役立つ可能性があると指摘していました。