Nvidiaの研究室:4兆ドルAI・ロボティクス成長の原動力
2009年にビル・ダリーがNvidiaの研究室に加わったとき、そこはわずか10数人のささやかな組織で、主にコンピューターグラフィックスで使用される高度なレンダリング技術であるレイトレーシングに焦点を当てていました。今日、かつて小さかったこの研究部門は400人以上に成長し、Nvidiaをビデオゲーム用GPUで知られる90年代のスタートアップから、人工知能革命の最前線に立つ4兆ドルの大企業へと変貌させる上で極めて重要な役割を果たしています。現在、この研究室はロボティクスと高度なAIのための基盤技術開発に注力しており、その先駆的な研究の一部は、最近発表されたロボティクス開発者向けの新しいAIモデル、ライブラリ、インフラストラクチャのスイートなど、すでに商用製品に登場しています。
現在Nvidiaのチーフサイエンティストであるダリーは、スタンフォード大学に在籍中の2003年から同社のコンサルタントを務め始めました。数年後、スタンフォード大学コンピューターサイエンス学部長を辞任する準備をしていた彼は、サバティカル休暇を計画していました。しかし、Nvidiaには別のビジョンがありました。当時研究室を率いていたデイビッド・カークとNvidiaのCEOジェンスン・フアンは、常勤職の方が優れた道だと信じていました。ダリーは、彼を説得するための「フルコートプレス」(全面的な働きかけ)を回想し、その努力が最終的に成功したと語りました。彼は、その役割が自身の興味と才能に「完璧に合致」し、世界に最も大きな貢献ができる場所になったと振り返っています。
2009年に研究室の指揮を執った際、ダリーは拡張を優先しました。研究者たちはすぐにレイトレーシングの枠を超え、回路設計や超大規模集積回路(VLSI)といった分野に深く踏み込みました。VLSIは、数百万個のトランジスタを単一のマイクロチップに集積する複雑なプロセスです。それ以来、研究室の成長は継続的です。ダリーは、研究に対する戦略的なアプローチを強調し、常に新しく魅力的な分野を評価し、会社に最も良い影響を与える可能性のあるものを見極めています。
かなりの期間、この戦略的焦点は人工知能用の優れたGPUを構築することにありました。Nvidiaは、急成長するAI分野に驚くほど早くから参入し、現在のAIブームが本格化する10年以上も前の2010年には、AI最適化GPUの概念を探求していました。ダリーは、AIの変革の可能性を早期に認識し、フアンに「倍賭けする」よう説得したことを回想しています。この先見性が、彼らのGPUの専門化、広範なサポートソフトウェアの開発、そして主流がその重要性を認識するずっと前から、世界中のAI研究者との積極的な連携につながりました。
Nvidiaが現在AI GPU市場で支配的な地位を占める中、同社の研究努力はAIデータセンター以外の新たなフロンティアを特定することにシフトしました。この探求により、彼らは物理AIとロボティクスに真っ向から取り組むことになりました。ダリーは、ロボットが巨大な世界的勢力となる未来を構想しており、Nvidiaは「すべてのロボットの頭脳」となることを目指しています。そのためには、重要な基盤技術の開発が不可欠です。
ここにNvidiaのAI研究担当バイスプレジデントであるサンジャ・フィドラーが登場します。フィドラーは2018年に研究室に加わりましたが、すでにMITのチームとロボットのシミュレーションモデル開発に携わっていました。彼女の仕事は、研究者レセプションでジェンスン・フアンの即座の関心を引きました。フィドラーは、Nvidiaへの参加決定を抗しがたいものだったと述べ、魅力的なテーマと強い文化的一致の両方を挙げました。フアンの「私たちと一緒にではなく、私のためにではなく、私と一緒に働こう」という誘いは、深く心に響きました。
その後、フィドラーはトロントに研究室を設立し、Nvidiaの仮想世界作成プラットフォームであるOmniverse内で物理AIのシミュレーション構築に注力しました。これらのシミュレートされた環境を構築する上での主要な課題は、必要な3Dデータの取得でした。これには、膨大な量の潜在的な画像を収集するだけでなく、これらの画像をシミュレーターが使用できる3Dレンダリングに変換する技術の開発も含まれていました。Nvidiaは、「微分可能レンダリング」に投資しました。これは、レンダリングをAIに適したものにする技術で、2D画像やビデオを3Dモデルに変換することを可能にします。
Omniverseは2021年に画像から3Dモデルへの最初の反復であるGANverse3Dをリリースし、その後ビデオについても同じプロセスに取り組みました。ロボットや自動運転車のビデオを利用して、2022年に初めて発表されたNeuric Neural Reconstruction Engineを開発し、これらの高度な3Dモデルとシミュレーションを作成しました。これらのイノベーションは、1月にCESで発表された同社のCosmosファミリーのワールドAIモデルの技術的バックボーンを形成しています。
研究室の現在の焦点は、これらのモデルを大幅に高速化することです。ビデオゲームがリアルタイム応答性を必要とするのと同様に、ロボットはさらに速い反応時間を要求します。フィドラーは、ロボットが世界を100倍速く処理できる可能性があると説明しており、これらのモデルを大幅に高速化することは、ロボティクスおよび物理AIアプリケーションにとって非常に価値があるでしょう。Nvidiaはこの分野で進歩を続けており、最近、ロボットの訓練用合成データ生成のために特別に設計された新しいワールドAIモデルのフリートを、ロボティクス開発者向けの新しいライブラリとインフラストラクチャソフトウェアとともに発表しました。
急速な進歩と、特にヒューマノイドロボットを取り巻く現在の熱狂にもかかわらず、Nvidiaの研究チームは現実的な視点を保っています。ダリーとフィドラーの両者は、家庭へのヒューマノイドの広範な普及はまだ数年先だと警告し、自動運転車に関連する誇大広告とタイムラインに例を挙げています。ダリーは、ロボットの知覚を可能にする視覚AIから、タスクや動作計画、操作を支援する生成AIまで、AIが決定的なイネーブラーであったことを強調しています。個々の課題が克服され、ニューラルネットワークの訓練データの量が増加するにつれて、これらのロボットの能力は指数関数的に成長し続けるでしょう。