Databricks:エージェントAIの真価は行動にあり、データ量ではない

Fastcompany

過去5年間、人工知能モデルのデータ処理と推論能力の急速な進歩は、企業および産業開発者の間で絶え間ない追求を煽ってきました。それは、より大規模なモデルを構築し、ますます野心的なベンチマークを目指すことです。現在、エージェントAIが生成AIの次の主要な進化形として浮上するにつれて、よりスマートで繊細なAIエージェントへの需要が高まっています。しかし、逆説的に、AIの知能を測る主要な尺度は、そのモデルサイズや純粋なトレーニングデータの量に結び付けられ、あまりにも単純なままです。

データ分析およびAI企業であるDatabricksは、この現在のAI軍拡競争が決定的な点を根本的に見落としていると主張しています。生産環境において、AIの真の価値は、抽象的な意味で「知っている」ことではなく、利害関係者がそれに依存する際に、どれほど効果的に機能するかです。DatabricksのチーフAIサイエンティストであるジョナサン・フランクリー氏は、AIモデルからの真の信頼と具体的な投資収益は、それが含む情報の純粋な量からではなく、実世界の生産設定におけるその行動から直接生まれると強調しています。

予測可能な出力を生成するために決定論的なルールに基づいて動作する従来のソフトウェアとは異なり、AIモデルは確率的な結果を生成します。この固有の特性は、それらがどのように評価されるべきかを根本的に変えます。「AIシステムについて測定できる唯一のことは、その動作です。内部を見ることはできません。ソースコードに相当するものはありません」とフランクリー氏は説明します。彼は、公開ベンチマークが一般的な能力の有用なスナップショットを提供する一方で、企業はこれらの広範な指標に過度に依存し、それらを実世界での適用性の指標と誤解していると主張します。

フランクリー氏は、本当に重要なのは、ビジネス固有のデータに対する厳格かつ継続的な評価であると断言します。このような正確な評価は、出力品質の測定、モデル動作の洗練、そしてAIが時間とともに改善することを可能にする強化学習戦略の効果的な誘導に不可欠です。彼は、一般的な非公式なAI導入アプローチを批判しています。「今日、人々はしばしばプロンプトを書き、いくつかの入力を試し、その感触を確認してエージェントをデプロイしています。ソフトウェアでは決してそんなことはしませんし、AIでもすべきではありません。」彼は、この安易な方法論が信頼性の低いパフォーマンスの元凶であり、AIの可能性を最大限に引き出す上での障壁であると示唆しています。

最終的に、Databricksが提唱する焦点の転換は、AI産業の成熟を表しています。それは、生の計算能力やデータ量の魅力を超え、より実用的でパフォーマンス重視のアプローチへと移行し、AIの真の知能が、現実世界の複雑な運用状況における信頼できる有益な行動を通じて証明されることを意味します。