Mosaic AI ベクター検索のリランキング:RAG 検索を高速化し、AI エージェントをさらに賢く
多くの組織が人工知能エージェントを導入する際、主要なハードルとなるのは AI モデル自体の高度さではなく、むしろそれが受け取る情報の質です。エージェントが最も関連性の高いコンテキストを検索できない場合、最も高度な大規模言語モデルであっても重要な詳細を見落とし、不完全または不正確な応答につながる可能性があります。
この課題に対処するため、Mosaic AI Vector Search は新しいリランキング機能を導入しました。これは現在パブリックプレビューで利用可能です。この機能強化は、検索精度を大幅に向上させることが期待されており、単一のパラメータを切り替えるだけで、社内エンタープライズベンチマークで平均15パーセントポイントの改善を示しています。その結果、回答の品質が著しく向上し、より堅牢な推論能力と、AI エージェントの一貫したパフォーマンスの向上が実現します。これらはすべて、追加のインフラストラクチャや複雑な設定を必要としません。
リランキングは、特定のタスクに対して最も関連性の高いデータが提示されるようにすることで、エージェントのパフォーマンスを向上させるために設計された高度な技術です。ベクターデータベースは、数百万もの潜在的なドキュメントを迅速にふるいにかけて、広範囲に関連する候補を見つけるのに非常に効率的ですが、リランキングはより深く、よりニュアンスのある文脈理解を適用します。この第2段階では、初期の結果を並べ替え、意味的に最も関連性の高い情報を最上位に配置します。迅速な初期検索とインテリジェントな再並べ替えを組み合わせるこの2段階アプローチは、応答の精度と品質が最重要視される最新の検索拡張生成(RAG)エージェントシステムにとって不可欠なものとなっています。
リランキングを統合する決定は、顧客からのフィードバックに直接由来しています。このフィードバックは、2つの繰り返し発生する問題を浮き彫りにしました。第一に、AI エージェントは、広大な非構造化データセットに埋もれた重要なコンテキストを特定するのに頻繁に苦労していました。本当に「正しい」情報が、標準的なベクターデータベースが返す上位の結果に含まれていないことがよくありました。第二に、一部の組織はエージェントの品質を向上させるために独自のリランキングシステムを構築しようとしましたが、これらの特注ソリューションは開発に時間がかかり(しばしば数週間)、相当な継続的なメンテナンスが必要でした。リランキングを Vector Search に直接組み込むことで、組織は管理されたエンタープライズデータを活用して最も関連性の高い情報を表面化できるようになり、追加のエンジニアリングオーバーヘッドを発生させる必要がなくなります。
このイノベーションの影響はすでに明らかです。G3 Enterprises のシニアディレクターである David Brady 氏は、同社の Lexi チャットボットに革新的な変化があったと述べています。「リランカー機能は、私たちの Lexi チャットボットを高校生レベルから法科大学院の卒業生レベルのパフォーマンスへと引き上げるのに役立ちました。私たちのシステムが法的文書を理解し、推論し、そこからコンテンツを生成する方法において、以前は非構造化データに埋もれていた洞察を解き放つ、変革的な成果を上げています。」
Databricks の研究チームは、エージェントのワークロードに特化した新しい複合 AI システムを開発することで、この画期的な進歩を達成しました。社内エンタープライズベンチマークでは、このシステムは、上位10件の結果内に正しい回答を89%の確率で取得することに成功しています(recall@10として知られる指標)。これは、以前のベースラインである74%から15ポイントの大幅な改善であり、通常79%を達成する主要なクラウド代替案よりも10ポイント高くなっています。重要なのは、この向上した品質がわずか1.5秒という低遅延で、驚くべき速度で提供されることです。対照的に、多くの現代のシステムは、高品質の回答を返すのに数秒、あるいは数分かかることがよくあります。このシステムは、わずか1.5秒で50件の結果をリランキングするように最適化されており、洗練された検索戦略がユーザーエクスペリエンスを損なわないようにしています。
このエンタープライズグレードのリランキング機能を有効にするのは非常に簡単で、数週間ではなく数分で完了します。従来、チームはモデルの研究、インフラストラクチャのデプロイ、カスタムロジックの記述にかなりの時間を費やしていました。Vector Search を使用すると、リランキングをアクティブ化するためにクエリに1つの追加パラメータを追加するだけで、AI エージェントの検索品質が即座に向上します。これにより、個別のモデル提供エンドポイントを管理したり、カスタムラッパーを維持したり、複雑な設定を微調整したりする必要がなくなります。さらに、ユーザーはリランキングのために複数の列を指定でき、契約の要約やカテゴリ情報など、主要なテキスト以外の豊富なメタデータにシステムがアクセスできるようにすることで、文脈理解と結果の関連性をさらに向上させることができます。
リランキングは、初期結果のより広いセット内に正しい回答が存在するものの、上位数件に表示されにくい RAG エージェントのあらゆるユースケースに特に有益です。技術的には、recall@10 は低いが recall@50 は高い顧客、つまり正しい情報が上位50件の結果内で取得されるものの、上位10件内で一貫して取得されない顧客が、最も顕著な品質向上を経験する可能性が高いことを意味します。この新機能は、AI エージェントをより正確、効率的、そして最終的にはエンタープライズアプリケーションにとってより価値のあるものにするための重要な一歩を表しています。