Mosaic AI 向量搜索重排:RAG 检索提速增智,AI 智能体表现飞跃

Databricks

对于许多部署人工智能智能体的组织而言,主要障碍并非 AI 模型本身的复杂性,而是其接收到的信息质量。如果智能体未能检索到最相关的上下文,即使是最先进的大型语言模型也可能遗漏关键细节,从而导致不完整或不准确的响应。

为应对这一挑战,Mosaic AI 向量搜索正在引入一项新的重排功能,目前已进入公开预览阶段。这项增强功能有望显著提高检索准确性,通过简单地切换一个参数,就在内部企业基准测试中平均提高了 15 个百分点。结果是答案质量显著提升,推理能力更加强大,AI 智能体的性能持续改善,所有这些都无需额外的基础设施或复杂的设置。

重排是一种复杂的技,旨在通过确保为给定任务呈现最相关的数据来提升智能体性能。尽管向量数据库在快速筛选数百万潜在文档以找到广泛相关的候选文档方面效率极高,但重排则应用了更深层次、更细致的上下文理解。第二阶段对初始结果进行重新排序,将语义上最相关的信息置于最顶端。这种两阶段方法——将快速初始检索与智能重新排序相结合——已成为现代检索增强生成 (RAG) 智能体系统不可或缺的一部分,在这些系统中,响应的精度和质量至关重要。

集成重排的决定直接源于客户反馈,这些反馈突出了两个反复出现的问题。首先,AI 智能体常常难以从大量非结构化数据集中找出关键上下文。真正“正确”的信息往往不在标准向量数据库返回的顶部结果中。其次,尽管一些组织尝试构建自己的重排系统以提升智能体质量,但这些定制解决方案的开发耗时(通常需要数周),并且需要大量的持续维护。通过将重排直接嵌入到向量搜索中,组织现在可以利用其受治理的企业数据来浮现最相关的信息,而无需承担额外的工程开销。

这项创新的影响已经显而易见。G3 Enterprises 的高级总监 David Brady 指出,他们的 Lexi 聊天机器人发生了变革性变化:“重排器功能帮助我们的 Lexi 聊天机器人从像高中生一样运作,提升到像法学院毕业生一样表现。我们看到我们的系统在理解、推理和从法律文档生成内容方面取得了变革性的进步,解锁了以前埋藏在非结构化数据中的洞察。”

Databricks 的研究团队通过开发专门为智能体工作负载定制的新型复合 AI 系统,取得了这一突破。在内部企业基准测试中,该系统在 89% 的时间里成功在其前 10 个结果中检索到正确答案(这被称为 recall@10 指标)。这比之前 74% 的基线有了显著的 15 个百分点提升,并且比领先的云替代方案(通常达到 79%)高出 10 个百分点。至关重要的是,这种增强的质量以惊人的速度交付,延迟低至 1.5 秒。相比之下,许多当代系统通常需要数秒甚至数分钟才能返回高质量的答案。该系统经过优化,可以在短短 1.5 秒内对 50 个结果进行重排,确保复杂的检索策略不会影响用户体验。

启用这种企业级重排功能非常简单,只需几分钟而非数周。传统上,团队会花费大量时间研究模型、部署基础设施和编写自定义逻辑。通过向量搜索,激活重排只需在查询中添加一个额外的参数,即可立即提升 AI 智能体的检索质量。这消除了管理单独的模型服务端点、维护自定义包装器或微调复杂配置的需要。此外,用户可以为重排指定多个列,为系统提供除主文本之外的丰富元数据访问权限,例如合同摘要或类别信息,以进一步增强上下文理解和结果相关性。

重排对于任何 RAG 智能体用例都特别有益,即当正确答案存在于更广泛的初始结果集中,但难以出现在前几个结果中时。从技术上讲,这意味着 recall@10 较低但 recall@50 较高的客户——即正确信息在排名前 50 的结果中被检索到,但并非始终在前 10 名中——将可能看到最显著的质量提升。这项新功能代表着在使 AI 智能体更准确、更高效、最终对企业应用更有价值方面迈出了重要一步。