Mosaic AI Vector Search : Le Reranking pour un RAG plus Rapide et Précis
Pour de nombreuses organisations qui déploient des agents d’intelligence artificielle, le principal obstacle n’est pas la sophistication du modèle d’IA lui-même, mais plutôt la qualité des informations qu’il reçoit. Si un agent ne parvient pas à récupérer le contexte le plus pertinent, même les modèles de langage de grande taille les plus avancés peuvent manquer des détails critiques, ce qui conduit à des réponses incomplètes ou inexactes.
Pour relever ce défi, Mosaic AI Vector Search introduit une nouvelle fonctionnalité de reranking, désormais disponible en préversion publique. Cette amélioration promet d’augmenter significativement la précision de récupération, démontrant une amélioration moyenne de 15 points de pourcentage sur les benchmarks internes de l’entreprise avec le simple basculement d’un seul paramètre. Le résultat est une amélioration marquée de la qualité des réponses, des capacités de raisonnement plus robustes et des performances constamment meilleures des agents IA, le tout sans nécessiter d’infrastructure supplémentaire ni de configuration complexe.
Le reranking est une technique sophistiquée conçue pour améliorer les performances des agents en garantissant que les données les plus pertinentes sont présentées pour une tâche donnée. Alors que les bases de données vectorielles sont exceptionnellement efficaces pour passer rapidement au crible des millions de documents potentiels afin de trouver des candidats largement pertinents, le reranking applique une compréhension contextuelle plus profonde et plus nuancée. Cette deuxième étape réordonne les résultats initiaux, plaçant les informations sémantiquement les plus pertinentes tout en haut. Cette approche en deux étapes – combinant une récupération initiale rapide avec un réordonnancement intelligent – est devenue indispensable pour les systèmes modernes d’agents de génération augmentée par récupération (RAG), où la précision et la qualité des réponses sont primordiales.
La décision d’intégrer le reranking est directement issue des retours clients, qui ont mis en évidence deux problèmes récurrents. Premièrement, les agents IA avaient souvent du mal à identifier le contexte critique enfoui dans de vastes ensembles de données non structurées. La pièce d’information véritablement « correcte » ne figurait souvent pas parmi les meilleurs résultats renvoyés par une base de données vectorielle standard. Deuxièmement, bien que certaines organisations aient tenté de construire leurs propres systèmes de reranking pour améliorer la qualité des agents, ces solutions sur mesure se sont avérées chronophages à développer – prenant souvent des semaines – et nécessitaient une maintenance continue substantielle. En intégrant le reranking directement dans Vector Search, les organisations peuvent désormais exploiter leurs données d’entreprise gouvernées pour faire remonter les informations les plus pertinentes sans encourir de frais d’ingénierie supplémentaires.
L’impact de cette innovation est déjà évident. David Brady, directeur principal chez G3 Enterprises, a noté un changement transformateur dans leur chatbot Lexi : « La fonctionnalité de reranking a aidé à élever notre chatbot Lexi d’un fonctionnement de lycéen à une performance de diplômé en droit. Nous avons constaté des gains transformateurs dans la façon dont nos systèmes comprennent, raisonnent et génèrent du contenu à partir de documents juridiques, débloquant des informations qui étaient auparavant enfouies dans des données non structurées. »
L’équipe de recherche de Databricks a réalisé cette percée en développant un nouveau système d’IA composite spécifiquement adapté aux charges de travail des agents. Sur les benchmarks internes de l’entreprise, ce système récupère avec succès la bonne réponse dans ses 10 meilleurs résultats 89 % du temps (une métrique connue sous le nom de rappel@10). Cela représente une amélioration substantielle de 15 points par rapport à la ligne de base précédente de 74 % et est 10 points plus élevée que les alternatives cloud de pointe, qui atteignent généralement 79 %. Crucialement, cette qualité améliorée est livrée avec une vitesse remarquable, avec des latences aussi basses que 1,5 seconde. En revanche, de nombreux systèmes contemporains nécessitent souvent plusieurs secondes, voire des minutes, pour renvoyer des réponses de haute qualité. Le système est optimisé pour reranker 50 résultats en aussi peu que 1,5 seconde, garantissant que les stratégies de récupération sophistiquées ne compromettent pas l’expérience utilisateur.
L’activation de cette capacité de reranking de niveau entreprise est remarquablement simple, prenant des minutes plutôt que des semaines. Traditionnellement, les équipes consacraient un temps considérable à la recherche de modèles, au déploiement d’infrastructures et à l’écriture de logiques personnalisées. Avec Vector Search, l’activation du reranking nécessite d’ajouter un seul paramètre supplémentaire à une requête, améliorant instantanément la qualité de récupération pour les agents IA. Cela élimine le besoin de gérer des points de terminaison de service de modèles séparés, de maintenir des wrappers personnalisés ou d’affiner des configurations complexes. De plus, les utilisateurs peuvent spécifier plusieurs colonnes pour le reranking, offrant au système un accès à des métadonnées riches au-delà du texte principal, telles que des résumés de contrat ou des informations de catégorie, afin d’améliorer davantage la compréhension contextuelle et la pertinence des résultats.
Le reranking est particulièrement bénéfique pour tout cas d’utilisation d’agent RAG où la bonne réponse est présente dans un ensemble plus large de résultats initiaux mais a du mal à apparaître parmi les premiers. En termes techniques, cela signifie que les clients avec un faible rappel@10 mais un rappel@50 élevé – où les informations correctes sont récupérées dans les 50 premiers résultats mais pas systématiquement dans les 10 premiers – verront probablement les gains de qualité les plus significatifs. Cette nouvelle fonctionnalité représente un pas en avant significatif pour rendre les agents IA plus précis, plus efficaces et, en fin de compte, plus précieux pour les applications d’entreprise.