DeepMind dévoile Aeneas AI pour l'analyse de textes anciens

Infoq

Google DeepMind a introduit Aeneas, un modèle innovant d’IA générative conçu pour aider les historiens à déchiffrer et comprendre les inscriptions antiques. Lancé en tant qu’outil open source, Aeneas peut traiter des entrées de texte et d’image, démontrant un bond significatif dans sa capacité à restaurer les caractères manquants dans les textes historiques endommagés, surpassant les modèles de pointe existants.

Aeneas est spécifiquement conçu pour soutenir l’épigraphie, l’étude spécialisée des inscriptions antiques gravées sur la pierre, le métal ou d’autres matériaux durables. Le modèle rationalise plusieurs tâches critiques pour les historiens : dater avec précision les inscriptions, identifier leur origine géographique, reconstruire des textes partiels ou fragmentés, et trouver des “parallèles” — d’autres inscriptions ou textes contenant des mots ou des phrases similaires. À la base, Aeneas exploite une architecture de transformateur multimodale sophistiquée, équipée de composants spécialisés adaptés à chacune de ces fonctions analytiques. Lors des tests comparatifs avec les principaux modèles d’IA et même les experts humains dans divers défis épigraphiques, Aeneas a constamment fourni des résultats supérieurs. Notamment, lorsque les historiens humains ont utilisé Aeneas comme outil collaboratif, leur performance combinée a surpassé les efforts purement humains ou purement IA, soulignant le pouvoir du partenariat homme-IA.

DeepMind envisage Aeneas comme un outil flexible capable de s’adapter à un large éventail de langues, d’écritures et de médias anciens, étendant son utilité au-delà des inscriptions sur pierre pour inclure les papyrus et la numismatique. Cette adaptabilité vise à faciliter les connexions à travers un spectre plus large de preuves historiques et fait partie d’une initiative plus vaste visant à explorer comment l’IA générative peut améliorer l’identification et l’interprétation des parallèles historiques à grande échelle. Pour s’assurer que ses avantages atteignent un large public, une version interactive d’Aeneas a été mise gratuitement à la disposition des chercheurs, des étudiants, des éducateurs et des professionnels des musées.

Aeneas représente une évolution significative par rapport au projet antérieur de DeepMind, Ithaca, un modèle textuel uniquement axé sur l’épigraphie grecque ancienne. Bien qu’Ithaca ait posé les bases, Aeneas introduit des avancées cruciales, notamment la capacité d’entrée d’images, la capacité de reconstruire des inscriptions avec un nombre inconnu de caractères manquants, et la capacité de produire directement des parallèles identifiés — des fonctionnalités absentes de son prédécesseur.

Pour entraîner Aeneas, DeepMind a méticuleusement compilé le Latin Epigraphic Dataset (LED), un vaste corpus comprenant 176 861 inscriptions. Cet immense ensemble de données a été créé en partant de matériaux sources existants, puis en employant un pipeline complexe pour nettoyer, standardiser et intégrer les enregistrements dans un format unifié. Les inscriptions du LED couvrent une vaste période historique, du 7e siècle av. J.-C. au 8e siècle apr. J.-C., et proviennent de diverses régions du monde romain, s’étendant de la Grande-Bretagne à la Mésopotamie.

Pour valider l’efficacité d’Aeneas en tant qu’instrument de recherche, DeepMind a mené une étude impliquant 23 experts en épigraphie. Ces spécialistes ont utilisé Aeneas dans un environnement de recherche simulé du monde réel, avec des contraintes de temps. L’étude a révélé que, bien que les experts humains sélectionnent manuellement des parallèles pour les inscriptions, ils ont fréquemment incorporé au moins un parallèle supplémentaire suggéré par Aeneas. Un chercheur a souligné l’impact profond de l’outil, déclarant que les parallèles récupérés par Aeneas ont complètement modifié leur orientation historique, transformant une tâche qui prendrait normalement des jours en seulement 15 minutes. Ce gain d’efficacité, a noté le chercheur, libérerait un temps considérable pour une analyse plus approfondie et la formulation de questions de recherche.

Bien qu’Aeneas offre des capacités remarquables, les discussions autour du modèle ont également mis en évidence des complexités inhérentes à la recherche en histoire ancienne. Certains observateurs soulignent que même avec une IA avancée, les interprétations historiques impliquent souvent des “suppositions éclairées” basées sur des informations incomplètes ou partiellement corrompues. Ils notent que les données historiques, même des périodes bien documentées, comportent intrinsèquement des “problèmes de qualité des données” en raison des biais et des perspectives des auteurs originaux. Aeneas sert donc d’aide puissante pour naviguer dans ces défis, fournissant des informations robustes tout en reconnaissant la nature interprétative de l’enquête historique. Le code d’Aeneas et une démo interactive sont accessibles au public pour une exploration et une utilisation plus approfondies.