DeepMind开源Aeneas人工智能,赋能古籍分析

Infoq

谷歌DeepMind推出了Aeneas,这是一款创新的生成式AI模型,旨在帮助历史学家解读和理解古代铭文。Aeneas作为一款开源工具发布,能够处理文本和图像输入,在修复受损历史文献中缺失字符的能力上取得了显著飞跃,其表现优于现有的最先进模型。

Aeneas专为支持金石学(epigraphy)而设计,金石学是专门研究刻在石头、金属或其他耐用材料上的古代铭文的学科。该模型为历史学家简化了多项关键任务:精确测定铭文年代、确定其地理来源、重建部分或残缺的文本,以及寻找“平行文本”(即包含相似词语或短语的其他铭文或文本)。Aeneas的核心是利用复杂的模态转换器架构,配备了针对每项分析功能量身定制的专用组件。在各种金石学挑战中,Aeneas与领先的AI模型甚至人类专家进行基准测试时,始终表现出卓越的成果。值得注意的是,当人类历史学家将Aeneas作为协作工具使用时,他们结合后的表现超越了单独的人类或单独的AI努力,这突显了人机协作的强大力量。

DeepMind设想Aeneas是一款灵活的工具,能够适应各种古代语言、文字和媒介,将其效用从石刻铭文扩展到纸莎草和钱币。这种适应性旨在促进更广泛历史证据之间的联系,并且是探索生成式AI如何大规模增强历史平行文本识别和解释的更大倡议的一部分。为了确保其惠及广大受众,Aeneas的交互式版本已免费提供给研究人员、学生、教育工作者和博物馆专业人士。

Aeneas代表了DeepMind早期Ithaca项目的重大演进,Ithaca是一个仅限文本的模型,只专注于古希腊金石学。虽然Ithaca奠定了基础,但Aeneas引入了关键的进步,包括图像输入能力、重建缺失字符数量未知的铭文的能力,以及直接输出已识别平行文本的能力——这些功能在其前身中是不具备的。

为了训练Aeneas,DeepMind精心编译了拉丁铭文数据集(LED),这是一个包含176,861条铭文的庞大语料库。这个庞大的数据集是通过现有源材料开始构建的,然后采用复杂的流程来清理、标准化并将记录整合为统一格式。LED中的铭文跨越了从公元前7世纪到公元8世纪的漫长历史时期,源自罗马世界各地,从不列颠到美索不达米亚的各个地区。

为了验证Aeneas作为研究工具的有效性,DeepMind进行了一项涉及23位金石学专家的研究。这些专家在模拟的真实研究环境中,在时间限制下使用了Aeneas。研究表明,尽管人类专家手动为铭文选择平行文本,但他们经常采纳Aeneas建议的至少一个额外平行文本。一位研究人员强调了该工具的深远影响,指出Aeneas检索到的平行文本完全改变了他们的历史研究焦点,将一项通常需要数天才能完成的任务缩短到仅仅15分钟。这位研究人员指出,这种效率提升将为更深入的分析和研究问题的构建节省大量时间。

尽管Aeneas提供了卓越的能力,但围绕该模型的讨论也突显了古代历史研究中固有的复杂性。一些观察者指出,即使借助先进的AI,历史解释也常常涉及基于不完整或部分损坏信息的“有根据的猜测”。他们指出,历史数据,即使是来自有充分记录的时期,由于原始作者的偏见和视角,也固有地存在“数据质量问题”。因此,Aeneas在应对这些挑战方面提供了强大的帮助,在承认历史探究的解释性本质的同时,提供了可靠的见解。Aeneas的代码和交互式演示已公开提供,供进一步探索和使用。