DeepMind开源Aeneas人工智能，赋能古籍分析

谷歌DeepMind推出了Aeneas，这是一款创新的生成式AI模型，旨在帮助历史学家解读和理解古代铭文。Aeneas作为一款开源工具发布，能够处理文本和图像输入，在修复受损历史文献中缺失字符的能力上取得了显著飞跃，其表现优于现有的最先进模型。

Aeneas专为支持金石学（epigraphy）而设计，金石学是专门研究刻在石头、金属或其他耐用材料上的古代铭文的学科。该模型为历史学家简化了多项关键任务：精确测定铭文年代、确定其地理来源、重建部分或残缺的文本，以及寻找“平行文本”（即包含相似词语或短语的其他铭文或文本）。Aeneas的核心是利用复杂的模态转换器架构，配备了针对每项分析功能量身定制的专用组件。在各种金石学挑战中，Aeneas与领先的AI模型甚至人类专家进行基准测试时，始终表现出卓越的成果。值得注意的是，当人类历史学家将Aeneas作为协作工具使用时，他们结合后的表现超越了单独的人类或单独的AI努力，这突显了人机协作的强大力量。

DeepMind设想Aeneas是一款灵活的工具，能够适应各种古代语言、文字和媒介，将其效用从石刻铭文扩展到纸莎草和钱币。这种适应性旨在促进更广泛历史证据之间的联系，并且是探索生成式AI如何大规模增强历史平行文本识别和解释的更大倡议的一部分。为了确保其惠及广大受众，Aeneas的交互式版本已免费提供给研究人员、学生、教育工作者和博物馆专业人士。

Aeneas代表了DeepMind早期Ithaca项目的重大演进，Ithaca是一个仅限文本的模型，只专注于古希腊金石学。虽然Ithaca奠定了基础，但Aeneas引入了关键的进步，包括图像输入能力、重建缺失字符数量未知的铭文的能力，以及直接输出已识别平行文本的能力——这些功能在其前身中是不具备的。

为了训练Aeneas，DeepMind精心编译了拉丁铭文数据集（LED），这是一个包含176,861条铭文的庞大语料库。这个庞大的数据集是通过现有源材料开始构建的，然后采用复杂的流程来清理、标准化并将记录整合为统一格式。LED中的铭文跨越了从公元前7世纪到公元8世纪的漫长历史时期，源自罗马世界各地，从不列颠到美索不达米亚的各个地区。

为了验证Aeneas作为研究工具的有效性，DeepMind进行了一项涉及23位金石学专家的研究。这些专家在模拟的真实研究环境中，在时间限制下使用了Aeneas。研究表明，尽管人类专家手动为铭文选择平行文本，但他们经常采纳Aeneas建议的至少一个额外平行文本。一位研究人员强调了该工具的深远影响，指出Aeneas检索到的平行文本完全改变了他们的历史研究焦点，将一项通常需要数天才能完成的任务缩短到仅仅15分钟。这位研究人员指出，这种效率提升将为更深入的分析和研究问题的构建节省大量时间。

尽管Aeneas提供了卓越的能力，但围绕该模型的讨论也突显了古代历史研究中固有的复杂性。一些观察者指出，即使借助先进的AI，历史解释也常常涉及基于不完整或部分损坏信息的“有根据的猜测”。他们指出，历史数据，即使是来自有充分记录的时期，由于原始作者的偏见和视角，也固有地存在“数据质量问题”。因此，Aeneas在应对这些挑战方面提供了强大的帮助，在承认历史探究的解释性本质的同时，提供了可靠的见解。Aeneas的代码和交互式演示已公开提供，供进一步探索和使用。

DeepMind开源Aeneas人工智能，赋能古籍分析

相关文章

DeepSeek V3.1重磅发布：开源AI巨头挑战OpenAI，性能突破惊艳业界

MIT人工智能模型精准预测分子在溶剂中的溶解度

dots.ocr：新型17亿参数开源VLM实现多语言文档解析SOTA