DeepMind、古代テキスト分析用AI「Aeneas」をオープンソース化

Infoq

Google DeepMindは、歴史学者が古代の碑文を解読し、理解するのを支援するために設計された革新的な生成AIモデル「Aeneas」を発表しました。オープンソースツールとして公開されたAeneasは、テキストと画像の両方の入力を処理でき、損傷した歴史的テキストの欠落文字を復元する能力において顕著な飛躍を遂げ、既存の最先端モデルを凌駕しています。

Aeneasは特に碑文学(epigraphy)を支援するために設計されています。碑文学とは、石、金属、その他の耐久性のある素材に刻まれた古代の碑文を専門的に研究する学問です。このモデルは、歴史家にとってのいくつかの重要なタスクを効率化します。具体的には、碑文の正確な年代特定、地理的起源の特定、部分的または断片的なテキストの再構築、そして「並行資料」(類似の単語やフレーズを含む他の碑文やテキスト)の発見です。Aeneasの核となるのは、洗練されたマルチモーダルなトランスフォーマーアーキテクチャであり、これらの各分析機能に特化した専用コンポーネントを備えています。さまざまな碑文学的課題において、主要なAIモデルや人間の専門家と比較した場合、Aeneasは一貫して優れた結果を出しました。特筆すべきは、人間の歴史家がAeneasを協調ツールとして使用した際、彼らの複合的なパフォーマンスが人間単独またはAI単独の努力を上回ったことであり、人間とAIのパートナーシップの力を際立たせています。

DeepMindはAeneasを、幅広い古代言語、文字、メディアに適応できる柔軟なツールと位置付けており、その有用性を石碑の碑文だけでなく、パピルスや貨幣にも拡大することを目指しています。この適応性により、より広範な歴史的証拠間のつながりを促進することが期待されており、生成AIがいかにして歴史的並行資料の識別と解釈を大規模に強化できるかを探る、より大きなイニシアティブの一部です。その恩恵を幅広い層に届けるため、Aeneasのインタラクティブ版は研究者、学生、教育者、博物館の専門家に無料で提供されています。

Aeneasは、DeepMindの以前のIthacaプロジェクト(古代ギリシャの碑文学のみに焦点を当てたテキスト専用モデル)からの significantな進化を遂げています。Ithacaが基礎を築いた一方で、Aeneasは画像入力能力、欠落文字数が不明な碑文を再構築する能力、そして識別された並行資料を直接出力する能力といった重要な進歩を導入しており、これらは先行モデルにはなかった機能です。

Aeneasを訓練するために、DeepMindはラテン碑文データセット(LED)を綿密に編集しました。これは176,861の碑文を含む広範なコーパスです。この膨大なデータセットは、既存のソース資料から開始し、その後、複雑なパイプラインを用いて記録をクリーンアップ、標準化し、統一された形式に統合することによって作成されました。LED内の碑文は、紀元前7世紀から紀元8世紀までの広範な歴史期間にわたり、ブリテンからメソポタミアまで、ローマ世界の多様な地域に由来しています。

Aeneasの研究ツールとしての有効性を検証するため、DeepMindは23人の碑文学専門家を対象とした研究を実施しました。これらの専門家は、時間的制約のあるシミュレートされた実世界の研究環境でAeneasを使用しました。研究の結果、人間の専門家が碑文の並行資料を手動で選択する際、Aeneasが提案する少なくとも1つの追加の並行資料を頻繁に取り入れていることが明らかになりました。ある研究者は、このツールの深い影響を強調し、Aeneasが検索した並行資料が彼らの歴史的焦点を完全に変え、通常なら数日かかるタスクをわずか15分に短縮したと述べました。この効率向上により、より深い分析や研究課題の策定にかなりの時間を割くことができるだろうと、その研究者は指摘しました。

Aeneasは目覚ましい能力を提供しますが、このモデルに関する議論は、古代史研究における固有の複雑さも浮き彫りにしています。一部の観察者は、高度なAIを用いたとしても、歴史的解釈は不完全または部分的に破損した情報に基づいた「推測」を伴うことが多いと指摘しています。彼らは、たとえ十分に文書化された時代の歴史データであっても、元の著者の偏見や視点のために本質的に「データ品質の問題」を抱えていると述べています。したがって、Aeneasはこれらの課題を乗り越えるための強力な助けとなり、歴史的探求の解釈的性質を認めつつ、堅牢な洞察を提供します。Aeneasのコードとインタラクティブデモは、さらなる探索と利用のために一般公開されています。