DeepMind veröffentlicht Aeneas AI für Altextanalyse

Infoq

Google DeepMind hat Aeneas vorgestellt, ein innovatives generatives KI-Modell, das Historiker beim Entziffern und Verstehen antiker Inschriften unterstützen soll. Als Open-Source-Tool veröffentlicht, kann Aeneas sowohl Text- als auch Bildeingaben verarbeiten und demonstriert einen signifikanten Sprung in seiner Fähigkeit, fehlende Zeichen in beschädigten historischen Texten wiederherzustellen, wobei es bestehende Spitzenmodelle übertrifft.

Aeneas ist speziell darauf ausgelegt, die Epigraphik zu unterstützen, das spezialisierte Studium antiker Inschriften, die in Stein, Metall oder andere haltbare Materialien gemeißelt wurden. Das Modell optimiert mehrere kritische Aufgaben für Historiker: das genaue Datieren von Inschriften, die Identifizierung ihrer geografischen Herkunft, die Rekonstruktion partieller oder fragmentierter Texte und das Auffinden von „Parallelen“ – andere Inschriften oder Texte, die ähnliche Wörter oder Formulierungen enthalten. Im Kern nutzt Aeneas eine hochentwickelte multimodale Transformer-Architektur, ausgestattet mit spezialisierten Komponenten, die auf jede dieser Analysefunktionen zugeschnitten sind. Im Vergleich zu führenden KI-Modellen und sogar menschlichen Experten bei verschiedenen epigraphischen Herausforderungen lieferte Aeneas durchweg überlegene Ergebnisse. Bemerkenswert ist, dass, wenn menschliche Historiker Aeneas als kollaboratives Werkzeug nutzten, ihre kombinierte Leistung sowohl rein menschliche als auch rein KI-basierte Anstrengungen übertraf, was die Kraft der Mensch-KI-Partnerschaft unterstreicht.

DeepMind sieht Aeneas als ein flexibles Werkzeug, das sich an eine Vielzahl antiker Sprachen, Schriften und Medien anpassen kann, wodurch sein Nutzen über Steininschriften hinaus auf Papyri und Münzen erweitert wird. Diese Anpassungsfähigkeit zielt darauf ab, Verbindungen über ein breiteres Spektrum historischer Beweise hinweg zu erleichtern und ist Teil einer größeren Initiative, um zu erforschen, wie generative KI die Identifizierung und Interpretation historischer Parallelen in großem Maßstab verbessern kann. Um sicherzustellen, dass seine Vorteile ein breites Publikum erreichen, wurde eine interaktive Version von Aeneas Forschern, Studenten, Pädagogen und Museumsfachleuten kostenlos zur Verfügung gestellt.

Aeneas stellt eine signifikante Weiterentwicklung von DeepMinds früherem Ithaca-Projekt dar, einem reinen Textmodell, das sich ausschließlich auf die altgriechische Epigraphik konzentrierte. Während Ithaca grundlegende Arbeit leistete, führt Aeneas entscheidende Fortschritte ein, darunter die Fähigkeit zur Bildeingabe, die Fähigkeit, Inschriften mit einer unbekannten Anzahl fehlender Zeichen zu rekonstruieren, und die Fähigkeit, identifizierte Parallelen direkt auszugeben – Merkmale, die im Vorgänger fehlten.

Um Aeneas zu trainieren, hat DeepMind das Lateinische Epigraphische Dataset (LED) sorgfältig zusammengestellt, ein umfangreiches Korpus, das 176.861 Inschriften umfasst. Dieser massive Datensatz wurde durch die Verwendung bestehender Quellmaterialien erstellt und anschließend ein komplexer Prozess angewendet, um die Aufzeichnungen zu bereinigen, zu standardisieren und in ein einheitliches Format zu integrieren. Die Inschriften innerhalb des LED umfassen einen riesigen historischen Zeitraum, vom 7. Jahrhundert v. Chr. bis zum 8. Jahrhundert n. Chr., und stammen aus verschiedenen Regionen der römischen Welt, von Britannien bis Mesopotamien.

Um die Wirksamkeit von Aeneas als Forschungsinstrument zu validieren, führte DeepMind eine Studie mit 23 epigraphischen Experten durch. Diese Spezialisten nutzten Aeneas in einer simulierten realen Forschungsumgebung, komplett mit Zeitbeschränkungen. Die Studie ergab, dass menschliche Experten zwar manuell Parallelen für Inschriften auswählten, sie jedoch häufig mindestens eine von Aeneas vorgeschlagene zusätzliche Parallele integrierten. Ein Forscher hob die tiefgreifende Wirkung des Tools hervor und erklärte, dass die von Aeneas abgerufenen Parallelen ihren historischen Fokus vollständig veränderten und eine Aufgabe, die typischerweise Tage dauern würde, in nur 15 Minuten verwandelten. Dieser Effizienzgewinn, so der Forscher, würde erhebliche Zeit für tiefere Analysen und die Formulierung von Forschungsfragen freisetzen.

Während Aeneas bemerkenswerte Fähigkeiten bietet, haben Diskussionen über das Modell auch die inhärenten Komplexitäten der alten Geschichtsforschung hervorgehoben. Einige Beobachter weisen darauf hin, dass selbst mit fortschrittlicher KI historische Interpretationen oft „fundierte Vermutungen“ auf der Grundlage unvollständiger oder teilweise beschädigter Informationen beinhalten. Sie stellen fest, dass historische Daten, selbst aus gut dokumentierten Perioden, aufgrund von Verzerrungen und Perspektiven der ursprünglichen Autoren von Natur aus „Datenqualitätsprobleme“ aufweisen. Aeneas dient daher als leistungsstarke Hilfe bei der Bewältigung dieser Herausforderungen, indem es robuste Erkenntnisse liefert und gleichzeitig die interpretative Natur der historischen Forschung anerkennt. Der Aeneas-Code und eine interaktive Demo sind öffentlich zugänglich zur weiteren Erkundung und Nutzung.