Компания Google DeepMind создала открытую нейросеть Aeneas, способную восстанавливать утраченные фрагменты древних латинских надписей. Информация опубликована на официальном сайте проекта. Разработка ориентирована на помощь историкам и эпиграфистам в интерпретации поврежденных памятников римской письменности.
Aeneas работает на основе анализа контекста: учитываются период и место обнаружения артефакта, что позволяет сузить круг возможных вариантов. Модель сопоставляет словарный запас, типичный для конкретной эпохи и региона, а также актуальные события того времени. Это помогает алгоритму максимально точно «предсказать» утраченные слова. При этом разработчики подчёркивают, что модель не гарантирует абсолютную точность, особенно в случаях, когда неизвестна длина утраченного фрагмента. Точность восстановления при повреждении до 10 % — 73 %; при неизвестной длине — 58 %
Aeneas названа в честь Энея из древнеримского эпоса. Она создана командой DeepMind совместно с учеными из университетов Ноттингема, Уорвика, Оксфорда и Афин.
Алгоритм обучили на ~176 000 латинских надписях (всего 16 млн символов). Он обрабатывает текстовые и визуальные данные, определяет, где (зависит от одной из 62 провинций) и когда (с точностью до ±13 лет) была создана надпись. При этом он находит аналогии текста по стилю, форме и контексту.
Интерактивная версия Aeneas доступна на сайте predictingthepast.com. Код и база данных открыты для исследовательского использования.
По мнению разработчиков, использование ИИ в эпиграфике позволит восстанавливать больше исторической информации даже при частичных утраченных данных. Ведь даже ошибаясь в конкретных словах, Aeneas может подсказать основной посыл текста.