Искусственный интеллект учится расшифровывать поврежденные древнегреческие тексты. При этом машина, по мнению специалистов, справляется с дешифровкой древних текстов лучше, чем люди. Искусственный интеллект с успехом заполняет пропущенные слова, но полезнее всего он оказывается в совместной работе с человеком, когда исследователи используют его для сужения вариантов в процессе поиска нужного слова или высказывания.

Каждый год, как пишет New Scientist, учёные-археологи открывают десятки новых артефактов с текстом. Со временем многие предметы стали разрушаться, что приводит к потерям фрагментов текста. Какими могут быть пробелы, выясняет наука эпиграфика. Работа эпиграфистов начинается с изучения сохранившихся фрагментов и других подобных текстов.

Яннис Ассаэль из DeepMind и его коллеги обучили нейронную сеть по имения Пифия угадывать пропущенные слова или символы из греческих надписей на различных поверхностях, включая камень, керамику и металл. ИИ DeepMind работает с объектами возрастом от 1500 до 2600 лет.

Пифия уже научилась распознавать знакомые паттерны в 35 тысячах реликвий, содержащих более 3 млн слов. Шаблоны, которые использует искусственный интеллект, включают в себя контекст, в котором чаще всего проявляются разные слова, изученную роботом грамматику, а также форму и расположение надписей. Имея надпись с недостающей информацией, Пифия предлагает несколько различных высказываний, которые могут восполнить пробел. Учёные, работающие с тем или иным артефактом, затем могут выбрать лучший, используя свое собственное суждение и знание предмета.

В ходе теста Пифия пыталась заполнить пробелы в 2949 поврежденных текстах. Эксперты-люди, занимавшиеся той же работой, допустили на 27% больше ошибок, чем ИИ. Это с учётом того, что на изучение 50 текстов людям потребовалось два часа, тогда как Пифия выдала свои предположения для того же объёма в считанные секунды. Как гласит документ на arXiv.org, описывающий новый алгоритм, коэффициент ошибок Пифии составляет 30,1% по сравнению с 57,3% ошибок от эпиграфистов-людей.

Это показывает потенциал восстановления древних письменных артефактов с помощью ИИ, говорит Тея Соммершилд из Оксфордского университета.

«Награда за разработку алгоритма огромна, потому что она может помочь нам найти многое обо всех аспектах религии, социальной и экономической жизни древнего мира», — утверждает исследователь в комментарии для New Scientist.

Как считают сами специалисты DeepMind, у нового алгоритма есть большой потенциал в помощи учёным-эпиграфикам.

«Пифия — первая модель восстановления древнего текста в своем роде. Сочетание машинного обучения и эпиграфики имеет большой потенциал для изучения текстовых культур, как древних, так и современных. Мы надеемся помочь будущим исследованиям и вдохновлять на дальнейшую междисциплинарную работу», — заключают авторы алгоритма.

Комментарии (5)


  1. Temtaime
    21.10.2019 22:51
    +2

    А кто определял коэффициент ошибок, если эксперты не справились?


    1. roswell
      21.10.2019 23:49

      Допускаю, что эффективность сравнивалась на уже изученных образцах: между ИИ и, скажем, студентами предвыпускного курса.


    1. Harrix
      21.10.2019 23:53

      Скорее всего используется нормальный полный текст, где искусственно вынимаются куски.


  1. GeorgKDeft
    22.10.2019 09:00

    Для археологов то же ИИ пригодится… а то у них постоянно квест после сбора материала под названием «ну вот ты собрал кучу осколков — как будешь собирать?»)))


    1. Wizard_of_light
      22.10.2019 10:28

      Подозреваю, что первым паззлом занимался ещё древнешумерский бухгалтер, уронивший глиняную табличку с сезонным отчётом.