Где только не применяют нейросети — от интернета вещей до распознавания текстов, в том числе древних рукописей. В этот раз машинное обучение помогло разобраться в свитках из Иудейской пустыни.
Почему такой интерес к рукописям? Долгое время богословы и историки спорили об авторстве Великого свитка пророка Исайи, датируемом вторым веком до нашей эры. Это один из самых древних в мире сохранившихся текстов (ему больше 2 тыс. лет) из книг Ветхого Завета. Нейросеть помогла ученым идентифицировать двух составителей.
Сложность идентификации
Изучением древних библейских рукописей занимается палеография — наука об эволюции графических форм букв. Одна из центральных проблем этой науки — персонализация личности писателя с помощью характерных для его письма «маркеров». Почему это сложно? В античности стиль письма у всех авторов был слишком похожим, все стремились к единообразию. Проблему стали плотно изучать ученые из Нидерландов в рамках проекта «The Hands that Wrote the Bible» (дословно — «Руки, которые написали библию»).
Ученые из Гронингенского университета занимались идентификацией писцов с помощью нейросети. Они планировали узнать, сколько людей составляли Великий свиток Исайи.
С помощью нейросети выделили стилевые признаки авторов, отделив чернила от пергамента. Затем начертательные элементы преобразовали в графические векторы букв. С помощью нейронной сети отследили переходы стиля написания букв в разных столбцах.
Образцы символов сравнили с рандомными знаками из рукописи и соседними буквами. На следующем этапе подключили визуальный анализ — для этого создали тепловые карты для распознавания образов.
Источник
В результате исследования получили две группы однородных элементов с зафиксированными отличиями в стиле письма. Причем буквы не были разбросаны хаотично по тексту, а концентрировались в его начале и конце. Ученые говорят, что изменения происходят примерно на 27 столбце, то есть почти на половине текста. После 27 столбца рукопись прерывается, идут три пустые строки. Потом она продолжается. И вот есть доказательства — продолжает ее другой автор.
Также ученые выяснили, что второй писец создавал текст менее «чисто», допускал больше вариаций написания букв. Но пока это все, что известно об авторах. Что их связывает и почему они создавали текст сообща — неизвестно.
Провести подобную диагностику без машинного обучения было почти нереально. Стиль письма во всей рукописи однородный, отличия на глаз не видны. Так, представьте, буква «алеф» ? встречается в рукописи 5 тыс. раз. Человеческий глаз не способен отличить минимальные отклонения в ее написании и выявить закономерности.
Что представляет собой список?
Источник
В середине прошлого века на Западном берегу Мертвого моря были обнаружены древние еврейские рукописи. Древние заметки находили пастухи-бедуины в различного рода пещерах. Великий свиток пророка Исайи найден среди семи первых в 1947 году в пещере под номером 1Q.
Вход в пещеру, где обнаружены рукописи
Основные характеристики списка:
- 734 см — длина пергамента свитка;
- 27 см — ширина пергамента свитка;
- 54 колонки текста содержит документ;
- 66 глав Книги пророка Исайи (The Book of Isaiah) содержит документ;
- 125 г. до н.э. — предполагаемая дата составления рукописи.
Почему важно знать авторство?
Культура подписи не была закреплена в античности, потому многие найденные раритеты того времени обезличены. Так же вышло с Великим свитком Исайи. Однако сведения о текстах того времени приоткрыли бы завесы тайны над культурой, правилами, техникой создания литературных произведений. Кроме того, многие книги превратились в библейские, однако принцип и каноны религиозных текстов также не до конца изучены.
Возможно, в дальнейшем технологии позволят изучить многие древние письмена на микроуровне, чтобы определить место обучения писцов, а потом их происхождение и личности.
A1054
Не понял, почему переписчики упорно называются авторами.
По сути узнали, что рукопись переписывал не один человек, а два. Ну и что тут удивительного?
ciubotaru
Книга Исаии описывает события между VIII и VI веками до н.э., поэтому она не может иметь одного автора (ни даже коллегию авторов, действовавших согласованно). Создатель (или создатели) книги не был простым переписчиком — он как минимум объединил несколько источников и вероятно не просто скопировал, а изложил своим словами. Таким образом, эти два писаря из второго века вполне могут быть авторами компиляции в том виде, в котором мы её знаем сейчас.
Bellerogrim
Так речь не о создателе книги, а о создателе какого-то очередного списка (копии).
arti24n
Возможно поэтому это один из, если не самый сложный текст в библии, очень тяжелый к восприятию, во многих местах смысл вообще теряется за вычурностью изложения
alexgantera
Давайте называть вещи своими именами, это фантазии на тему, а не описание исторических событий.
A1054
Теоретически могут. Но даже если бы они жили на несколько веков раньше, я бы не оценивал эти шансы как слишком высокие. Просто потому, что копий книги, наверное, было не так мало. А спустя несколько веков шансы еще падают.