Манускрипт Войнича — весьма интересный артефакт средневекового прошлого. Это рукописная книга, которая была написана около 500 лет назад неизвестным автором, на неизвестном языке, с использованием неизвестного алфавита. С того момента, как информация о ней появилась в широком доступе, ее пытались расшифровать не один десяток раз, но успеха никто не добился. Некоторые криптографы, которые потратили не один год на расшифровку, считают, что эта книга вообще является мистификацией, в которой вообще нет никакого смысла.
Рукопись Войнича стала известной благодаря американскому книготорговцу литовского происхождения Вифриду Войничу. Он ее приобрел в 1912 году. В настоящее время книга находится в Библиотеке редких книг Байнеке (Beinecke Rare Book And Manuscript Library) Йельского университета. Она состоит из 240 страниц тонкого пергамента, размер страницы составляет 15*23 см. Толщина книги — около 3 см. В книге есть большое количество иллюстраций, почти на всех страницах.
За время проб и попыток разгадать манускрипт сообщалось о множестве разных версий как о происхождении книги, так и о ее наполнении. Но, к сожалению, подтверждения сказанному ни в одном из случаев привести не удалось. Больше всего продвинулись в том, чтобы рассказать о наполнении манускрипта не криптографы, а ботаник Артур Такер (Arthur O. Tucker) из Университета Делавэра и IT-специалист Рексфорд Толберт (Rexford H. Talbert). Результаты своих изысканий ученые опубликовали в 2014 году в журнале HerbalGram — The Journal of the American Botanical Council.
Ученые смогли идентифицировать несколько десятков растений из 303 представленных, 6 животных и один минерал. Почти все, что было указано в манускрипте, произрастает и обитает в Центральной Америке. Ученые пришли к выводу, что книга написана на одном из диалектов Ацтекского языка, а в ней описывается содержимое «ботанического сада» в Центральной Мексике.
Сейчас об очередном сдвиге в этом деле сообщил специалист по искусственному интеллекту Грег Кондрак из Альбертского университета. Рассказывая о том, почему он начал заниматься расшифровкой манускрипта, Кондрак сообщил, что это в природе человека — узнать о загадке и начать ее разгадывать. «Мне было интересно и я решил заняться этим делом».
Поскольку ранее расшифровкой манускрипта занимались лишь отдельные люди (или группы специалистов), то Кондрак принял решение использовать в качестве вспомогательного инструмента то, в чем он хорошо разбирается — искусственный интеллект. Его университет как раз создал программное обеспечение, способное решать многие задачи, включая расшифровку закодированных сообщений.
Кондракт со своим коллегой перевели Всеобщую декларацию прав человека на 380 языков. Затем, используя специальные алгоритмы, они обучили компьютерную систему распознавать разные языки. И она смогла правильно определить язык в 97 случаях из ста.
После того, как этот алгоритм ознакомили с манускриптом Войнича, система сообщила, что книга, вероятнее всего, написана на иврите, и при этом зашифрована (в последнем утверждении нет ничего нового). Следующим шагом была расшифровка самого текста. Ученые считают, что буквы в словах переставлены, и для понимания того, о чем говорится в манускрипте, необходимо расположить их правильно.
Так ученые и поступили, правда, не со всем текстом, а с его начальными предложениями. Как оказалось, первое из них гласило: «Она дала рекомендации священнику, главе дома, мне и людям». Также из 72 первых слов текста ученые выделили такие, как «фермер » (или крестьянин), «свет», «воздух» и «огонь».
Что касается дальнейшей расшифровки, то ученые говорят, что это требует времени. И для работы над манускриптом желательно привлечь специалистов, которые знают иврит и одновременно являются специалистами по истории. В этом случае текст можно будет расшифровать и наконец, рассказать миру, о чем говорится в манускрипте. Правда, теперь другим специалистам придется проверить правильность предположений Кондрака и его коллег.
Комментарии (56)
dozzvidania
28.01.2018 20:32+2это не иврит
— явная направленность текста слева направо (в иврите наоборот)
— лишь пара символов отдаленно напомнили буквы
— если описан «ботанический сад в Центральной Америке», то какая связь с ближневосточным языком?
я говорю про современный иврит конечно же (воскрешён из мёртвых примерно в 1900ых), который при этом минимально отличается от оригинальногоtmin10
28.01.2018 21:00+1Судя из статьи всё шифрование заключается в перемешивании слов, но тогда эти слова бы давно уже расставили в нужном порядке, а там ещё и алфавит непонятен…
tyomitch
28.01.2018 22:55+1На самом деле — в перемешивании букв внутри слов:
The letters in each word, they found, had been reordered.
То, что «слова в предложениях расставлены как попало» — это выдумка лично marks'а.OKyJIucT
28.01.2018 23:23А я сегодня в новости на каком то новостном портале читал, что в слове убраны гласные, а остальные буквы перемешаны. Видимо, тоже рерайт чужой статьи писали.
lpwaterhouse
28.01.2018 22:29Что мешает писать на иврите слева направо? Традиционная его направленность как раз довольно быстро навела бы на иврит в связи с довольно ограниченным количеством таких языков, которое еще более ограничивалось возможностями автора по их изучению.
Mulin
28.01.2018 22:12… Ученые пришли к выводу, что книга написана на одном из диалектов Ацтекского языка...
… книга, вероятнее всего, написана на иврите...
Э-ээм…Sound_cULT
28.01.2018 22:36Как-то да…
andy_p
28.01.2018 22:58+2Есть версия, что десять потерянных колен Израиля переселились в Америку.
Sound_cULT
28.01.2018 23:24Это вполне).
Lemis
29.01.2018 03:50Учёные пришли к выводу про диалект, затем провели анализ софтом, получили результат «возможно иврит». Что не так?
Krapiv
29.01.2018 04:44Речь идет о разных учёных.
"Учёные" — это не многоголовая гидра с одним мозгом на всех и разными фамилиями.
anprs
29.01.2018 09:15«Учёные пришли к выводу что иврит — один из диалектов Ацтекского языка»
barbanel
29.01.2018 11:18+1Шок! Сенсация!
Британские ученые установили, что древние ацтеки были евреями!ns3230
29.01.2018 20:25Спасибо, ваш коммент сделал мой день! Сижу, хвораю, малость хреновато, но поржал хорошенько — и уже вроде легче)
BalinTomsk
30.01.2018 00:58-1я тут расказывал, как мой младший возмутился в самом начальном классе, когда делали групповой проект про first people… в ответ требование его одногрупницы нарисовать, среди этих первых иудея… он отказался, сказав, что их не было среди тех, кого в канаде причисляют к первым людям… девчушка затаила обиду, настучала дома родителям. те пришли на утро прямиком в принципалу с жалобой, что мой сын активно выступает против евреев. скандал был еще тот. заставили (!) его извинится перед ней перед всем классом.
но он не промах, он сказал типа — извини, что не причислил евреев к First Nations, как то и написано в учебнике. и он сожалеет, что такие уважаемые и древние национальности там не представлены…
www.figvam.ca/cloud
staticlab
29.01.2018 11:22Вряд ли Всеобщая декларация прав человека есть на "одном из диалектов ацтекского языка", поэтому, очевидно, нейросеть на нём и не обучалась. Соответственно, нейросеть могла дать ложноположительную оценку.
Опять же, расшифровка исключительно одного предложения с учётом перестановки символов и шифра замены выглядит своего рода "чудиновщиной": это могло быть абсолютно случайное совпадение.
Кроме того, лично мне кажется, что "слова" манускрипта в среднем довольно длинные по сравнению с ивритом (где буквы только согласные). Знатоки иврита могли бы прокомментировать.
RedSnowman
28.01.2018 22:36Всё фигня.
Книжка представляет собой трудно понимаемый текст, с неизвестными растениями, рецептами, живностью и диаграммами.
Хм, выглядит как кодекс от D&D. Думаю у нас есть веское подтверждение того, что упоротые настольщики появились не 50 лет назад, а все 600.horror_x
29.01.2018 00:21+1Desiderio
29.01.2018 09:37То же самое для тех, кто не умеет в ангельский:mukizu
29.01.2018 00:59Ну, настольные игры появились тысячи лет назад (+- 5500 если верить вики), так что упоротых там успело напоявляться великое множество скорее всего.
green_worm
29.01.2018 12:59А с учетом того, что в те времена заняться было особо нечем, кроме как потыкать друг в друга письками или острыми железяками (тут уж по случаю), то упоротость должна была быть не впример нынешним гикам =)
tyomitch
29.01.2018 13:09Вы, видимо, про аристократию, потому что у «обычных людей» в те времена жизнеподдержание (пахать-сеять-жать, заготавливать дрова, носить воду и т.п.) занимало всю взрослую жизнь, и позволить себе играть могли только совсем маленькие дети.
NiTr0_ua
29.01.2018 19:52+1ну учитывая цену пергамента, отсутствие типографской печати да и вообще грамотность в те времена — то речь идет именно об аристократии, да.
ITMatika
29.01.2018 08:12Как точно они расшифровали первое предложение при явной недостаточности данных!
А потом окажется, что это не иврит, а славянское наречие!
/sarcasm
Desprit
29.01.2018 10:21Либо это просто один из первых троллей. Подозревал, чем дело может обернуться через несколько сотен лет и писал исключительно рандомные портянки текста. А картинки рисовать отдал другу, который абсентом домашний гнал.
А если серьезно, манускрипт ведь проверяли специалисты по теории информации? Там точно не рандом? Вот тут пишут о некоторой корреляции слов и отдельных символов, но все равно как-то неубедительно…tyomitch
29.01.2018 12:51Содержательный результат всего этого исследования — в том, что из современных орфографий ивритская наиболее близка к рандомному потоку символов. (И действительно, избыточности там в письменности крайне мало; изменишь любую букву — получится другое слово.)
Количественная иллюстрация: самая редкая ивритская буква (?, частота 1.23%) встречается чаще, чем пять самых редких английских букв (K, X, Q, J, Z) вместе взятых (1.15% в сумме). Т.е. более плоское частотное распределение, без хвоста «очень редких» букв — намного ближе к ивриту, чем к английскому.
elingur
29.01.2018 11:40Кондракт со своим коллегой перевели Всеобщую декларацию прав человека на 380 языков. Затем, используя специальные алгоритмы, они обучили компьютерную систему распознавать разные языки. И она смогла правильно определить язык в 97 случаях из ста.
— при таком подходе система в любом случае выплюнет какой-нить результат. Почему 380 современных языков, а не 3800 древних???
в общем, выглядит сомнительно…barbanel
29.01.2018 13:40+2Почему 380 современных языков, а не 3800 древних???
Идея длястартапагиковской шутки:
Гайд «как установить KDE 2 на FreeBSD» на древнешумерском, иллюстрированный наскальной живописью. Бубен в придачу.
avost
29.01.2018 14:33+1Почему 380 современных языков, а не 3800 древних???
Потому что это была проверка нейросети на тестовой выборке.
в общем, выглядит сомнительно…
Это стандартная схема работы с нейросетями. В принципе, разницы для тестовой выборки нет, современные там языки или нет, главное, чтобы в обучающей выборке были древние. А вот переводить эту декларацию (да и любой современный текст) на древние языки изрядно геморройно. Полагаю, в тестовой выборке у них были и древние тексты, но для журналистов факт что сеть правильно определила язык для безвестной новгородской берестяной грамоты менее значим, чем Декларация, да ещё и на 380 языках!
unwrecker
29.01.2018 14:30Первое предложение перевели, а дальше? В каждом нужна своя перестановка слов? Так таким образом можно сделать любой текст из любого.
test3d
29.01.2018 15:47По рзелульаттам илссеовадний одонго анлигйсокго унвиертисета, не иеемт занчнеия, в кокам пряокде рсапожолены бкувы в солве. Галвоне, чотбы преавя и пслоендяя бквуы блыи на мсете. Осатьлыне бкувы мгоут селдовтаь в плоонм бсепордяке, все-рвано ткест чтаитсея без побрелм. Пичрионй эгото ялвятеся то, что мы не чиатем кдаужю бкуву по отдльенотси, а все солво цликеом.
lamoss
29.01.2018 16:57Вот да, тоже об этом подумал — имея достаточно обученную нейросеть, можно взять один язык и собрать из него другой, переставляя буквы в словах чтобы готовое предложение было хоть приблизительно согласованным.
mwizard
29.01.2018 18:36очевидно, паттерн перестановки должен быть постоянным во всей книге, и не очень сложным, чтобы его можно было запомнить и применить по ходу чтения. Это уже уменьшает количество возможных вариантов.
solariserj
29.01.2018 21:05В рассказе «трагедия планеты Роксаны» ии расшифровал инопланетную книгу. Если и тут расшифрует то будущее уже здесь.
pehat
29.01.2018 21:58+1Ну ё-моё.
1. 380 элементов в обучающей выборке, да еще и для нейросети — это «моё хобби — экстраполяция»
2. Учёные уже проводили анализ текста простейшими штуками вроде закона Ципфа, которые вполне себе бы выявили иврит. Совершенно не важно, переставлены или выкинуты буквы — если зашифрованное слово отображается в исходное один к одному, никакие статистические свойства текста от этого не изменяются.
3. Пётр Порай-Кошиц, не нужно копипастить домыслы журналистов по поводу деятельности британских учёных прямо в Википедию. Лучше продолжайте делать World of Warships.tyomitch
30.01.2018 00:211. 380 элементов в обучающей выборке, да еще и для нейросети — это «моё хобби — экстраполяция»
А нигде и не утверждается, что использовалась нейросеть. Ни в оригинале, ни в переводе.
Zmiy666
30.01.2018 04:13может провести изотопный анализ и прикинуть из какого места на земле эта книга вообще взялась и где были сделаны чернила, которыми ее писали? это может дать ключи к разгадке…
SvSh123
30.01.2018 13:46… или показать, что материал обработали нейтронами, чтобы обеспечить нужную датировку радиоуглеродным методом. :)
Jeyko
30.01.2018 12:57Знаете, иногда оказываясь в каком-либо «святом» месте, могу видеть ящик для пожеланий или молитв и не могу оказать себе в удовольствии написать на бумажке подобными литерами что-нибудь и опустить в щелку. Или в книге отзывов, например. Жена юмора не понимает, а дочка ржет, забавляясь и представляя какое изумление могут вызвать подобные послания-каракули в каком-нибудь храме пяти религий, например.
Так вот и тут я вижу нечто подобное. Поэтому и расшифровать не могут; )
we1
Ну круто. Если и правда расшифруют.