Манускрипт Войнича — весьма интересный артефакт средневекового прошлого. Это рукописная книга, которая была написана около 500 лет назад неизвестным автором, на неизвестном языке, с использованием неизвестного алфавита. С того момента, как информация о ней появилась в широком доступе, ее пытались расшифровать не один десяток раз, но успеха никто не добился. Некоторые криптографы, которые потратили не один год на расшифровку, считают, что эта книга вообще является мистификацией, в которой вообще нет никакого смысла.

Рукопись Войнича стала известной благодаря американскому книготорговцу литовского происхождения Вифриду Войничу. Он ее приобрел в 1912 году. В настоящее время книга находится в Библиотеке редких книг Байнеке (Beinecke Rare Book And Manuscript Library) Йельского университета. Она состоит из 240 страниц тонкого пергамента, размер страницы составляет 15*23 см. Толщина книги — около 3 см. В книге есть большое количество иллюстраций, почти на всех страницах.

За время проб и попыток разгадать манускрипт сообщалось о множестве разных версий как о происхождении книги, так и о ее наполнении. Но, к сожалению, подтверждения сказанному ни в одном из случаев привести не удалось. Больше всего продвинулись в том, чтобы рассказать о наполнении манускрипта не криптографы, а ботаник Артур Такер (Arthur O. Tucker) из Университета Делавэра и IT-специалист Рексфорд Толберт (Rexford H. Talbert). Результаты своих изысканий ученые опубликовали в 2014 году в журнале HerbalGram — The Journal of the American Botanical Council.

Ученые смогли идентифицировать несколько десятков растений из 303 представленных, 6 животных и один минерал. Почти все, что было указано в манускрипте, произрастает и обитает в Центральной Америке. Ученые пришли к выводу, что книга написана на одном из диалектов Ацтекского языка, а в ней описывается содержимое «ботанического сада» в Центральной Мексике.

Сейчас об очередном сдвиге в этом деле сообщил специалист по искусственному интеллекту Грег Кондрак из Альбертского университета. Рассказывая о том, почему он начал заниматься расшифровкой манускрипта, Кондрак сообщил, что это в природе человека — узнать о загадке и начать ее разгадывать. «Мне было интересно и я решил заняться этим делом».

Поскольку ранее расшифровкой манускрипта занимались лишь отдельные люди (или группы специалистов), то Кондрак принял решение использовать в качестве вспомогательного инструмента то, в чем он хорошо разбирается — искусственный интеллект. Его университет как раз создал программное обеспечение, способное решать многие задачи, включая расшифровку закодированных сообщений.

Кондракт со своим коллегой перевели Всеобщую декларацию прав человека на 380 языков. Затем, используя специальные алгоритмы, они обучили компьютерную систему распознавать разные языки. И она смогла правильно определить язык в 97 случаях из ста.

После того, как этот алгоритм ознакомили с манускриптом Войнича, система сообщила, что книга, вероятнее всего, написана на иврите, и при этом зашифрована (в последнем утверждении нет ничего нового). Следующим шагом была расшифровка самого текста. Ученые считают, что буквы в словах переставлены, и для понимания того, о чем говорится в манускрипте, необходимо расположить их правильно.

Так ученые и поступили, правда, не со всем текстом, а с его начальными предложениями. Как оказалось, первое из них гласило: «Она дала рекомендации священнику, главе дома, мне и людям». Также из 72 первых слов текста ученые выделили такие, как «фермер » (или крестьянин), «свет», «воздух» и «огонь».

Что касается дальнейшей расшифровки, то ученые говорят, что это требует времени. И для работы над манускриптом желательно привлечь специалистов, которые знают иврит и одновременно являются специалистами по истории. В этом случае текст можно будет расшифровать и наконец, рассказать миру, о чем говорится в манускрипте. Правда, теперь другим специалистам придется проверить правильность предположений Кондрака и его коллег.

Комментарии (56)


  1. we1
    28.01.2018 20:24
    +1

    Ну круто. Если и правда расшифруют.


  1. dozzvidania
    28.01.2018 20:32
    +2

    это не иврит
    — явная направленность текста слева направо (в иврите наоборот)
    — лишь пара символов отдаленно напомнили буквы
    — если описан «ботанический сад в Центральной Америке», то какая связь с ближневосточным языком?

    я говорю про современный иврит конечно же (воскрешён из мёртвых примерно в 1900ых), который при этом минимально отличается от оригинального


    1. tmin10
      28.01.2018 21:00
      +1

      Судя из статьи всё шифрование заключается в перемешивании слов, но тогда эти слова бы давно уже расставили в нужном порядке, а там ещё и алфавит непонятен…


      1. tyomitch
        28.01.2018 22:55
        +1

        На самом деле — в перемешивании букв внутри слов:

        The letters in each word, they found, had been reordered.

        То, что «слова в предложениях расставлены как попало» — это выдумка лично marks'а.


        1. OKyJIucT
          28.01.2018 23:23

          А я сегодня в новости на каком то новостном портале читал, что в слове убраны гласные, а остальные буквы перемешаны. Видимо, тоже рерайт чужой статьи писали.


          1. daggert
            28.01.2018 23:27

            слове убраны гласные

            Иврит-же (:


          1. zar0ku1
            29.01.2018 03:55

            В иврите не гласных


            1. 9660
              29.01.2018 07:47

              А что скажете за матрес лекционис?


              1. zar0ku1
                29.01.2018 07:49

                Костыль из-за которого куча разночтений


    1. lpwaterhouse
      28.01.2018 22:29

      Что мешает писать на иврите слева направо? Традиционная его направленность как раз довольно быстро навела бы на иврит в связи с довольно ограниченным количеством таких языков, которое еще более ограничивалось возможностями автора по их изучению.


  1. Mulin
    28.01.2018 22:12

    … Ученые пришли к выводу, что книга написана на одном из диалектов Ацтекского языка...

    … книга, вероятнее всего, написана на иврите...

    Э-ээм…


    1. Sound_cULT
      28.01.2018 22:36

      Как-то да…


      1. andy_p
        28.01.2018 22:58
        +2

        Есть версия, что десять потерянных колен Израиля переселились в Америку.


        1. Sound_cULT
          28.01.2018 23:24

          Это вполне).


          1. Lemis
            29.01.2018 03:50

            Учёные пришли к выводу про диалект, затем провели анализ софтом, получили результат «возможно иврит». Что не так?


    1. Krapiv
      29.01.2018 04:44

      Речь идет о разных учёных.
      "Учёные" — это не многоголовая гидра с одним мозгом на всех и разными фамилиями.


    1. anprs
      29.01.2018 09:15

      «Учёные пришли к выводу что иврит — один из диалектов Ацтекского языка»


      1. barbanel
        29.01.2018 11:18
        +1

        Шок! Сенсация!
        Британские ученые установили, что древние ацтеки были евреями!


        1. Elmot
          29.01.2018 12:01
          +1

          если в кране нет текилы
          значит выпили ацтеки


        1. ns3230
          29.01.2018 20:25

          Спасибо, ваш коммент сделал мой день! Сижу, хвораю, малость хреновато, но поржал хорошенько — и уже вроде легче)


        1. BalinTomsk
          30.01.2018 00:58
          -1

          я тут расказывал, как мой младший возмутился в самом начальном классе, когда делали групповой проект про first people… в ответ требование его одногрупницы нарисовать, среди этих первых иудея… он отказался, сказав, что их не было среди тех, кого в канаде причисляют к первым людям… девчушка затаила обиду, настучала дома родителям. те пришли на утро прямиком в принципалу с жалобой, что мой сын активно выступает против евреев. скандал был еще тот. заставили (!) его извинится перед ней перед всем классом.
          но он не промах, он сказал типа — извини, что не причислил евреев к First Nations, как то и написано в учебнике. и он сожалеет, что такие уважаемые и древние национальности там не представлены…

          www.figvam.ca/cloud


    1. staticlab
      29.01.2018 11:22

      Вряд ли Всеобщая декларация прав человека есть на "одном из диалектов ацтекского языка", поэтому, очевидно, нейросеть на нём и не обучалась. Соответственно, нейросеть могла дать ложноположительную оценку.


      Опять же, расшифровка исключительно одного предложения с учётом перестановки символов и шифра замены выглядит своего рода "чудиновщиной": это могло быть абсолютно случайное совпадение.


      Кроме того, лично мне кажется, что "слова" манускрипта в среднем довольно длинные по сравнению с ивритом (где буквы только согласные). Знатоки иврита могли бы прокомментировать.


  1. RedSnowman
    28.01.2018 22:36

    Всё фигня.
    Книжка представляет собой трудно понимаемый текст, с неизвестными растениями, рецептами, живностью и диаграммами.
    Хм, выглядит как кодекс от D&D. Думаю у нас есть веское подтверждение того, что упоротые настольщики появились не 50 лет назад, а все 600.


    1. horror_x
      29.01.2018 00:21
      +1

      image


      1. Desiderio
        29.01.2018 09:37

        То же самое для тех, кто не умеет в ангельский:
        image


    1. mukizu
      29.01.2018 00:59

      Ну, настольные игры появились тысячи лет назад (+- 5500 если верить вики), так что упоротых там успело напоявляться великое множество скорее всего.


      1. green_worm
        29.01.2018 12:59

        А с учетом того, что в те времена заняться было особо нечем, кроме как потыкать друг в друга письками или острыми железяками (тут уж по случаю), то упоротость должна была быть не впример нынешним гикам =)


        1. tyomitch
          29.01.2018 13:09

          Вы, видимо, про аристократию, потому что у «обычных людей» в те времена жизнеподдержание (пахать-сеять-жать, заготавливать дрова, носить воду и т.п.) занимало всю взрослую жизнь, и позволить себе играть могли только совсем маленькие дети.


          1. green_worm
            29.01.2018 14:09

            Да, когда писал «заняться», подразумевал развлечения, конечно. =)


          1. NiTr0_ua
            29.01.2018 19:52
            +1

            ну учитывая цену пергамента, отсутствие типографской печати да и вообще грамотность в те времена — то речь идет именно об аристократии, да.


  1. ITMatika
    29.01.2018 08:12

    Как точно они расшифровали первое предложение при явной недостаточности данных!
    А потом окажется, что это не иврит, а славянское наречие!
    /sarcasm


    1. Stepanow
      30.01.2018 13:48

      Зашёл сюда, чтобы написать коммент про эту историю, но меня опередили


  1. plastilinko
    29.01.2018 09:52

    Так, а когда скормят таблички ронго-ронго ИИ? :)


  1. Desprit
    29.01.2018 10:21

    Либо это просто один из первых троллей. Подозревал, чем дело может обернуться через несколько сотен лет и писал исключительно рандомные портянки текста. А картинки рисовать отдал другу, который абсентом домашний гнал.
    А если серьезно, манускрипт ведь проверяли специалисты по теории информации? Там точно не рандом? Вот тут пишут о некоторой корреляции слов и отдельных символов, но все равно как-то неубедительно…


    1. tyomitch
      29.01.2018 12:51

      Содержательный результат всего этого исследования — в том, что из современных орфографий ивритская наиболее близка к рандомному потоку символов. (И действительно, избыточности там в письменности крайне мало; изменишь любую букву — получится другое слово.)

      Количественная иллюстрация: самая редкая ивритская буква (?, частота 1.23%) встречается чаще, чем пять самых редких английских букв (K, X, Q, J, Z) вместе взятых (1.15% в сумме). Т.е. более плоское частотное распределение, без хвоста «очень редких» букв — намного ближе к ивриту, чем к английскому.


    1. staticlab
      30.01.2018 15:36

      Вроде бы частотное распределение букв соответствует закону Ципфа.


  1. elingur
    29.01.2018 11:40

    Кондракт со своим коллегой перевели Всеобщую декларацию прав человека на 380 языков. Затем, используя специальные алгоритмы, они обучили компьютерную систему распознавать разные языки. И она смогла правильно определить язык в 97 случаях из ста.

    — при таком подходе система в любом случае выплюнет какой-нить результат. Почему 380 современных языков, а не 3800 древних???
    в общем, выглядит сомнительно…


    1. barbanel
      29.01.2018 13:40
      +2

      Почему 380 современных языков, а не 3800 древних???

      Идея для стартапа гиковской шутки:
      Гайд «как установить KDE 2 на FreeBSD» на древнешумерском, иллюстрированный наскальной живописью. Бубен в придачу.


    1. avost
      29.01.2018 14:33
      +1

      Почему 380 современных языков, а не 3800 древних???

      Потому что это была проверка нейросети на тестовой выборке.


      в общем, выглядит сомнительно…

      Это стандартная схема работы с нейросетями. В принципе, разницы для тестовой выборки нет, современные там языки или нет, главное, чтобы в обучающей выборке были древние. А вот переводить эту декларацию (да и любой современный текст) на древние языки изрядно геморройно. Полагаю, в тестовой выборке у них были и древние тексты, но для журналистов факт что сеть правильно определила язык для безвестной новгородской берестяной грамоты менее значим, чем Декларация, да ещё и на 380 языках!


  1. unwrecker
    29.01.2018 14:30

    Первое предложение перевели, а дальше? В каждом нужна своя перестановка слов? Так таким образом можно сделать любой текст из любого.


    1. Barafu
      29.01.2018 14:55

      Не палите контору.


    1. test3d
      29.01.2018 15:47

      По рзелульаттам илссеовадний одонго анлигйсокго унвиертисета, не иеемт занчнеия, в кокам пряокде рсапожолены бкувы в солве. Галвоне, чотбы преавя и пслоендяя бквуы блыи на мсете. Осатьлыне бкувы мгоут селдовтаь в плоонм бсепордяке, все-рвано ткест чтаитсея без побрелм. Пичрионй эгото ялвятеся то, что мы не чиатем кдаужю бкуву по отдльенотси, а все солво цликеом.


      1. Quarc
        29.01.2018 16:04

        А теперь уберите все гласные и переставьте также и первые с последними буквы.


        1. test3d
          30.01.2018 12:18

          Ага. Ещё перевести на идиш, заменить символы букв, написать на пергаменте, снабдить рисунками.
          Войнич перелогинтесь.


    1. lamoss
      29.01.2018 16:57

      Вот да, тоже об этом подумал — имея достаточно обученную нейросеть, можно взять один язык и собрать из него другой, переставляя буквы в словах чтобы готовое предложение было хоть приблизительно согласованным.


      1. mwizard
        29.01.2018 18:36

        очевидно, паттерн перестановки должен быть постоянным во всей книге, и не очень сложным, чтобы его можно было запомнить и применить по ходу чтения. Это уже уменьшает количество возможных вариантов.


        1. lamoss
          29.01.2018 20:49

          Но что если задача не была поставлена как «легко читать»?
          Или паттерн перестановки основывается на шифре Вернама, тогда как?


          1. vbif
            30.01.2018 11:46

            Маловероятно.


  1. Ravebinovich
    29.01.2018 20:11

    А «Кодекс Серафини» переводить никто не пробовал?


  1. solariserj
    29.01.2018 21:05

    В рассказе «трагедия планеты Роксаны» ии расшифровал инопланетную книгу. Если и тут расшифрует то будущее уже здесь.


  1. pehat
    29.01.2018 21:58
    +1

    Ну ё-моё.

    1. 380 элементов в обучающей выборке, да еще и для нейросети — это «моё хобби — экстраполяция»
    2. Учёные уже проводили анализ текста простейшими штуками вроде закона Ципфа, которые вполне себе бы выявили иврит. Совершенно не важно, переставлены или выкинуты буквы — если зашифрованное слово отображается в исходное один к одному, никакие статистические свойства текста от этого не изменяются.
    3. Пётр Порай-Кошиц, не нужно копипастить домыслы журналистов по поводу деятельности британских учёных прямо в Википедию. Лучше продолжайте делать World of Warships.


    1. springimport
      29.01.2018 22:11

      Откуда вы знаете что он делает эту игру?


    1. tyomitch
      30.01.2018 00:21

      1. 380 элементов в обучающей выборке, да еще и для нейросети — это «моё хобби — экстраполяция»

      А нигде и не утверждается, что использовалась нейросеть. Ни в оригинале, ни в переводе.


  1. Zmiy666
    30.01.2018 04:13

    может провести изотопный анализ и прикинуть из какого места на земле эта книга вообще взялась и где были сделаны чернила, которыми ее писали? это может дать ключи к разгадке…


    1. SvSh123
      30.01.2018 13:46

      … или показать, что материал обработали нейтронами, чтобы обеспечить нужную датировку радиоуглеродным методом. :)


  1. Jeyko
    30.01.2018 12:57

    Знаете, иногда оказываясь в каком-либо «святом» месте, могу видеть ящик для пожеланий или молитв и не могу оказать себе в удовольствии написать на бумажке подобными литерами что-нибудь и опустить в щелку. Или в книге отзывов, например. Жена юмора не понимает, а дочка ржет, забавляясь и представляя какое изумление могут вызвать подобные послания-каракули в каком-нибудь храме пяти религий, например.

    Так вот и тут я вижу нечто подобное. Поэтому и расшифровать не могут; )