Фото: Александр Корольков/РГ

3 июня, в заключительный день Московского книжного фестиваля на Красной площади, лингвист Александр Пиперски выступал с рассказом о компьютерной лингвистике. Он говорил о машинных переводах, нейросетях, векторном отображении слов и поднимал вопросы границ искусственного интеллекта.

Лекцию слушали разные люди. Справа от меня, например, клевала носом китайская туристка. Александр, наверняка, тоже понимал — пара лишних цифр, формул и слов об алгоритмах, и люди убегут в соседнюю палатку слушать фантастов.

Я попросил Александра подготовить для Хабра «режиссерскую версию» лекции, где не вырезано ничего, что может усыпить случайных туристов. Ведь больше всего выступлению не хватало аудитории с толковыми вопросами и вообще хорошей дискуссии. Думаю, здесь мы ее сможем развить.



Где начинается ИИ


C недавних пор мы постоянно общаемся с компьютерами голосом, а всякие Алиса, Алекса и Сири голосом нам отвечают. Если посмотреть со стороны, кажется, что компьютер нас понимает, выдает списки релевантных сайтов, сообщает адрес ближайшего ресторана, указывает, как к нему пройти.

Похоже, мы имеем дело с довольно умным устройством. Можно даже сказать, это устройство обладает тем, что называется искусственный интеллект (ИИ). Хоть никто толком не понимает, что это значит и где проходят границы.

Когда нам говорят «ИИ выполняет творческие функции, которые считаются прерогативой человека» — что это значит? Что такое творческие функции? Какая функция творческая, а какая нет? Подбор ближайшего китайского ресторана — творческая функция? Сейчас кажется, что скорее нет.

Мы постоянно склонны отказывать компьютеру в искусственном интеллекте. Как только мы привыкли к интеллектуальным проявлениям, которые делает компьютер, мы говорим, «это не ИИ, это полная ерунда, шаблонные задачи, ничего интересного».

Простой пример — с нашей точки зрения нет ничего тупее карманного калькулятора. Он продается в любом ларьке за 50 рублей. Возьмите обычный восьмиразрядный калькулятор, потыкайте на кнопочки и получите результат в считанные секунды. Ну подумаешь, считает какие-то вещи. Это же не интеллект.

А представьте себе такую машинку в XVIII веке. Она казалась бы чудом, потому что вычисление было прерогативой человека.

Так же происходит и с компьютерной лингвистикой. Мы склонны презирать все ее достижения. Я ввожу в Google запрос «стихи Пушкина», он находит страницу на которой написано «А.С. Пушкин — Стихотворения». Казалось бы, что такого? Совершенно нормальное поведение. Но компьютерным лингвистам пришлось потратить десятки лет, чтобы по слову стихи находилось слово стихотворение, чтобы по слову Пушкина находилось слово Пушкин и не находилось Пушки.

Компьютерные шахматы и машинные переводы


Компьютерная лингвистика зародилась одновременно с компьютерными шахматами — а ведь шахматы когда-то тоже были прерогативой человека. Клод Шеннон, один из основоположников информатики, в 1950 году написал статью, как запрограммировать компьютер, чтобы он играл в шахматы. По его словам, мы можем выработать два типа стратегий.

A — с полным перебором продолжений. Надо тестировать все возможные ходы на каждом этапе.
B — перебирать только те продолжения, которые оцениваются как перспективные.

Человек, очевидно, использует стратегию B. Гроссмейстер, скорее всего, перебирает только разумные на его взгляд варианты, и за довольно быстрое время выдает хороший ход.

Стратегия A сложна для реализации. По подсчету Шеннона, чтобы просчитать три хода, надо перебрать 109 вариантов, и если позиция оценивается в одну микросекунду (что было сверхоптимистично в середине XX века), то на один ход понадобится 17 минут. А три хода вперед — это ничтожная глубина предсказания.

Вся дальнейшая история шахмат состоит в разработке приемов, которые позволят не перебирать все подряд, а понять — что надо перебирать, а что не надо. И победа над человеком уже достигнута, окончательно и бесповоротно. Компьютер обошел чемпиона мира по шахматам лет 20 назад, и с тех пор только совершенствуется.

Лучшей программа считалась Stockfish. В прошлом году с ней сыграла 100 партий программа AlphaZero.
Белые Черные Победа белых Ничья Победа черных
AlphaZero Stockfish 25 25 0
Stockfish AlphaZero 0 47 3

AlphaZero — это искусственная нейронная сеть, которая просто четыре часа играла в шахматы сама с собой. И научилась играть лучше, чем все программы до нее.

Похожее происходит в компьютерной лингвистике сейчас — всплеск нейросетевого моделирования. Над машинными шахматами начали работать одновременно с машинными переводами — в середине прошлого века. С тех пор выделяют три этапа развития.

— Машинный перевод на основе правил
Он устроен очень просто — примерно как на уроках грамматики, компьютер выделяет подлежащее, сказуемое, дополнение. Понимает, какими словами все это переводится на другой язык, узнает, как там выражать подлежащие, сказуемые, дополнения, и все.
Такой перевод развивался лет 30, не имея больших успехов.

— Статистический (фразовый) перевод
Компьютер опирается на большую базу данных текстов, переведенных человеком. Подбирает в ней слова и словосочетания, которые соответствуют словам и словосочетаниям оригинала, собирает их в предложения на языке перевода и выдает результат.

Когда в интернете пишут про очередные “20 самых тупых машинных переводов” — скорее всего, речь именно про фразовый перевод. Хотя он и достиг некоторых успехов.

— Нейросетевой перевод
Про него будем говорить подробнее. Он вошел в массовое использование буквально на наших глазах: Гугл включил нейросетевой перевод в конце 2016 года. Для русского он появился в марте 2017. Яндекс запустил в конце 2017 года гибридную систему основанную на нейросетях и статистике.

Нейросети


Нейросетевой перевод основан на такой идее: если математически смоделировать и воспроизвести работу нейронов в голове человека, то можно предположить, что и компьютер научится работать с языком так же, как человек.

Для этого взглянем на клетки в мозгу человека.

Вот естественный нейрон. От ядра отходит длинный отросток — аксон. Он крепится к отросткам из других клеток — синапсам. По аксонам в синапсы клетки клетки передают информацию о некоторых электрохимических процессах. Из каждой клетки выходит только один аксон, а синапсов может входить много. Сигналы распространяются, и так происходит передача информации.

Некоторые клетки связаны с внешним миром. Они получают сигналы, которые дальше обрабатываются нейронной сетью.

А вот простейшая математическая модель того, что мы можем здесь сделать. Я нарисовал девять связанных кружочков. Это нейроны.



Шесть нейронов слева — входной слой, который получает сигнал от внешней среды. Нейроны второго и третьего слоя не соприкасаются с окружающей средой, а только с другими нейронами. Введем правило — если в нейрон входят по крайней мере две стрелочки от активированных нейронов, то этот нейрон тоже активируется.

Нейронная сеть обрабатывает сигнал, поступающий на вход, и в конечном итоге, правый — выходной — нейрон загорается или не загорается. При такой архитектуре, для активации правого нейрона нужно хотя бы четыре активированных нейрона в левом ряду. Если горят 6 или 5 — он точно загорится, если от 0 до 3 — точно не загорится. Но если горят четыре, то он загорится только если они распределены равномерно: 2 в верхней половине и 2 в нижней.



Получается, что простейшая схема из девяти кружочков приводит к довольно ветвистому рассуждению.

Искусственные нейронные сети работают примерно так же, но обычно не с такими простыми вещами, как “загорелось/не загорелось” (то есть 1 или 0), а с действительными числами.

Возьмём для примера сеть из 5 нейронов — два во входном слое, два в среднем (скрытом) и один в выходном. Между всеми нейронами соседних слоёв есть связи, к которым приписаны числа — веса. Чтобы узнать, что получается в пока незаполненном нейроне, сделаем очень простую вещь: посмотрим, какие связи в него ведут, домножим вес каждой связи на число, которое записано в нейроне предшествующего слоя, из которого идёт эта связь, и всё это просуммируем. В верхнем зелёном нейроне на схеме получается 50 ? 1 + 3 ? 10 = 80, а в нижнем — 50 ? 0,5 ? 3 ? 10 = ?5.

Правда, если делать только это, на выходе мы получим просто результат вычисления линейной функции от входных значений (в нашем примере выйдет 25 Y ? 0,5 X, где X — число в верхнем жёлтом нейроне, а Y — в нижнем), поэтому договоримся, что внутри нейрона ещё что-то происходит. Самая простая и в то же время дающая хорошие результаты функция — ReLU (Rectified Linear Unit): если в нейроне получается отрицательное число, выдаём на выход 0, а если неотрицательное, то выдаём его в неизменном виде.

Так в нашей схеме ?5 на выходе из нижнего зелёного нейрона превращается в 0, и именно это число используется в дальнейших вычислениях. Конечно, архитектура настоящих нейронных сетей, используемых на практике, куда сложнее, чем наши игрушечные примеры, да и веса берутся не с потолка, а подбираются путём обучения, но важен сам принцип.

Какое это отношение имеет к языку?


Самое прямое, при условии, что мы представим язык в виде чисел. Закодируем каждое слово и запустим в такую нейронную сеть.

Здесь на помощь приходит очень важное достижение компьютерной лингвистики, которое появилось в плане идеи 50 лет назад, а в плане реализации активно развивается последние лет 10: векторное представление слов.


эта и две следующие картинки — из презентации Штефана Эверта

Это представление слов в виде массива чисел на основе очень простого соображения. Чтобы узнать значение слова, мы смотрим не в словарь, а в огромные массивы текста и считаем, рядом с чем наше слово чаще встречается.

Например, знаете ли вы слово кашне? Если нет, попробуйте угадать, взглянув на тексты, где есть слово кашне.
— Черное пальто и белая кепка. Ну и еще какое-нибудь непременное кашне…

Рядом с ним предметы одежды, пальто и кепка, вероятно, и кашне из их ряда. Вряд ли это еда, вряд ли элемент архитектуры.
— На шее у него в душную ночь зачем-то было наверчено старенькое полосатое кашне.

На шее — значит, это не носки. Его можно навертеть — видимо, оно гибкое, сделано из ткани, а не, скажем, из дерева или камня.
— Мокроватое куцее вафельное полотенце Нержин повесил себе на шею вроде кашне.

Мы пополняем и пополняем банк примеров и, глядя на них, постепенно поймем, что такое кашне — нечто вроде шарфа. Ровно то же самое делает компьютер, который смотрит на текст и делает простую вещь — фиксирует слова, которые стоят рядом.

Вот египетские иероглифы.

Предположим вы знаете значения шести из них, и хотите понять, что за слово выделено красным. В этой таблице написано, сколько раз эти слова встречаются рядом с другими египетскими иероглифами.

Красное слово встречается с шестым словом — так же, как слова кошка и свинья. А другие слова с ним не встречаются вообще.

Красное слово встречается со вторым словом заметно чаще, чем с третьим, в отличие от слов нож и банан. Так же ведут себя слова кошка, лодка, свинья и чашка.

Опираясь на такие рассуждения, мы можем сказать, что красное слово больше всего похоже на слова кошка и свинья — только они встречаются с шестым словом, у них похожее соотношение второго и третьего.

И мы не ошибемся, потому что красное слово — это слово собака.


На самом деле — это не египетские иероглифы, а английские существительные и глаголы, для которых указано, сколько раз они встречаются рядом в большом собрании английских текстов. То самое шестое слово — это глагол kill.

Слова кошка, собака и свинья часто встречаются справа от слова убивать. Ножи, лодки и бананы убивают редко. Хотя по-русски при желании можно сказать, “я убил свою лодку”, но это вещь редкая.

Ровно так делает компьютер, когда обрабатывает текст. Просто считает, что встречается рядом с чем, и больше не происходит никаких шедевров понимания.

Дальше компьютер представляет слова в виде некоторого набора чисел: в примере выше слову dog соответствуют числа (115; 83; 10; 42; 33; 17). Вообще-то мы должны посчитать, сколько раз оно встречается не с шестью словами, а со всеми словами, которые есть в наших текстах: если всего у нас 100 000 разных слов, то слову dog мы поставим в соответствие массив из 100 000 чисел. Это не очень удобно на практике, поэтому обычно применяют методы уменьшения размерности, чтобы преобразовать полученные результаты для каждого слова в массив длиной несколько сотен элементов (подробнее об этом можно почитать здесь).

Есть готовые библиотеки для языков программирования, которые позволяют это сделать: например, gensim для Python. Подав ей на вход Брауновский корпус английского языка объёмом примерно 1 миллион слов, я за несколько секунд могу построить модель, в которой слово cat будет выглядеть следующим образом:

Мы представляем животное, с шерстью, хвостом, оно мяукает. Мой компьютер, который я учил английскому языку, представляет слово cat в виде ста чисел, которые получились от рядом стоящих слов.

Вот пример на русском материале с сайта RusVectores. Я взял слово ворона и попросил компьютер мне сказать, какие слова больше всего на него похожи — или, иначе говоря, наборы чисел для каких слов больше всего похожи на набор чисел для слова ворона.



8 слов из 10 оказались названиями птиц. Ничего не зная, компьютер выдал отличный результат — понял, что на ворону похожи птицы. Но откуда-то взялись слова каление и рученька?

Догадаться можно
Со всеми тремя часто употеребляется слово белый: до белого каления, под белы рученьки, белая ворона.

Получая массивы чисел и пропуская их через себя, нейросети выдают поразительно хороший результат. Вот довольно сложный, философский текст из речи академика Андрея Зализняка, посвященной статусу науки в современном мире. Он переведен на английский гугл переводчиком месяц назад, и требует минимального вмешательства редактора.

Здесь возникает глобальный философский вопрос


Это проблема так называемой китайской комнаты — мыслительный эксперимент о границах искусственного интеллекта. Его сформулировал философ Джон Серл в 1980 году.

В комнате сидит человек, который не знает китайского языка. Ему даны инструкции, у него есть книжки, словари и два окна. В одно окно ему дают записочки на китайском языке, а в другое окно он выдает ответы — тоже на китайском языке, действуя исключительно по инструкциям.

Например, в инструкции может быть написано, “вот ты получил записку, найди иероглиф в словаре. Если это иероглиф №518, выдай в правое окно иероглиф №409, если поступил иероглиф №711, выдай в правое окно иероглиф №35 и так далее”. Если человек в комнате хорошо выполняет инструкции и если эти инструкции хорошо написаны, то человек на улице, который отдает и получает записочки, может предположить, что комната или тот, кто в ней находится, знает китайский язык. Ведь снаружи не видно, что происходит внутри.

Мы-то знаем, что это человек, которому просто дали тупейшие инструкции. Он делает по ним какие-то операции, а вовсе не знает китайский язык. Хотя с точки зрения наблюдателя — это знание языка.

Философский вопрос — как нам к этому относиться? Знает ли комната китайский язык? Может быть, китайский язык знает автор этих инструкций? А может быть и нет, потому что выдать инструкции можно, опираясь на массив готовых вопросов и ответов.

С другой стороны — а что вообще такое знать китайский язык? Вот вы знаете русский язык. Что вы умеете? Что у вас происходит в голове? Какие-то биохимические реакции. Уши или глаза получают некоторый сигнал, это вызывает какие-то реакции, вы что-то понимаете. Но что значит «понимаете»? Что вы делаете, когда понимаете?

И еще более сложный вопрос — а делаете ли вы это оптимальным способом? Верно ли, что вы работаете с языком лучше, чем мог бы работать с языком какой-нибудь аппарат? Можете ли вы представить, что будете говорить по-русски хуже, чем какой-нибудь компьютер? Мы всегда сравниваем Сири, Алису с тем, как говорим сами, и смеёмся, если они говорят неправильно с нашей точки зрения. С другой стороны, мы с вами отдали компьютеру очень многое из того, что раньше считалось прерогативой человека. Сейчас машины гораздо лучше считают и играют в шахматы, а раньше они этого не могли. Возможно, с говорящими компьютерами произойдет похожее: лет через 100, 10, или даже 5 мы признаем, что машина освоила язык гораздо лучше, понимает гораздо больше и вообще является намного лучшим носителем естественного языка, чем мы.

Что тогда делать с тем, что человек привык определять себя через язык? Ведь говорят, только человек владеет языком. Что будет, если мы признаем победу за компьютером и в этой области?

Оставляйте свои вопросы в комменатариях. Возможно чуть позже у нас получится сделать с Александром интервью. А может быть он и сам придет в комментарии по нашему инвайту и пообщается со всеми, кому интересно.

Комментарии (57)


  1. Kolegg
    02.07.2018 15:29
    +1

    С табличкой про шахматы совсем беда.

    Из 100 игр с нормального начального положения AlphaZero выиграл 25 партий белыми, 3 чёрными и свёл вничью оставшиеся 72 (с)wikipedia.org/wiki/AlphaZero

    фиш не выиграл ни одной партии, а ничьих 72 вместо 3.


    1. arttom Автор
      02.07.2018 15:37
      +1

      Все так. Перепутал заголовки в таблице, спасибо


  1. vikarti
    02.07.2018 15:50
    +1

    Вот интересно мнение специалистов по машинному переводу про ситуации вроде habr.com/post/414485


    1. 5oclock
      03.07.2018 19:11

      Про пророссийских боевиков тоже показательно было.
      Потом исправили.


  1. saboteur_kiev
    02.07.2018 16:05

    Еще один пример. Человеку-переводчику и машинному переводчику на базе последних разработок и нейросетей дается две фразы. Что будет?

    1. Привет, мир.
    2. Переводчик, измени в первом предложении слово мир на слово Хабр.

    Результат очевиден — человек поймет текст, машинный переводчик — выполняет программу.


    1. vikarti
      02.07.2018 16:57
      +1

      А пример не совсем искуственный же.
      У Толкиена в приложении к Сильму и ВК — было указано как именно (и в каких случаях) нужно переводить имена/топонимы и почему — именно так.
      Даже не все люди-переводчики тех изданий что издавались в России — это прочитали и сделали как написано.

      Даже без спецзамечаний автора проблемы будут:

      Как на русский язык переводится «Honor Harrington»? А если учесть что это — имя и фамилия? И что имя в данном случае — «говорящее»? И либо у нас получается не существующее в русском языке имя Честь либо меняем имя на Викторию что немного подходит по смыслу (в официальном издании она Виктория, в большинстве любительских переводов — Честь)
      где фраза то одна…

      А как переводится Miles Vorkosigan? (у аристократов Барраяра все фамилии начинаются на vor). А если учесть русский был одним из официальных языков Барраяра до Периода Изоляции и персонажи в курсе как это на русском звучит и даже поговорка есть "«Vor does mean 'thief'!»". А если учесть что по словам автора — идея была про аналогию с 'фон' а когда автору сказали — она решила что хорошая идея и ввела в том числе и поговорку и историческое обоснования?
      Во всех вариантах русского перевода — аристократы таки форы а не воры.


      1. Bedal
        03.07.2018 09:40

        Вспоминается персонаж, которого зовут Эркюль Пуаро. И что, многие из русскоязычных читателей понимают, почему и зачем его так зовут? Судя по фильмам, и англоязычные (американоязычные) не все понимают.
        Так что — у людей с этой проблемой дела обстоят не так, чтобы принципиально лучше, чем у железки.


        1. vikarti
          03.07.2018 19:52

          Если я покупаю официальное издание на русском языке — я по крайней мере ожидаю что переводил профессиональный переводчик а не.

          У людей тоже не всегда хорошо, но скорее потому что идиоты-переводчики (или их начальство).

          Питер Гамильтон, ладно — перевести habitat как хабитат — еще можно (речь про весьма нехилых размеров космические станции на которых именно живут, часть из них — даже суверенные государства), но почему в следующей книге тоже самое — названо обиталищем? Переводчик книги не читал предыдущую? И там же — «interstellar ark» это у нас оказывается — «межзвездная арка»?! (
          (издание 2002 года, гугл уже был, можно было хоть посмотреть, там сразу все понятно, и какой будет правильный перевод на русский — тоже понятно (корабль поколений), Если гугла нет, словаря нет, уж Noah Ark то как эталонно переводится?
          (если что — гуглотранслейт это переводит как межзвездный ковчег — ну хоть по смыслу понятно что имелось ввиду (в отличии от «арки») ).


          1. Bedal
            04.07.2018 08:19

            Ну и я добавлю, что проблема просто нерешаема. Достаточно посмотреть во времена, когда иных переводов, кроме профессиональных, не издавалось. «Основание» Азимова не во всех изданиях так называлось. Да и проблема с именами и тогда была неразрешимой: что лучше, Сумкинс или Бэггинс?
            Хорошо, если переводчик сам по себе гениален, как Маршак или Гнедич, но чаще же — нет.


      1. saboteur_kiev
        03.07.2018 12:18

        Это неважно. Люди не всегда читают примечание.
        Важно то, что человек, прочитав эту фразу, может поступить иначе, чем просто перевести. Например воспользоваться советом, проигнорировать и так далее.

        Компьютерный переводчик, который не понимает смысла текста, будет всегда переводить. Либо реакция на фразу в нем должна быть заранее запрограммирована.


      1. Bedal
        04.07.2018 10:57

        рассказ Тэффи из жизни русских эмигрантов: «Так, например, вошла в обиход частица “вор”, которую ставят перед именем каждого лерюсса: вор-Акименко, вор-Петров, вор-Савельев. Частица эта давно утратила свое первоначальное значение и носит характер не то французского “Le” для обозначения пола именуемого лица, не то испанской приставки “дон”...».


      1. Bedal
        04.07.2018 11:10

        del


  1. ChePeter
    02.07.2018 16:49

    Лет сорок назад знакомые инженеры получили на хорошем заводе компьютер-переводчик. И перевели через «машинный переводчик» на английский и обратно фразу:
    «И кто его знает, зачем он моргает» — про любовь! Слова из песни.
    Получили: «никто не знает, что у него с глазом» — про офтальмологию
    А теперь на телефоне выдает «И кто знает, почему он мигает» про светофор и дорожное движение

    Мало что изменилось и поменялось.
    Попробуйте перевести на английский и обратно гуглем
    Ты жива еще моя старушка,
    Жив и я. Привет тебе, привет

    You're still alive, my old lady,
    I'm alive too. Hello to you, hello

    Ты все еще жив, моя старушка,
    Я тоже жив. Привет вам, привет


    1. staticlab
      02.07.2018 17:19

      Для Гугла перевод строки равносилен абзацу, то есть он не соединяет эти два предложения. Так что в общем случае он не пригоден для перевода стихотворений. А вот форму женского рода "жива" он делает, если убрать запятую в конце строки. На самом деле интересно, с чем это связано.


    1. PavelMSTU
      02.07.2018 17:26

      Из «Кибериады» Станислава Лема

      Путешествие первое А, или Электрувер Трурля
      Две недели подряд вводил Трурль в своего будущего электропоэта общие программы; потом наступила настройка логических, эмоциональных и семантических контуров. Уже было собрался он пригласить Клапауция на пробное испытание, но раздумал и сначала запустил машину в одиночку. Та немедля прочла доклад о полировке кристаллографических шлифов для вводного курса малых магнитных аномалий. Пришлось ослабить логические контуры и усилить эмоциональные; сперва машину одолел приступ икоты, затем припадок истерии, наконец, она с большим трудом пробормотала, что жизнь ужасна. Он усилил семантику и смастерил приставку воли; тогда она заявила, что отныне он должен ей подчиняться, и приказала достроить ей еще шесть этажей к девяти имеющимся, чтобы она могла на досуге поразмыслить о сущности бытия. Вставил он ей философский глушитель; после этого она вообще перестала откликаться и только колотила током. Умолял он ее, умолял и смог уговорить лишь спеть короткую песенку «Жили-были дед да баба, ели кашу с молоком», на чем ее вокальные упражнения кончились. Тогда начал он ее прикручивать, глушить, усилять, ослаблять, регулировать, пока не решил, что все в лучшем виде. Тут и угостила она его такими стихами, что возблагодарил он небеса за эту прозорливость: то-то бы потешился Клапауций, заслышав эти занудливые вирши, ради которых пришлось промоделировать возникновение Космоса и всех возможных цивилизаций! Вставил он ей шесть противографоманских фильтров, но они вспыхивали, как спички; пришлось изготовить их из корундовой стали. Тут понемногу стало у него налаживаться; он дал машине полную семантическую развертку, подключил генератор рифм, и чуть было все опять не полетело в тартарары, так как машина пожелала быть миссионером у нищих звездных племен. Однако в тот последний момент, когда он уже готов был наброситься на нее с молотком в руках, пришла ему в голову спасительная мысль. Он выбросил все логические контуры и вставил на их место ксебейные эгоцентризаторы со сцеплением типа «Нарцисс». Машина закачалась, засмеялась, заплакала и сказала, что у нее побаливает где-то на уровне третьего этажа, что ей все уже до лампочки, что жизнь удивительна, а все кругом негодяи, что она, наверное, скоро умрет, и желает только одного? — чтобы о ней помнили и тогда, когда ее не станет. Затем велела подать ей бумагу. Трурль облегченно вздохнул, выключил ее и отправился спать. Утром он зашел, за Клапауцием. Услышав, что его зовут на запуск Электрувера, как решил Трурль назвать свою машину, Клапауций бросил все свои дела и пошел в чем был, так не терпелось ему поскорее стать свидетелем поражения Друга.
      Трурль прежде всего включил нагревательные контуры, потом дал малый ток, еще несколько раз взбежал наверх по гремящим железным ступенькам — Электрувер похож был на огромный судовой двигатель, весь в стальных мостках, покрытый клепаным железом, со множеством циферблатов и клапанов, — и вот, наконец, запыхавшийся, следя, чтобы не падало напряжение, он заявил, что для разминки начнет с маленькой импровизации. А потом уж, конечно, Клапауций сможет предложить машине любую тему для стихов, какую захочет.
      Когда амплификационные указатели дали знать, что лирическая мощность достигла максимума, Трурль, рука которого чуть заметно дрожала, включил большой рубильник, и почти сразу машина произнесла голосом слегка хриплым, но изобилующим чарующими и убедительными интонациями:
      — Общекотовичарохристофорная хрящетворобка.
      — И это все? — выждав некоторое время, необычайно вежливо спросил Клапауций. Трурль стиснул зубы, дал машине несколько ударов током и снова включил. На этот раз голос оказался значительно чище; им можно было просто наслаждаться, этим торжественным, не лишенным обольстительных переливов баритоном:

      Лопотуй голомозый, да бундет грывчато
      В кочь турмельной бычахе, что коздрой уснит,
      Окошел бы назакрочь, высвиря глазята,
      А порсаки корсливые вычат намрыд!

      — По-каковски это? — осведомился Клапауций, с великолепной невозмутимостью наблюдая за паникой Трурля; тот метался у пульта управления, затем, махнув в отчаянии рукой, помчался, топая по ступеням, на самый верх стальной громадины. Видно было, как он на четвереньках вползает сквозь открытые клапаны в нутро машины, как стучит там молотком, яростно ругаясь, как что-то закручивает, бренча разводными ключами, как снова выползает и вприпрыжку бежит на другой помост; наконец он издал торжествующий вопль, выбросил перегоревшую лампу, которая с грохотом разбилась о пол в двух шагах от Клапауция, даже не подумав извиниться за такую небрежность, поспешно вставил на ее место новую, вытер грязные руки ветошью и закричал сверху, чтобы Клапауций включил машину. Раздались слова:

      Три, самолож выверстный, вертяшку сум воздлинем,
      Секливой аппелайде и боровайка кнется,
      Гренит малополешный тем перезлавским тринем,
      И отмурчится бамба, и голою вернется.

      — Уже лучше! — воскликнул, правда не совсем уверенно, Трурль. — Последние слова имели смысл, заметил?
      — Ну, если это все… — промолвил Клапауций, который был сейчас олицетворением изысканнейшей вежливости.
      — Черт бы его побрал! — завопил Трурль и снова исчез во внутренностях машины: оттуда доносился лязг, грохот, раздавались треск разрядов и проклятия конструктора. Наконец он высунул голову из небольшого отверстия на третьем этаже и крикнул:
      — Нажми-ка теперь!
      Клапауций выполнил просьбу. Электрувер задрожал от фундамента до верхушки и начал:

      Грызнотвурога жуждя, голонистый лолень
      Самошпака мимайку…

      Голос оборвался — Трурль в бешенстве рванул какойто кабель, что-то затрещало, и машина смолкла. Клапауций так хохотал, что в изнеможении опустился на подоконник. Трурль кидался туда и сюда, вдруг что-то треснуло, звякнуло, и машина весьма деловито и спокойно произнесла:

      Зависть, чванство, эгоизм, по словам Конфуция,
      До добра не доведут — знает это и болван.
      Словно краба грузовик, так и Клапауция
      Мощью замыслов раздавит духа великан!

      — Вот! Пожалуйста! Эпиграмма! И прямо не в бровь, а в глаз! -выкрикивал Трурль, описывая круги, все ниже и ниже, ибо он сбегал вниз по узкой спиральной лестничке, пока почти не влетел в объятия коллеги, который перестал смеяться и несколько оторопел.
      — — А, дешевка, — сказал тут Клапауций. — Кроме того, это не он, а ты сам!
      — Как это я?
      — Ты это сочинил заранее. Догадываюсь по примитивности, бессильной злости и банальным рифмам.
      — Ах вот как? Ты предложи что-нибудь другое! Что захочешь! Ну, что же ты молчишь? Боишься, а?
      — Не боюсь, а просто задумался, — сказал задетый за живое Клапауций, стараясь найти самое трудное из возможных заданий, поскольку не без основания полагал, что спор о качестве стихотворения, сложенного машиной, трудно будет разрешить.
      — Пусть сочинит стихотворение о кибэротике! — сказал он наконец, радостно усмехаясь. — Пусть там будет не больше шести строк, а в них о любви и измене, о музыке, о неграх, о высшем обществе, о несчастье, о кровосмесительстве — в рифму и чтобы все слова были только на букву «К»!
      — А полного изложения общей теории бесконечных автоматов ты случайно не предложишь? — заорал оскорбленный до глубины души Трурль. — Нельзя же ставить таких кретинских усло…

      И не договорил, потому что сладкий баритон, заполнив собой весь зал, в этот момент отозвался:
      Кот, каверзник коварный, кибэротоман,
      К королеве кафров крадется Киприан.
      Как клавесина клавишей, корсажа касается.
      Красотка к кавалеру, конфузясь, кидается…
      … Казнится краля, киснет: канул Купидон,
      К кузине королевы крадется киберон!

      — Ну, и что ты скажешь? — подбоченился Трурль, а Клапауций, уже не раздумывая, кричал:
      — А теперь на «Г»! Четверостишие о существе, которое было машиной, одновременно мыслящей и безмозглей, грубой и жестокой, имевшей шестнадцать наложниц, крылья, четыре размалеванных сундука, в каждом из которых по тысяче золотых талеров с профилем короля Мурдеброда, два дворца, проводившей жизнь в убийствах, а также…
      — Грозный Генька-генератор грубо грыз горох горстями… -начала было машина, но Трурль подскочил к пульту управления, нажал на рубильник и, заслонив, его собственным телом, промолвил сдавленным голосом:
      — Все! Не будет больше подобной чепухи! Я не. допущу, чтобы погубили великий талант! Или ты будешь честно заказывать стихи, или на этом все кончено!
      — А что же — те стихи были заказаны нечестно?.. — начал Клапауций.
      — Нет! Это были головоломки, ребусы какие-то! Я создавал машину не для идиотских кроссвордов! Ремесло это, а не Великое Искусство! Давай любую тему, самую трудную…
      Клапауций думал, думал, аж сморщился весь и сказал:
      — Ладно. Пусть будет о любви и смерти, но все должно быть выражено на языке высшей математики, а особенно тензорной алгебры. Не исключается также высшая топология и анализ. Кроме того, в стихах должна присутствовать эротическая сила, даже дерзость, но все в пределах кибернетики.
      — Ты спятил. Математика любви? Нет, ты не в своем уме… -возразил было Трурль. Но тут же умолк враз с Клапауцием, ибо Электрувер уже скандировал:

      В экстремум кибернетик попадал
      От робости, когда кибериады
      Немодулярных групп искал он интеграл.
      Прочь, единичных векторов засады!
      Так есть любовь иль это лишь игра?
      Где, антиобраз, ты? Возникни, слово молви-ка!
      Уж нам проредуцировать пора
      Любовницу в объятия любовника.
      Полуметричной дрожи сильный ток
      Обратной связью тут же обернется,
      Такой каскадной, что в недолгий срок
      Короткой яркой вспышкой цепь замкнется!
      Ты, трансфинальный класс! Ты, единица силы!
      Континуум ушедших прасистем!
      За производную любви, что мне дарила
      Она, отдам я Стокса насовсем!
      Откроются, как Теоремы Тела,
      Твоих пространств ветвистые глубины,
      И градиенты кипарисов смело
      Помножены на стаи голубиные.
      Седины? Чушь! Мы не в пространстве Вейля,
      И топологию пройдем за лаской следом мы,
      Таких крутизн расчетам робко внемля,
      Что были Лобачевскому неведомы.
      О комитанта чувств, тебя лишь знает
      Тот, кто узнал твой роковой заряд:
      Параметры фатально нависают,
      Наносекунды гибелью грозят.
      Лишен голономической системой
      Нуля координатных асимптот.
      Последних ласк, — в проекции последней
      Наш кибернетик гибнет от забот.

      На этом и закончилось поэтическое турне; Клапауций тут же ушел домой, обещав, что вот-вот вернется с новыми темами, но больше не показывался, опасаясь дать Трурлю еще один повод для триумфа; что же касается Трурля, то он утверждал, будто Клапауций удрал, не будучи в силах скрыть непрошеную слезу. На это Клапауций возразил, что Трурль с той поры, как построил Электрувера, видимо, свихнулся окончательно.
      Прошло немного времени, и слух об электрическом барде достиг ушей настоящих, я хочу сказать обыкновенных, поэтов. Возмущенные до глубины души, они решили не замечать машины, однако нашлось среди них несколько любопытных, отважившихся тайком посетить Электрувера. Он принял их учтиво, в зале, заваленном исписанной бумагой, так как сочинял днем и ночью без роздыху. Поэты были авангардистами, а Электрувер творил в классическом стиле, ибо Трурль, не очень-то разбиравшийся в поэзии, основывал вдохновляющие программы на произведениях классиков. Посетители высмеяли Электрувера, да так, что у него от злости чуть не полопались катодные трубки, и ушли, торжествуя. Машина, однако, умела самопрограммироваться, и был у нее специальный контур усиления самоуверенности с предохранителем в шесть килоампер, и в самый короткий срок все изменилось самым решительным образом. Ее стихи стали туманными, многозначительными, турпистическими, магическими и приводили в совершеннейшее отупение. И когда прибыла новая партия поэтов, чтобы поиздеваться и покуражиться над машиной, она ответила им такой модернистской импровизацией, что у них в зобу дыханье сперло; от второго же стихотворения серьезно занемог некий бард старшего поколения, удостоенный двух государственных премий и бюста, выставленного в городском парке. С тех пор ни один поэт уже не в силах был сопротивляться пагубному желанию вызывать Электрувера на лирическое состязание — и тащились они отовсюду, волоча мешки и сумки, набитые рукописями. Электрувер давал гостю почитать вслух, на ходу схватывал алгоритм его поэзии и, основываясь на нем, отвечал стихами, выдержанными в том же духе, но во много раз лучшими — от двухсот двадцати до трехсот сорока семи раз,
      Спустя некоторое время он так приноровился, что одним-двумя сонетами сваливал с ног заслуженного барда. А что хуже всего -оказалось, что из соревнования с ним с честью могут выйти лишь графоманы, которые, как известно, не отличают хороших стихов от плохих', потому-то они и уходили безнаказанно, кроме одного, Сломавшего ногу, споткнувшись у выхода о широкое эпическое полотно Электрувера, весьма новаторское и начинавшееся со строк:

      Тьма. Во тьме закружились пустоты.
      Осязаем, но призрачен след.
      Ветер дунул — и взора как нет.
      Слышен шаг наступающей роты.

      В то же самое время настоящим поэтам Электрувер наносил значительный урон, хотя и косвенно — ведь зла им он не причинял. Несмотря на это, один почтенный уже лирик, а вслед за ним два модерниста совершили самоубийство, спрыгнув с высокой скалы, которая по роковому стечению обстоятельств как раз попалась им на пути от резиденции Трурля к станции железной дороги.
      Поэты сорганизовали несколько митингов протеста и потребовали опечатать машину, но никто, кроме них, не обращал внимания на феномен. Редакции газет были даже довольны, поскольку Электрувер, писавший под несколькими тысячами псевдонимов сразу, представлял готовую поэму заданных размеров на любой случай, и эта поэзия, хоть и на заказ, была такого качества, что читатели раскупали газеты нарасхват, а улицы так и пестрели лицами, полными неземного блаженства, мелькали бессознательные улыбки и слышались тихие всхлипывания. Стихи Электрувера знали все; воздух сотрясали хитроумнейшие рифмы, а наиболее впечатлительные натуры, потрясенные специально сконструированными метафорами или ассонансами, даже падали в обморок; но и к этому был подготовлен титан вдохновения: он сразу же вырабатывал соответствующее количество отрезвляющих сонетов.
      Сам же Трурль хлебнул горя из-за своего изобретения. Классики, по преимуществу люди весьма пожилого возраста, много вреда ему не причинили, если не считать камней, регулярно выбивавших окна, или веществ (не будем называть их), которыми забрасывали его дом. Куда хуже было с молодежью. Один поэт самого молодого поколения, стихи которого отличались большой лирической силой, а мускулы — физической, жестоко избил его. Пока Трурль отлеживался в больнице, события развивались дальше; не было ни дня без нового самоубийства, без похорон; перед больничным подъездом дежурили пикета и слышалась стрельба, так как вместо рукописей поэты все чаще прятали в своих сумках самострелы, разряжая их в Электрувера, стальной натуре которого пули, однако, не приносили вреда. Вернувшись домой, отчаявшийся и обессилевший конструктор однажды ночью решил разобрать на части собственными руками сотворенного гения.
      Но когда он, слегка прихрамывая, приблизился к машине, та, завидев разводные ключи в его сжатой руке и отчаянный блеск в глазах, разразилась такой страстной лирической мольбой о милосердии, что растроганный до слез Трурль отбросил инструменты и пошел к себе, утопая по колени в новых произведениях электродуха, которые вскоре поднялись ему по пояс, наводняя зал шелестящим бумажным океаном.
      Однако через месяц, когда Трурль получил счет за электричество, потребленное машиной, у него потемнело в глазах. Он был бы рад выслушать советы старого приятеля Клапауция, но тот исчез, как будто земля под ним разверзлась. Вынужденный действовать на собственный страх и риск, Трурль в одну прекрасную ночь обрезал питавший машину провод, разобрал ее, погрузил на космический корабль, вывез на один из небольших планетоидов и там снова смонтировал, присоединив к ней как источник творческой энергии атомный котел.
      Затем он потихоньку вернулся домой, но на этом история не кончилась, так как Электрувер, не имея возможности распространять свои произведения в печатном виде, стал передавать их на всех радиоволнах, чем приводил экипажи и пассажиров космических ракет в лирический столбняк, причем особо тонкие натуры подвергались также тяжелым приступам восторга с последующим отупением. Установив, в чем дело, руководство космофлота официально обратилось к Трурлю с требованием немедленно ликвидировать принадлежащую ему установку, нарушающую лирикой общественный порядок и угрожающую здоровью пассажиров.
      Вот тогда Трурль начал скрываться. Пришлось послать на планетоид монтеров, чтобы они запломбировали Электруверу лирические выходы, но он оглушил их балладами, и они не смогли выполнить поставленной перед ними задачи. Послали глухих, но Электрувер передал им лирическую информацию на языке жестов. Стали поговаривать вслух о необходимости карательной экспедиции или бомбежки. Но тут наконец машину приобрел один владыка из соседней звездной системы и вместе с планетоидом перетащил в свое королевство.
      Теперь Трурль мог снова появиться и спокойно вздохнуть. Правда, на южном небосклоне то и дело вспыхивают сверхновые звезды, которых не помнят старожилы, и ходят упорные слухи, что тут не обошлось без поэзии. Рассказывают, будто по странному капризу упомянутый владыка приказал своим астроинженерам подключить Электрувера к созвездию белых гигантов, и каждая строчка стихов стала тут же претворяться в гигантские протуберанцы солнечные; таким образом величайший поэт Космоса огненными вспышками передает свои творения всем бесконечным безднам галактик сразу. Другими словами, великий владыка превратил его в лирический двигатель скопления переменных звезд. Если даже и есть в этом хоть доля правды, все это происходит слишком далеко, чтобы смутить праведный сон Трурля, который поклялся самой страшной клятвой никогда в жизни больше не браться за кибернетическое моделирование творческих процессов.


      1. apiperski
        03.07.2018 06:39

        Известный стиховед Татьяна Владимировна Скулачёва каждый год приходит на конференцию по компьютерной лингвистике «Диалог» (http://www.dialog-21.ru/), подходит к постерам и спрашивает: «А со стихотворными текстами ваш продукт будет корректно работать?» Все докладчики (и я в том числе) на этот вопрос начинают бормотать что-то невнятное :)


        1. asm679
          05.07.2018 02:19

          А Вы ещё не просили Алису почитать стихи? ;)


  1. PavelMSTU
    02.07.2018 17:20

    А представьте себе такую машинку в XVIII веке. Она казалась бы чудом, потому что вычисление было прерогативой человека.

    Нет. Паскалина была изобретена уже в середине XVII века.

    + советую почитать «Мысли» Блеза Паскаля. Там он возмущается, что его Паскалину считают думающей машиной.


    1. apiperski
      02.07.2018 18:10

      Спасибо за ссылку! Когда я выбирал, какой век назвать, специально смотрел историю разных вычислительных машин и решил, что всё, что до XIX века — это курьёзы (или, если угодно, прототипы), и только потом уже — полноценные распространённые инструменты. Отдельное спасибо за указание на «Мысли», почитаю!


  1. rg_software
    03.07.2018 05:47

    Это хороший текст для «обычных людей» — такая вводная лекция, что это такое, и с чем едят.

    Меня слегка расстраивает, что границы и достижения обсуждаются в достаточно общем ключе. Вот скажем, сейчас в тренде механизмы deep learning, и вроде как качество переводов растёт. Но не обсуждается, каковы границы этого роста и где мы снова остановимся.

    Насколько я понимаю, сейчас идёт эволюционное развитие, повышение качества методов, работающих на основе данных и статистике (собственно, любое машинное обучение). Однако понятно, что у них тоже есть свои пределы.

    Скажем, тот же Гугл не отслеживает связи между предложениями (а это может быть крайне важно), есть и куда более тонкие проблемы. Ну и, наконец, данные тоже не беспредельны: я вот слабо верю, что для любой пары более-менее развитых языков (навскидку, португальский-вьетнамский) можно найти достаточное количество параллельных текстов для надёжного обучения.


    1. apiperski
      03.07.2018 06:36

      Ну, это как-нибудь в следующий раз напишу :) Моя любимая статья на тему проблем нейросетевого машинного перевода — вот: https://arxiv.org/abs/1706.03872 (годичной давности, так что уже чуть устаревшая, но всё же).


  1. lipkij
    03.07.2018 08:51

    Прокомментируете диалоги из последней презентации Google IO?
    "
    [Google Assistant: Yes, the Warriors won 118 to 92 last Sunday against the Pelicans. ]
    Nice! When is their next game?
    [Google Assistant: The Warriors’ next game is today at 7:30 PM where they will be playing the Pelicans.]
    Great. It’s going to be fun to watch tonight. Remind me to find my Kevin Durant’s Jersey when I get home.
    [Google Assistant: Sure. I’ll remind you when you get home.]
    "

    Или:
    ‘Hey Google’ who was the governor of California when Kevin Durant was drafted and what team drafted him?
    [Google Assistant: Arnold Schwarzenegger was the governor in 2007. Kevin Durant was drafted by the Seattle Supersonics.]

    Я после таких примеров был немного в шоке.


    1. 4Naoki
      03.07.2018 14:31

      А здесь же вроде как все понятно.
      Учитывая алгоритм, представленный выше, ИИ делит текст и выделяет наиболее значимые объекты. Во втором примере максимальным совпадением обладает имя собственное — Кевин Дюрант. Отсюда система и пляшет, зная его историю, она смотрит когда его задрафтили, какая команда это сделала и кто был губернатором.
      Конечно, масштабы удивляют, но учитывая ресурсы компании, она может обрабатывать их с огромной скоростью.


  1. Real3L0
    03.07.2018 09:59

    Можете ли вы представить, что будете говорить по-русски хуже, чем какой-нибудь компьютер?

    Если, как описано в статье, машина будет учиться говорить по современным текстам, то вряд ли она будет говорить лучше. Например, сейчас в РФ почти все пишут и говорят «в Украине».


    1. strachkov
      03.07.2018 15:09

      Сейчас почти все многие в РФ путают "-ться" и "-тся", но вы почему-то решили привести неоднозначный пример из ветки комментариев тематических блогов и телепрограмм.
      Я Вам попробую объяснить. Русский язык, к сожелению одних и к радости других, развивается и иногда стремительными темпами. Вот не так давно были введены определенныеуточнения в нормах русского языка и кофе уже не только «черный», но и «черное». Ну, логика, как мне кажется, ясна. Ситуация заключается в том, что на неофициальном уровне кофе давно в том числе и «черное».
      Нормы, сложившиеся не в рамках каких-либо логик (Украина таки не остров, и даже не полуостров, только отдельные части Украины — полуострова), а скорее вследствии влияний традиций могут быть адаптированы или уточнены.


      1. Real3L0
        03.07.2018 15:39

        Сейчас почти все многие в РФ путают "-ться" и "-тся"

        К счастью, я общаюсь в кругах, где это (почти) не путают, поэтому и не знаю, что это большая проблема.
        решили привести неоднозначный пример из ветки комментариев тематических блогов и телепрограмм.

        Что мне больше/чаще всего режет слух, то и привёл.
        Я знаю про нормы. Знаю про кофе. Знаю про развитие.
        Но развитие — это одно, а нормы — другое. В случае «на Украину» развитие может и есть, но нормы никто не менял. А в статье речь именно о правильном произношении, а не о развитии. (Если, конечно, внезапно не стало, что говорить развивающимся русским языком — это более правильно, чем по нормам. :) )


        1. 5oclock
          03.07.2018 19:27

          Интересна корреляция, проявляющаяся в Вашем круге общения: тся/ться не путают, а вот на "в Украину" — поддались.
          Вырисовывается такой образованный либерал. Да?


          1. Real3L0
            03.07.2018 23:25

            Интересна корреляция, проявляющаяся в Вашем круге общения: тся/ться не путают, а вот на «в Украину» — поддались.

            Во-первых, если немного подумать, то «тся/ться» встречается только в тексте (или в Ваших кругах общения это и устно говорят неправильно?), и в моём круге общения действительно пишут правильно.
            Во-вторых, если быть немного внимательней, я не говорил, что «на Украину» используют в моём круге общения. Я слышу это, в основном, из телевизора.
            В итоге имеем разные источники информации.
            Вырисовывается такой образованный либерал. Да?

            Образованному патриоту режет слух?


            1. 5oclock
              03.07.2018 23:56

              Потакание носителей русского языка лингвистическим комплексам правителей соседней страны — да, слух режет.
              Но это уже другая тема.


              1. Real3L0
                04.07.2018 08:44

                Осталось только понять, почему носителям русского языка режет слух «нормированный» русский язык?


                1. 5oclock
                  04.07.2018 09:23

                  Шо це таке "нормированный русский язык"?


                  1. Real3L0
                    04.07.2018 09:27

                    Правильный.


                    1. 5oclock
                      04.07.2018 09:29

                      По правде говоря, иногда и "правильный" режет. Потому как не говорит так народ.
                      Но и "в Украину" — тоже не говорит.


                      1. Real3L0
                        04.07.2018 09:47

                        Потому как не говорит так народ.

                        До известных событий, абсолютно весь русский народ много лет именно так и говорил. И в школе так преподавали. То, что сейчас народ так не говорит, как я уже упоминал, не делает язык моментально правильным.
                        Но и «в Украину» — тоже не говорит.

                        Говорит. Одно время, только Первый канал в телевизоре РФ говорил правильно, но, кажется, и они скатились.


                        1. 5oclock
                          04.07.2018 10:21

                          Вас обманули, причём обман внедрили глубоко — вплоть до «навязывания альтернативной истории».
                          Но даже сами пояснения сторонников «в Украины» с отсылками в историю (мол Великороссы считали Малороссию окраиной, поэтому «на Окраину») — уже указывает на то, что всегда и говорили «на Украину».
                          И норма современного русского языка: «на Украину».
                          new.gramota.ru/spravka/buro/hot10/?v=full

                          Да что там говорить, сами украинцы поют:
                          «Як у нас на Украини, мы живём богато...»

                          Когда-нибудь, под лингвинистическим давлением с Украины возможно русский язык и изменится и все станут говорить «в Украину». Всё может быть: язык изменчив.
                          Но сейчас норма — «на Украину», а «в Украину» выглядит коверканием русского языка в угоду — именно комплексам украинских политиков.
                          Иными словами: глупостью выглядит.


                          1. Real3L0
                            04.07.2018 11:12

                            А зачем Вы мне доказываете то, что я знаю и с чем согласен? :)


                            1. 5oclock
                              04.07.2018 11:18

                              Должно быть, неправильно понял что Вы считаете правильным в Вашем предыдущем посте.


                          1. VolCh
                            04.07.2018 15:13

                            Поправка: в лучшем (для «на») случае — норма современного литературного языка.

                            В разговорной речи, а также в документах допустимы оба варианта. Можно проверить, например, на сайте Президента России (если не чистили недавно) Только с 2014-го года исключительно «на» употребляется, до этого то одно, до другое, с заметной корреляцией с российско-украинскими политическими отношениями.

                            То есть в целом русский язык уже изменился, максимум не изменилась литературная норма.


                            1. 5oclock
                              04.07.2018 15:51

                              В разговорной речи много что допустимо. Даже падонкафский диалект.
                              Но это не значит, что так теперь все говорят и что это — норма даже для разговорного языка. Это — диалект.
                              Так и с «вУкраиной».
                              В украинском диалекте русского языка этот вариант насаждают на госуровне.
                              Либеральные россияне с комплексом 2014 (у меня только такой портрет складывается) — перенимают это.
                              Но говорить о том, что этот вариант использует большинство россиян — большое преувеличение. Во всяком случае — пока.


                              1. VolCh
                                04.07.2018 17:08

                                Ну Указ Президента России типа такого kremlin.ru/acts/bank/15242/page/2 — это скорее насаждение в российском диалекте русского языка на госуровне. Ну и самый либеральный россиянин перенял это ещё в 2000 году, подписав его.


                                1. 5oclock
                                  04.07.2018 17:10

                                  Что-то по вашей ссылке какая-то перепись населения, а не указ.
                                  Ну и, согласитесь, языковые нормы указами президентов не устанавливаются :)


                                  1. VolCh
                                    04.07.2018 17:32

                                    Указ о предоставлении российского гражданства, в основном уроженцам других республик бывшего СССР.

                                    Как по мне, то языковые нормы вообще не устанавливаются, а формируются :) А этот указ одно из свидетельств того, что в России вариант «в Украине» если на госуровне и не насаждают сейчас, то насаждали в 2000-м году, то есть значительно раньше чем 2014-й. Да и позже его встречаются «в» документах самого высокого уровня, в интервью высших лиц и т. п.


  1. VolCh
    03.07.2018 12:01

    А что значит «лучше»? Как по мне, то лучше быть не может, компьютер сможет стать неотличим от человека при слепом тестировании.


    1. baragol
      03.07.2018 15:27

      Ну все же мы отличаем Хармса от Донцовой :) Корректно будет сказать, что эти писатели просто р а з н ы е, но субъективно я отдаю предпочтение одному из них.

      Считается, что отправленное сообщение никогда не равно принятому. Загвоздка 1) в интерпретации принимающего, 2) в способности отправителя выражать свои мысли так, чтобы «шума в сигнале» было меньше. Т.е. в самом примитивном раскладе — чтобы его поняли именно так, как он хотел.

      В целом я согласен, что термин «лучше» не вполне подходит. Но если представить, что ИИ научится генерировать художественный текст, не сможет ли он [и тут мы переходим совсем в уж в психолингвистику и какую-то метафизику] точнее доносить смыслы или сразу множество смыслов в своих произведениях? Сможет ли ИИ когда-нибудь выстроить драматургию так, как не мог человек?

      Простите за поток мыслей. Вопросов много, ответов мало. Оценка языка в какой-то момент становится очень субъективной штукой.


      1. VolCh
        04.07.2018 15:45

        Сейчас, наверное, можно говорить о появлении у человеческих языков новой функции (ну или качественное изменение существующей) — интерфейса взаимодействия человека с машиной, а не только человека с человеком, как было тысячелетиями, пускай и через машину или иные средства типа книг. До недавнего времени машины просто (ну не просто технически) передавали языковую информацию между людьми, помогали её искать, переводить и т. п., но не генерировали её сами (ну если не считать всяких бредогенераторов). Сейчас же мы вплотную подошли к тому, что машины начинают сами общаться с человеком, а не просто передавать языковую информацию от одного человека к другому. Собственно поэтому напрямую уже сравнивать нельзя. Машины уже могут худо бедно имитировать человека, через несколько лет во многих случаях мы уже и отличить не сможем, но потом наверняка возникнет это «р а з н ы е», когда не будет у машины стоять задачи имитировать человека.


  1. SEN7759
    03.07.2018 19:28

    Приведу банальные вещи...


    Сознание связано с отражением, моделированием, распознаванием, анализом,
    обработкой и хранением информации (память).


    Смысл фразы: "Собака вошла в конуру", связан с образами/отражениями/моделями собаки, конуры, процесса движения, направления движения, нахождения внутри, распознаванием и с анализом цели действия, результата, возможных последствий/следствий, связей с другими событиями. Например, качественный перевод ИИ с одного языка на другой потребует сначала создания
    анимированного образа, затем выявления смысла и формулировки его на другом языке.


    Следовательно, нужны модели мира (вместилища об'ектов, их связей/отношений, возможных преобразований), об'ектов, преобразований/действий, программы распознавания об'ектов и преобразований, программы для сравнения и анализа и т.п. Реальное обучение происходит при использовании моделей, игр...


    1. Closius
      03.07.2018 23:14

      Правильно. По научному это называется «ассоциативная память». Есть определенные методы ее моделирования


  1. Closius
    03.07.2018 23:08

    На самом деле все просто. Мозг это нейронная сеть, которая на самом деле опять же довольно просто устроена. Когда человек рождается у него в голове есть нейронная сеть в самом человеке есть начальные условия в виде генотипа. Дальше во время развития (воспитания в семье, на улице, в окружении каком-то) появляются новые связи, уточняются веса нейронов и тд…
    К чему я это? А к тому, что человека (да и вообще все) можно сэмулировать на компьютере. В свою очередь компьютер и все в мире связано (это еще до конца не известно, но йоги говорят об этом).

    И правильно автор задается вопросом «кто лучше говорит компьютер или человек». Человек хрош тем, что несовершенен. Но нейронная сеть сама по себе не совершенна, она не дает 100% ответа.


    1. Frankenstine
      04.07.2018 08:51

      Мозг это нейронная сеть, которая на самом деле опять же довольно просто устроена.

      Не настолько просто как кажется. Достаточно хотя бы того, что каждый нейрон уникален (не говоря уже про их наборы), а нейропластичность позволяет им брать на себя нужную функцию вне зависимости от своей начальной конфигурации (того, как они обрабатывают входящие сигналы), причём это происходит без выделенного «управляющего» этим процессом, вплоть до того, что человек живёт и нормально «функционирует» без целого полушария или с какими-то считанными процентами оставшихся в живых нейронов (см. например, Мужчина, который живёт без 90% мозга, озадачил учёных), а окружающие (и сам человек) об этом не догадываются. Более того, нейроны могут работать не только в «обычную сторону», но и реверсивно. Ну а с учётом того, что нейроны — лишь небольшая часть клеток мозга (одних только нейроглий 40% от всего мозга), влияющих на обработку сигналов (которые, между прочим, бывают чаще химические, чем электрические), а некоторые функции до сих пор не изучены — ваше заявление
      человека (да и вообще все) можно сэмулировать на компьютере

      выглядит уж слишком наивно.


      1. SEN7759
        04.07.2018 15:26

        Переход сознания на искусственный носитель теоретически возможен. Уже есть искусственные нейроны (пока ещё относительно большие); можно снимать некоторую информацию с нейронов и активировать их. Мозг пластичен, т.е. если он будет работать с имплантами, то они будут брать все больше функций и памяти на себя. В некоторый период и сознание может перейти на такие носители (даже в том случае, если его природа и не будет достаточно изучена, поскольку исследовать функции и связи между 86 млрд нейронов (с тысячами дендридов каждый) и 150 млрд глиальных клеток очень сложно).


        1. Frankenstine
          04.07.2018 19:10

          Теоретически кагбэ возможен, да, однако практическая реализация симуляции мозга на данный момент стоит порядка полутора миллиардов долларов и всё ещё в процессе первичной подготовки, см. ru.wikipedia.org/wiki/Human_Brain_Project


          1. SEN7759
            05.07.2018 08:45

            Откуда Вы про первичность узнали? Они отчёты давно перестали в открытом доступе предоставлять.


            1. Frankenstine
              05.07.2018 12:01

              Вот в том-то и дело, что отчитываться, толком, не в чем. Проект буксует.
              sciencebusiness.net/news/77294/%E2%82%AC1B-Human-Brain-Project-back-on-track-after-Commission-signs-new-contract

              Some EU member states, expected to contribute half of the project’s overall budget, have not yet made any commitments.


  1. Closius
    03.07.2018 23:16

    И кстати говоря понятие лучше или хже говорить на языке — такого нет. Я считаю что например мой друган говорит лучше чем какой нить путин, так как я его понимаю прекрасно и он мне все очень классно объясняет, чего другой сделать не может, хотя говорит на литературном языке.


  1. Wfladimir
    04.07.2018 11:15

    ИИ заговорит человечьим языком, если произойдёт очередной революционный прорыв в цифровой или друго вычислительной технике.


  1. pioneer
    04.07.2018 11:50

    Интересно, почему не получил распространение подход с использованием чего-то наподобие UNL (https://en.wikipedia.org/wiki/Universal_Networking_Language)? На первый взгляд, неплохая попытка создать ту самую промежуточную машинно-ориентированную интерлингву, которую нейросети Гугла как-то создают внутри себя сами.


    1. SEN7759
      04.07.2018 15:23

      Хороший вопрос. 1. Лучше то, что делается, например, здесь http://wolframalpha.com


      1. Аналогичный вопрос об эсперанто. Его легче изучать, регуляризировать, легче научить ИИ для более осмысленных диалогов с человеком...