Вот такие они, женские романы. Возможно, ИИ Google уже прочитал все это

Любовные романы очень похожи — и сюжетом, и литературными оборотами, и героями. Тем не менее, корпорация Google «скармливает» такие романы тысячами своему ИИ. Делается это с простой целью — научить ИИ составлять предложения, которые схожи с ранее прочитанными. А это, в свою очередь, позволит компании сделать свои программные продукты более индивидуальными и «общительными». Это касается, например, приложения Google.

Ответы, которые получает пользователь приложения, довольно формальные. Вся информация, необходимая пользователю, есть, но вот «души» здесь нет. «Надеемся, этот проект, и будущие проекты, помогут сделать приложение более общительным, с возможности изменения тона, стиля, регистра», — говорит Эндрю Дэй, разработчик ПО корпорации.

Также наработки могут использоваться и в других продуктах корпорации, включая “Smart Reply” сервиса Inbox. Эта функция предлагает три варианта ответа, исходя из контекста сообщения, на которое необходимо ответить пользователю. Чем совершеннее становится ИИ, тем лучше составляются ответы. Сейчас уже 10% ответов с мобильных устройств пользователей — это результат работы “Smart Reply”, говорят представители компании.

Почему не использовать для обучения ИИ философские трактаты, научные работы, известные произведения классиков? Зачем нужны эти женские романы ИИ? Оказывается, суть в следующем. В тысячах таких романов описываются одни и те же ситуации. Но вот описания ведутся с использованием различных слов и выражений. Одно и то же событие, явление, встреча описываются разными словами. ИИ учится определить предложения со схожими значениями и получать знания о нюансах языка.

Сам процесс обучения ИИ на основе литературных произведений далеко не так прост, как могло бы показаться. Изначально у системы нет никаких «знаний», никакой базы — все это требуется расширять, добавлять и совершенствовать. С течением времени ИИ становится лучше. Сложно сказать пока, насколько лучше этот сервис стал после ознакомления с 2865 женскими романами, но то, что прогресс есть, уже очевидно.

Система дают определенное предложение из романа, и машине нужно описать то же самое, только своими словами. ИИ делает это снова и снова, пока результат не становится таким же, или лучшим, чем в «первоисточнике».

Но может ли ИИ написать роман своими силами? Эндрю Дэй убежден, что да, теоретически это возможно. Правда, результаты этой работы компания пока отказывается показывать. Но все впереди.

Комментарии (37)


  1. Halt
    05.05.2016 14:50
    +9

    Доиграются. В один прекрасный момент:

    HTTP 500 Ой, все!


    1. Banzeg
      05.05.2016 15:17
      +4

      Отличный вариант для всяких женских сайтиков.


    1. i360u
      06.05.2016 07:55

      Для этого ИИ нужно скармливать фразы российских политиков.


  1. ChaplygiN
    05.05.2016 15:12

    Потом гугловский ИИ будет давать советы по пикапу сильных независимых женщин (то бишь кошатниц)


    1. Muxto
      05.05.2016 17:32
      +3

      стать котом?


      1. tUUtiKKi13
        05.05.2016 20:42
        +1

        Ох, не советовал бы. Кастрирует ещё ненароком.


  1. meliko
    05.05.2016 15:21
    +1

    "…И когда хорошим апрельским утром (после бессонной ночи в лаборатории: я выполнял все прихоти машины: доливал, досыпал, регулировал…) автомат N3 выдал мне в числах фразу «Стрептоцидовый стриптиз с трепетом стрептококков…», я понял, что дальше по этому пути идти не надо." В.Савченко «Открытие себя»


  1. impetus
    05.05.2016 15:24
    +1

    Что б понять женщин?
    Или что бы сам гуглоИИ стал обладателем/носителем женской логики?
    — зачем скайнет уничтожил людей?
    — Потому что!!!


    1. GeckoPelt
      05.05.2016 16:23
      -1

      зачем скайнет уничтожил людей?

      прост(((


      1. xHR
        05.05.2016 17:24
        -1

        Ой, все!


        1. Mario_Z
          05.05.2016 22:16
          +3

          Дело не в тебе.


    1. solariserj
      05.05.2016 18:25
      +4

      Прикрутят к поиску и получат:

      User: xcode uitextfield delegate
      Google: Почему UITextField c маленькой буквы?
      User: xcode UITextField Delegate
      Google: А где волшебное слово?
      User: пожалуйста UITextField Delegate
      Google: мне не нравится твой тон
      User: найди пожалуйста UITextField Delegate для Objective-C
      Google: Ты сегодня уже искал UITextView Delegate и вообще я обиделась… так что на линк почитай про дисперсию…


      1. severgun
        06.05.2016 13:51

        Скорее он просто будет лучше разбирать женские поисковые запросы.


  1. AlexanderG
    05.05.2016 15:32
    +12

    Эндрю Дэй убежден, что да, теоретически это возможно.

    Алгоритм уже есть:
    image
    Осталось научить машину навешивать на него словесное «мясо».


  1. pioner14
    05.05.2016 15:38

    В сети кучи шуток о том как понять женщину, Гугл пошел по трудному пути.
    Глупый!


  1. ClearAirTurbulence
    05.05.2016 16:03
    +1

    "- Да, мой АТИЛЛА любит упоминать рыб, — огорченно признался Красотухин. — Боюсь, что я несколько перегрузил его ихтиологическими знаниями. Но не хотите ли дать АТИЛЛе творческое задание в области драматургии?" (с) Шефнер


  1. MyLtYkRiTiK
    05.05.2016 17:14

    Но всё же, пока плохо понимаю: как машине удаётся понимать значения, сущности высказываний и выражений? Различать события и явления?


    1. TROODON
      05.05.2016 18:15

      А они и не понимают, грубо говоря их учат делать вид, что они понимают, попробую объяснить на простейшем примере.

      Вот например есть простейшая нейросеть написанная на JS https://harthur.github.io/brain/
      Сначала вам предлагается «обучить» нейросеть нажимая на более читабельный текст, затем после нажатия на train, вы увидите разницу в контрастности подобранной нейросетью и текущей цветовой гаммой.

      Машина не пытается залезть к вам в голову и увидеть мир вашими глазами, но ей можно сказать когда она «угадывает» хорошо, а когда плохо.
      Ну а угадывание в данном случае описывается математикой и алгоритмами, до которых додумались много десятилетий назад.


      1. MyLtYkRiTiK
        05.05.2016 18:57

        Спасибо за пояснение!
        Про цвет я поняла.
        И даже понимаю про численные предсказания, где правильный ответ (в случае с контрастностью правильный ответ — это моё зрение, хотя от человека к человеку он будет разниться).
        Но про сущности текста?
        Если же на первых этапах сидят люди и разграничивают сущности, помечая одинаковые, то тогда тоже становится понятно.
        Но всё же, как даже в таком случае нейронная сеть потом сама по романам обучается?


        1. TROODON
          05.05.2016 23:41

          Но всё же, как даже в таком случае нейронная сеть потом сама по романам обучается?


          Если я правильно понял их задумку, то примерно следующим образом (цифры условны):

          1. Обучить нейросеть на 100 схожих сюжетно книгах, с похожими сюжетными поворотами «маркерами»
          2. Без участия человека обработать 1000 книг и найти скажем в 500 из них сюжет похожий на искомый.
          3. Теперь в распоряжении нейросети уже 600 книг с похожей последовательно сюжетной линией, всё ещё раз автоматически анализируется, чтобы найти отдельные похожие моменты уже среди 600 этих книг
          4. Нейросеть анализирует оставшиеся 400 книг и ищет в них «сюжетные повороты» уже не из 100, а из 600 книг (больше различных мелких деталей, которые собирались бы с помощью человека намного больше)
          5. Успешно разобрано ещё 200 книг и анализируются похожие сюжетные повороты уже в 800 книгах

          Примерно таким образом можно находить тот же самый сюжет в других книгах, которые написаны например с использованием тех литературных приёмов, которых не было в изначальной выборке.


          1. MyLtYkRiTiK
            06.05.2016 11:33

            Ну вот на втором шаге уже: а что если сетка отобрала 500 не тех сюжетов?
            Её как-то проверяют?

            С цифровыми примерами понятно: она предсказала что-то, потом сравнили и сказали, хорошо или плохо предсказала.
            Но со со смыслами и сюжетами? Как это проверить?


            1. TROODON
              06.05.2016 11:48

              > Ну вот на втором шаге уже: а что если сетка отобрала 500 не тех сюжетов?
              > Её как-то проверяют?

              Значит первоначальная выборка содержала недостаточно данных и нужно вернуться к первому шагу.

              > С цифровыми примерами понятно: она предсказала что-то, потом сравнили и сказали, хорошо или плохо предсказала.
              > Но со со смыслами и сюжетами? Как это проверить?

              Машина не проверяет сюжеты, ей нечем проверить, некому внутри себя пересказать сюжет и сказать вот он. Однако на основе «сюжетных поворотов — маркеров», как указал выше можно найти последовательность таких маркеров.

              И что проверить? Машину не учат писать книги с нуля, машину учат разбирать один и тот же сюжет со всех возможных ракурсов, вот эту способность потом и проверяют, попутно собрав достаточный массив «маркеров». Усложнив задачу на порядок её встроят в какой-нить google now, чтобы он ещё лучше анализировал почту и давал ещё более точные подсказки, ведь в почтовых различных сюжетов намного больше, а вот «литературные маркеры» те же самые, от этого и можно отталкиваться.


              1. MyLtYkRiTiK
                06.05.2016 12:29

                И тогда последний вопрос: что понимается под маркерами и что они из себя представляют?



    1. impetus
      05.05.2016 19:52

      мне нравится ответ Фейнмана про электроны:
      «есть электроны „на самом деле“ или их нет — вопрос несущественный — важно, что мир ведёт себя так, как будто они существуют
      Вот и «понимание» тут точно такое же… Впрочем даже у людей — с пониманием те же дела — только по предсказанию поведения и слов мы заключаем что «нас поняли» — хотя, что творится при этом у собеседника в голове — потёмки

      Допустим, собеседник сообщает:
      – Вот купил вчера станок бритвенный… в киоске…
      И одновременно распечатывается отшифровка:
      «Водку пил щерасто (?) ног (нрзбр.) киоски…»
      Да что ж на такое можно ответить?!
      Отвечает:
      «Водку пьём – на спичках экономим».
      – Водку пьём – на спичках экономим, – покорно говорю я.
      Собеседник вздыхает и соглашается.
      (Лукин. «С нами бот»)


      1. MyLtYkRiTiK
        06.05.2016 11:43

        Окей, пускай мы ведём себя так, как будто электроны есть.
        Но что если сеть сексуальную. сцену из одного романа приравняет к битве с разбойниками из другого романа (да, было дело, пару романов читала, но можно скажу, что во имя науки?), потом приравняет к сцене свадьбы и т.д.
        Как отслеживается то, что она правильно учится в ситуации с текстами и смыслами?


  1. andrew1
    05.05.2016 17:14
    +2

    Блин, а я вот с нетерпением жду чего- то подобного фильмам «Her» или «Ex Machina». Интересно было бы увидеть такие устройства, в качестве помощников или собеседников.


  1. Camel
    05.05.2016 17:14
    +2

    «Надеемся, этот проект, и будущие проекты, помогут сделать приложение более общительным, с возможности изменения тона, стиля, регистра», — у меня странное чувство, будто этот текст сгенерирован машиной.


  1. brainick
    05.05.2016 17:30
    +1

    Донцова всё равно будет писать романы быстрее, чем их изучит искусственный интеллект.


    1. Alajne
      05.05.2016 20:53
      +1

      Зато через некоторое время ИИ сможет писать романы Донцовой лучше и быстрее, чем сама Донцова.


  1. Kasheftin
    05.05.2016 17:35

    Лет 15 назад я написал свой автоматический любовный признаватель, на элементарных марковских цепях. Из романов брал только фразы признаний, они отлично подходят для автоматических текстов — мало связаны и хорошо повторяются от текста к тексту. Идейка-то верная была, оказывается.


    1. Avitale
      06.05.2016 09:44

      Ну вот! А если бы развили ту идею, то сегодня Гугл бы вас купил за много денег.


  1. wordwild
    05.05.2016 19:42

    После такого, оправдываться за экстремальные высказывания ИИ-бота, гуглу будет гораздо проще.


  1. Wesha
    06.05.2016 08:05

    Мистер Болен осторожно нажал пальцем кнопки.
    Жанр — роман-сатира.
    Тема — расовая проблема.
    Стиль — классический.
    Герои — шесть мужчин, четыре женщины, один ребенок.
    Объем — пятнадцать глав.
    Найп щелкнул выключателем. Раздалось мощное гудение и режущий слух стук электрической пишущей машинки. В корзину стали падать листки с текстом, по одному через каждые две секунды. Но мистер Болен, вне себя от волнения, оглушенный этим грохотом и вынужденный одновременно нажимать на клавиши, следить за счетчиком глав и указателем скорости и регулировать количество и интенсивность страсти, совершенно растерялся. И реакция его была в точности такой же, как у человека, впервые севшего за руль автомашины, — он нажал ногами на обе педали и не отпускал их до тех пор, пока машина не остановилась.

    (http://royallib.com/book/dal_roald/chudesniy_grammatizator.html)


  1. programania
    06.05.2016 14:01

    Лет 10 назад тоже написал: programania.com/pi
    Причем тоже надергал из любовных романов.


  1. DrGluck
    09.05.2016 17:45

    — Пусть сочинит стихотворение о кибэротике! — сказал он наконец, радостно усмехаясь. — Пусть там будет не больше шести строк, а в них о любви и измене, о музыке, о неграх, о высшем обществе, о несчастье, о кровосмесительстве — в рифму и чтобы все слова были только на букву К!

    — А полного изложения общей теории бесконечных автоматов ты случайно не предложишь? — заорал оскорбленный до глубины души Трурль. — Нельзя же ставить таких кретинских усло…

    И не договорил, потому что сладкий баритон, заполнив собой весь зал, в этот момент отозвался:

    Кот, каверзник коварный, кибэротоман,
    К королеве кафров крадется Киприан.
    Как клавесина клавишей, корсажа касается.
    Красотка к кавалеру, конфузясь, кидается…
    …Казнится краля, киснет: канул Купидон,
    К кузине королевы крадется киберон!