Google дает своему ИИ читать женские романы тысячами. Зачем? / forpes.ru

Главная
Google дает своему ИИ читать женские романы тысячами. Зачем?

Google дает своему ИИ читать женские романы тысячами. Зачем? +16

05.05.2016 11:48

marks 37 11900 Источник

Вот такие они, женские романы. Возможно, ИИ Google уже прочитал все это

Любовные романы очень похожи — и сюжетом, и литературными оборотами, и героями. Тем не менее, корпорация Google «скармливает» такие романы тысячами своему ИИ. Делается это с простой целью — научить ИИ составлять предложения, которые схожи с ранее прочитанными. А это, в свою очередь, позволит компании сделать свои программные продукты более индивидуальными и «общительными». Это касается, например, приложения Google.

Ответы, которые получает пользователь приложения, довольно формальные. Вся информация, необходимая пользователю, есть, но вот «души» здесь нет. «Надеемся, этот проект, и будущие проекты, помогут сделать приложение более общительным, с возможности изменения тона, стиля, регистра», — говорит Эндрю Дэй, разработчик ПО корпорации.

Также наработки могут использоваться и в других продуктах корпорации, включая “Smart Reply” сервиса Inbox. Эта функция предлагает три варианта ответа, исходя из контекста сообщения, на которое необходимо ответить пользователю. Чем совершеннее становится ИИ, тем лучше составляются ответы. Сейчас уже 10% ответов с мобильных устройств пользователей — это результат работы “Smart Reply”, говорят представители компании.

Почему не использовать для обучения ИИ философские трактаты, научные работы, известные произведения классиков? Зачем нужны эти женские романы ИИ? Оказывается, суть в следующем. В тысячах таких романов описываются одни и те же ситуации. Но вот описания ведутся с использованием различных слов и выражений. Одно и то же событие, явление, встреча описываются разными словами. ИИ учится определить предложения со схожими значениями и получать знания о нюансах языка.

Сам процесс обучения ИИ на основе литературных произведений далеко не так прост, как могло бы показаться. Изначально у системы нет никаких «знаний», никакой базы — все это требуется расширять, добавлять и совершенствовать. С течением времени ИИ становится лучше. Сложно сказать пока, насколько лучше этот сервис стал после ознакомления с 2865 женскими романами, но то, что прогресс есть, уже очевидно.

Система дают определенное предложение из романа, и машине нужно описать то же самое, только своими словами. ИИ делает это снова и снова, пока результат не становится таким же, или лучшим, чем в «первоисточнике».

Но может ли ИИ написать роман своими силами? Эндрю Дэй убежден, что да, теоретически это возможно. Правда, результаты этой работы компания пока отказывается показывать. Но все впереди.

Комментарии (37)

Halt
05.05.2016 14:50
#9235328
+9
Доиграются. В один прекрасный момент:

HTTP 500 Ой, все!
1. Banzeg
  05.05.2016 15:17
  #9235462
  +4
  Отличный вариант для всяких женских сайтиков.
1. i360u
  06.05.2016 07:55
  #9238018
  Для этого ИИ нужно скармливать фразы российских политиков.

ChaplygiN
05.05.2016 15:12
#9235410
Потом гугловский ИИ будет давать советы по пикапу сильных независимых женщин (то бишь кошатниц)
1. Muxto
  05.05.2016 17:32
  #9236178
  +3
  стать котом?
  1. tUUtiKKi13
    05.05.2016 20:42
    #9236864
    +1
    Ох, не советовал бы. Кастрирует ещё ненароком.

meliko
05.05.2016 15:21
#9235480
+1
"…И когда хорошим апрельским утром (после бессонной ночи в лаборатории: я выполнял все прихоти машины: доливал, досыпал, регулировал…) автомат N3 выдал мне в числах фразу «Стрептоцидовый стриптиз с трепетом стрептококков…», я понял, что дальше по этому пути идти не надо." В.Савченко «Открытие себя»

impetus
05.05.2016 15:24
#9235490
+1
Что б понять женщин?
Или что бы сам гуглоИИ стал обладателем/носителем женской логики?
— зачем скайнет уничтожил людей?
— Потому что!!!
1. GeckoPelt
  05.05.2016 16:23
  #9235830
  -1
  зачем скайнет уничтожил людей?
  
  прост(((
  1. xHR
    05.05.2016 17:24
    #9236140
    -1
    Ой, все!
    
    Mario_Z
    05.05.2016 22:16
    #9237194
    +3
    Дело не в тебе.
1. solariserj
  05.05.2016 18:25
  #9236396
  +4
  Прикрутят к поиску и получат:
  
  User: xcode uitextfield delegate
  Google: Почему UITextField c маленькой буквы?
  User: xcode UITextField Delegate
  Google: А где волшебное слово?
  User: пожалуйста UITextField Delegate
  Google: мне не нравится твой тон
  User: найди пожалуйста UITextField Delegate для Objective-C
  Google: Ты сегодня уже искал UITextView Delegate и вообще я обиделась… так что на линк почитай про дисперсию…
  1. severgun
    06.05.2016 13:51
    #9239290
    Скорее он просто будет лучше разбирать женские поисковые запросы.

AlexanderG
05.05.2016 15:32
#9235542
+12
Эндрю Дэй убежден, что да, теоретически это возможно.

Алгоритм уже есть:

Осталось научить машину навешивать на него словесное «мясо».

pioner14
05.05.2016 15:38
#9235576
В сети кучи шуток о том как понять женщину, Гугл пошел по трудному пути.
Глупый!

ClearAirTurbulence
05.05.2016 16:03
#9235724
+1
"- Да, мой АТИЛЛА любит упоминать рыб, — огорченно признался Красотухин. — Боюсь, что я несколько перегрузил его ихтиологическими знаниями. Но не хотите ли дать АТИЛЛе творческое задание в области драматургии?" (с) Шефнер

MyLtYkRiTiK
05.05.2016 17:14
#9236070
Но всё же, пока плохо понимаю: как машине удаётся понимать значения, сущности высказываний и выражений? Различать события и явления?
1. TROODON
  05.05.2016 18:15
  #9236338
  А они и не понимают, грубо говоря их учат делать вид, что они понимают, попробую объяснить на простейшем примере.
  
  Вот например есть простейшая нейросеть написанная на JS https://harthur.github.io/brain/
  Сначала вам предлагается «обучить» нейросеть нажимая на более читабельный текст, затем после нажатия на train, вы увидите разницу в контрастности подобранной нейросетью и текущей цветовой гаммой.
  
  Машина не пытается залезть к вам в голову и увидеть мир вашими глазами, но ей можно сказать когда она «угадывает» хорошо, а когда плохо.
  Ну а угадывание в данном случае описывается математикой и алгоритмами, до которых додумались много десятилетий назад.
  1. MyLtYkRiTiK
    05.05.2016 18:57
    #9236508
    Спасибо за пояснение!
    Про цвет я поняла.
    И даже понимаю про численные предсказания, где правильный ответ (в случае с контрастностью правильный ответ — это моё зрение, хотя от человека к человеку он будет разниться).
    Но про сущности текста?
    Если же на первых этапах сидят люди и разграничивают сущности, помечая одинаковые, то тогда тоже становится понятно.
    Но всё же, как даже в таком случае нейронная сеть потом сама по романам обучается?
    
    TROODON
    05.05.2016 23:41
    #9237524
    Но всё же, как даже в таком случае нейронная сеть потом сама по романам обучается?
    
    Если я правильно понял их задумку, то примерно следующим образом (цифры условны):
    
    1. Обучить нейросеть на 100 схожих сюжетно книгах, с похожими сюжетными поворотами «маркерами»
    2. Без участия человека обработать 1000 книг и найти скажем в 500 из них сюжет похожий на искомый.
    3. Теперь в распоряжении нейросети уже 600 книг с похожей последовательно сюжетной линией, всё ещё раз автоматически анализируется, чтобы найти отдельные похожие моменты уже среди 600 этих книг
    4. Нейросеть анализирует оставшиеся 400 книг и ищет в них «сюжетные повороты» уже не из 100, а из 600 книг (больше различных мелких деталей, которые собирались бы с помощью человека намного больше)
    5. Успешно разобрано ещё 200 книг и анализируются похожие сюжетные повороты уже в 800 книгах
    
    Примерно таким образом можно находить тот же самый сюжет в других книгах, которые написаны например с использованием тех литературных приёмов, которых не было в изначальной выборке.
    
    MyLtYkRiTiK
    06.05.2016 11:33
    #9238686
    Ну вот на втором шаге уже: а что если сетка отобрала 500 не тех сюжетов?
    Её как-то проверяют?
    
    С цифровыми примерами понятно: она предсказала что-то, потом сравнили и сказали, хорошо или плохо предсказала.
    Но со со смыслами и сюжетами? Как это проверить?
    
    TROODON
    06.05.2016 11:48
    #9238742
    > Ну вот на втором шаге уже: а что если сетка отобрала 500 не тех сюжетов?
    > Её как-то проверяют?
    
    Значит первоначальная выборка содержала недостаточно данных и нужно вернуться к первому шагу.
    
    > С цифровыми примерами понятно: она предсказала что-то, потом сравнили и сказали, хорошо или плохо предсказала.
    > Но со со смыслами и сюжетами? Как это проверить?
    
    Машина не проверяет сюжеты, ей нечем проверить, некому внутри себя пересказать сюжет и сказать вот он. Однако на основе «сюжетных поворотов — маркеров», как указал выше можно найти последовательность таких маркеров.
    
    И что проверить? Машину не учат писать книги с нуля, машину учат разбирать один и тот же сюжет со всех возможных ракурсов, вот эту способность потом и проверяют, попутно собрав достаточный массив «маркеров». Усложнив задачу на порядок её встроят в какой-нить google now, чтобы он ещё лучше анализировал почту и давал ещё более точные подсказки, ведь в почтовых различных сюжетов намного больше, а вот «литературные маркеры» те же самые, от этого и можно отталкиваться.
    
    MyLtYkRiTiK
    06.05.2016 12:29
    #9238938
    И тогда последний вопрос: что понимается под маркерами и что они из себя представляют?
    
    TROODON
    06.05.2016 13:51
    #9239294
    https://en.wikipedia.org/wiki/Bag-of-words_model
    
    MyLtYkRiTiK
    07.05.2016 09:21
    #9241912
    Благодарю))
1. impetus
  05.05.2016 19:52
  #9236694
  мне нравится ответ Фейнмана про электроны:
  «есть электроны „на самом деле“ или их нет — вопрос несущественный — важно, что мир ведёт себя так, как будто они существуют.»
  Вот и «понимание» тут точно такое же… Впрочем даже у людей — с пониманием те же дела — только по предсказанию поведения и слов мы заключаем что «нас поняли» — хотя, что творится при этом у собеседника в голове — потёмки
  
  Допустим, собеседник сообщает:
  – Вот купил вчера станок бритвенный… в киоске…
  И одновременно распечатывается отшифровка:
  «Водку пил щерасто (?) ног (нрзбр.) киоски…»
  Да что ж на такое можно ответить?!
  Отвечает:
  «Водку пьём – на спичках экономим».
  – Водку пьём – на спичках экономим, – покорно говорю я.
  Собеседник вздыхает и соглашается.
  (Лукин. «С нами бот»)
  1. MyLtYkRiTiK
    06.05.2016 11:43
    #9238724
    Окей, пускай мы ведём себя так, как будто электроны есть.
    Но что если сеть сексуальную. сцену из одного романа приравняет к битве с разбойниками из другого романа (да, было дело, пару романов читала, но можно скажу, что во имя науки?), потом приравняет к сцене свадьбы и т.д.
    Как отслеживается то, что она правильно учится в ситуации с текстами и смыслами?

andrew1
05.05.2016 17:14
#9236072
+2
Блин, а я вот с нетерпением жду чего- то подобного фильмам «Her» или «Ex Machina». Интересно было бы увидеть такие устройства, в качестве помощников или собеседников.

Camel
05.05.2016 17:14
#9236092
+2
«Надеемся, этот проект, и будущие проекты, помогут сделать приложение более общительным, с возможности изменения тона, стиля, регистра», — у меня странное чувство, будто этот текст сгенерирован машиной.

brainick
05.05.2016 17:30
#9236168
+1
Донцова всё равно будет писать романы быстрее, чем их изучит искусственный интеллект.
1. Alajne
  05.05.2016 20:53
  #9236900
  +1
  Зато через некоторое время ИИ сможет писать романы Донцовой лучше и быстрее, чем сама Донцова.

Kasheftin
05.05.2016 17:35
#9236186
Лет 15 назад я написал свой автоматический любовный признаватель, на элементарных марковских цепях. Из романов брал только фразы признаний, они отлично подходят для автоматических текстов — мало связаны и хорошо повторяются от текста к тексту. Идейка-то верная была, оказывается.
1. Avitale
  06.05.2016 09:44
  #9238238
  Ну вот! А если бы развили ту идею, то сегодня Гугл бы вас купил за много денег.

wordwild
05.05.2016 19:42
#9236666
После такого, оправдываться за экстремальные высказывания ИИ-бота, гуглу будет гораздо проще.

Wesha
06.05.2016 08:05
#9238030
Мистер Болен осторожно нажал пальцем кнопки.
Жанр — роман-сатира.
Тема — расовая проблема.
Стиль — классический.
Герои — шесть мужчин, четыре женщины, один ребенок.
Объем — пятнадцать глав.
Найп щелкнул выключателем. Раздалось мощное гудение и режущий слух стук электрической пишущей машинки. В корзину стали падать листки с текстом, по одному через каждые две секунды. Но мистер Болен, вне себя от волнения, оглушенный этим грохотом и вынужденный одновременно нажимать на клавиши, следить за счетчиком глав и указателем скорости и регулировать количество и интенсивность страсти, совершенно растерялся. И реакция его была в точности такой же, как у человека, впервые севшего за руль автомашины, — он нажал ногами на обе педали и не отпускал их до тех пор, пока машина не остановилась.

(http://royallib.com/book/dal_roald/chudesniy_grammatizator.html)

programania
06.05.2016 14:01
#9239474
Лет 10 назад тоже написал: programania.com/pi
Причем тоже надергал из любовных романов.

DrGluck
09.05.2016 17:45
#9245744
— Пусть сочинит стихотворение о кибэротике! — сказал он наконец, радостно усмехаясь. — Пусть там будет не больше шести строк, а в них о любви и измене, о музыке, о неграх, о высшем обществе, о несчастье, о кровосмесительстве — в рифму и чтобы все слова были только на букву К!

— А полного изложения общей теории бесконечных автоматов ты случайно не предложишь? — заорал оскорбленный до глубины души Трурль. — Нельзя же ставить таких кретинских усло…

И не договорил, потому что сладкий баритон, заполнив собой весь зал, в этот момент отозвался:

Кот, каверзник коварный, кибэротоман,
К королеве кафров крадется Киприан.
Как клавесина клавишей, корсажа касается.
Красотка к кавалеру, конфузясь, кидается…
…Казнится краля, киснет: канул Купидон,
К кузине королевы крадется киберон!