Вот такие они, женские романы. Возможно, ИИ Google уже прочитал все это
Любовные романы очень похожи — и сюжетом, и литературными оборотами, и героями. Тем не менее, корпорация Google «скармливает» такие романы тысячами своему ИИ. Делается это с простой целью — научить ИИ составлять предложения, которые схожи с ранее прочитанными. А это, в свою очередь, позволит компании сделать свои программные продукты более индивидуальными и «общительными». Это касается, например, приложения Google.
Ответы, которые получает пользователь приложения, довольно формальные. Вся информация, необходимая пользователю, есть, но вот «души» здесь нет. «Надеемся, этот проект, и будущие проекты, помогут сделать приложение более общительным, с возможности изменения тона, стиля, регистра», — говорит Эндрю Дэй, разработчик ПО корпорации.
Также наработки могут использоваться и в других продуктах корпорации, включая “Smart Reply” сервиса Inbox. Эта функция предлагает три варианта ответа, исходя из контекста сообщения, на которое необходимо ответить пользователю. Чем совершеннее становится ИИ, тем лучше составляются ответы. Сейчас уже 10% ответов с мобильных устройств пользователей — это результат работы “Smart Reply”, говорят представители компании.
Почему не использовать для обучения ИИ философские трактаты, научные работы, известные произведения классиков? Зачем нужны эти женские романы ИИ? Оказывается, суть в следующем. В тысячах таких романов описываются одни и те же ситуации. Но вот описания ведутся с использованием различных слов и выражений. Одно и то же событие, явление, встреча описываются разными словами. ИИ учится определить предложения со схожими значениями и получать знания о нюансах языка.
Сам процесс обучения ИИ на основе литературных произведений далеко не так прост, как могло бы показаться. Изначально у системы нет никаких «знаний», никакой базы — все это требуется расширять, добавлять и совершенствовать. С течением времени ИИ становится лучше. Сложно сказать пока, насколько лучше этот сервис стал после ознакомления с 2865 женскими романами, но то, что прогресс есть, уже очевидно.
Система дают определенное предложение из романа, и машине нужно описать то же самое, только своими словами. ИИ делает это снова и снова, пока результат не становится таким же, или лучшим, чем в «первоисточнике».
Но может ли ИИ написать роман своими силами? Эндрю Дэй убежден, что да, теоретически это возможно. Правда, результаты этой работы компания пока отказывается показывать. Но все впереди.
Комментарии (37)
meliko
05.05.2016 15:21+1"…И когда хорошим апрельским утром (после бессонной ночи в лаборатории: я выполнял все прихоти машины: доливал, досыпал, регулировал…) автомат N3 выдал мне в числах фразу «Стрептоцидовый стриптиз с трепетом стрептококков…», я понял, что дальше по этому пути идти не надо." В.Савченко «Открытие себя»
impetus
05.05.2016 15:24+1Что б понять женщин?
Или что бы сам гуглоИИ стал обладателем/носителем женской логики?
— зачем скайнет уничтожил людей?
— Потому что!!!solariserj
05.05.2016 18:25+4Прикрутят к поиску и получат:
User: xcode uitextfield delegate
Google: Почему UITextField c маленькой буквы?
User: xcode UITextField Delegate
Google: А где волшебное слово?
User: пожалуйста UITextField Delegate
Google: мне не нравится твой тон
User: найди пожалуйста UITextField Delegate для Objective-C
Google: Ты сегодня уже искал UITextView Delegate и вообще я обиделась… так что на линк почитай про дисперсию…
AlexanderG
05.05.2016 15:32+12Эндрю Дэй убежден, что да, теоретически это возможно.
Алгоритм уже есть:
Осталось научить машину навешивать на него словесное «мясо».
pioner14
05.05.2016 15:38В сети кучи шуток о том как понять женщину, Гугл пошел по трудному пути.
Глупый!
ClearAirTurbulence
05.05.2016 16:03+1"- Да, мой АТИЛЛА любит упоминать рыб, — огорченно признался Красотухин. — Боюсь, что я несколько перегрузил его ихтиологическими знаниями. Но не хотите ли дать АТИЛЛе творческое задание в области драматургии?" (с) Шефнер
MyLtYkRiTiK
05.05.2016 17:14Но всё же, пока плохо понимаю: как машине удаётся понимать значения, сущности высказываний и выражений? Различать события и явления?
TROODON
05.05.2016 18:15А они и не понимают, грубо говоря их учат делать вид, что они понимают, попробую объяснить на простейшем примере.
Вот например есть простейшая нейросеть написанная на JS https://harthur.github.io/brain/
Сначала вам предлагается «обучить» нейросеть нажимая на более читабельный текст, затем после нажатия на train, вы увидите разницу в контрастности подобранной нейросетью и текущей цветовой гаммой.
Машина не пытается залезть к вам в голову и увидеть мир вашими глазами, но ей можно сказать когда она «угадывает» хорошо, а когда плохо.
Ну а угадывание в данном случае описывается математикой и алгоритмами, до которых додумались много десятилетий назад.
MyLtYkRiTiK
05.05.2016 18:57Спасибо за пояснение!
Про цвет я поняла.
И даже понимаю про численные предсказания, где правильный ответ (в случае с контрастностью правильный ответ — это моё зрение, хотя от человека к человеку он будет разниться).
Но про сущности текста?
Если же на первых этапах сидят люди и разграничивают сущности, помечая одинаковые, то тогда тоже становится понятно.
Но всё же, как даже в таком случае нейронная сеть потом сама по романам обучается?TROODON
05.05.2016 23:41Но всё же, как даже в таком случае нейронная сеть потом сама по романам обучается?
Если я правильно понял их задумку, то примерно следующим образом (цифры условны):
1. Обучить нейросеть на 100 схожих сюжетно книгах, с похожими сюжетными поворотами «маркерами»
2. Без участия человека обработать 1000 книг и найти скажем в 500 из них сюжет похожий на искомый.
3. Теперь в распоряжении нейросети уже 600 книг с похожей последовательно сюжетной линией, всё ещё раз автоматически анализируется, чтобы найти отдельные похожие моменты уже среди 600 этих книг
4. Нейросеть анализирует оставшиеся 400 книг и ищет в них «сюжетные повороты» уже не из 100, а из 600 книг (больше различных мелких деталей, которые собирались бы с помощью человека намного больше)
5. Успешно разобрано ещё 200 книг и анализируются похожие сюжетные повороты уже в 800 книгах
Примерно таким образом можно находить тот же самый сюжет в других книгах, которые написаны например с использованием тех литературных приёмов, которых не было в изначальной выборке.MyLtYkRiTiK
06.05.2016 11:33Ну вот на втором шаге уже: а что если сетка отобрала 500 не тех сюжетов?
Её как-то проверяют?
С цифровыми примерами понятно: она предсказала что-то, потом сравнили и сказали, хорошо или плохо предсказала.
Но со со смыслами и сюжетами? Как это проверить?TROODON
06.05.2016 11:48> Ну вот на втором шаге уже: а что если сетка отобрала 500 не тех сюжетов?
> Её как-то проверяют?
Значит первоначальная выборка содержала недостаточно данных и нужно вернуться к первому шагу.
> С цифровыми примерами понятно: она предсказала что-то, потом сравнили и сказали, хорошо или плохо предсказала.
> Но со со смыслами и сюжетами? Как это проверить?
Машина не проверяет сюжеты, ей нечем проверить, некому внутри себя пересказать сюжет и сказать вот он. Однако на основе «сюжетных поворотов — маркеров», как указал выше можно найти последовательность таких маркеров.
И что проверить? Машину не учат писать книги с нуля, машину учат разбирать один и тот же сюжет со всех возможных ракурсов, вот эту способность потом и проверяют, попутно собрав достаточный массив «маркеров». Усложнив задачу на порядок её встроят в какой-нить google now, чтобы он ещё лучше анализировал почту и давал ещё более точные подсказки, ведь в почтовых различных сюжетов намного больше, а вот «литературные маркеры» те же самые, от этого и можно отталкиваться.MyLtYkRiTiK
06.05.2016 12:29И тогда последний вопрос: что понимается под маркерами и что они из себя представляют?
impetus
05.05.2016 19:52мне нравится ответ Фейнмана про электроны:
«есть электроны „на самом деле“ или их нет — вопрос несущественный — важно, что мир ведёт себя так, как будто они существуют.»
Вот и «понимание» тут точно такое же… Впрочем даже у людей — с пониманием те же дела — только по предсказанию поведения и слов мы заключаем что «нас поняли» — хотя, что творится при этом у собеседника в голове — потёмки
Допустим, собеседник сообщает:
(Лукин. «С нами бот»)
– Вот купил вчера станок бритвенный… в киоске…
И одновременно распечатывается отшифровка:
«Водку пил щерасто (?) ног (нрзбр.) киоски…»
Да что ж на такое можно ответить?!
Отвечает:
«Водку пьём – на спичках экономим».
– Водку пьём – на спичках экономим, – покорно говорю я.
Собеседник вздыхает и соглашается.MyLtYkRiTiK
06.05.2016 11:43Окей, пускай мы ведём себя так, как будто электроны есть.
Но что если сеть сексуальную. сцену из одного романа приравняет к битве с разбойниками из другого романа (да, было дело, пару романов читала, но можно скажу, что во имя науки?), потом приравняет к сцене свадьбы и т.д.
Как отслеживается то, что она правильно учится в ситуации с текстами и смыслами?
andrew1
05.05.2016 17:14+2Блин, а я вот с нетерпением жду чего- то подобного фильмам «Her» или «Ex Machina». Интересно было бы увидеть такие устройства, в качестве помощников или собеседников.
Camel
05.05.2016 17:14+2«Надеемся, этот проект, и будущие проекты, помогут сделать приложение более общительным, с возможности изменения тона, стиля, регистра», — у меня странное чувство, будто этот текст сгенерирован машиной.
Kasheftin
05.05.2016 17:35Лет 15 назад я написал свой автоматический любовный признаватель, на элементарных марковских цепях. Из романов брал только фразы признаний, они отлично подходят для автоматических текстов — мало связаны и хорошо повторяются от текста к тексту. Идейка-то верная была, оказывается.
Avitale
06.05.2016 09:44Ну вот! А если бы развили ту идею, то сегодня Гугл бы вас купил за много денег.
wordwild
05.05.2016 19:42После такого, оправдываться за экстремальные высказывания ИИ-бота, гуглу будет гораздо проще.
Wesha
06.05.2016 08:05Мистер Болен осторожно нажал пальцем кнопки.
Жанр — роман-сатира.
Тема — расовая проблема.
Стиль — классический.
Герои — шесть мужчин, четыре женщины, один ребенок.
Объем — пятнадцать глав.
Найп щелкнул выключателем. Раздалось мощное гудение и режущий слух стук электрической пишущей машинки. В корзину стали падать листки с текстом, по одному через каждые две секунды. Но мистер Болен, вне себя от волнения, оглушенный этим грохотом и вынужденный одновременно нажимать на клавиши, следить за счетчиком глав и указателем скорости и регулировать количество и интенсивность страсти, совершенно растерялся. И реакция его была в точности такой же, как у человека, впервые севшего за руль автомашины, — он нажал ногами на обе педали и не отпускал их до тех пор, пока машина не остановилась.
(http://royallib.com/book/dal_roald/chudesniy_grammatizator.html)
programania
06.05.2016 14:01Лет 10 назад тоже написал: programania.com/pi
Причем тоже надергал из любовных романов.
DrGluck
09.05.2016 17:45— Пусть сочинит стихотворение о кибэротике! — сказал он наконец, радостно усмехаясь. — Пусть там будет не больше шести строк, а в них о любви и измене, о музыке, о неграх, о высшем обществе, о несчастье, о кровосмесительстве — в рифму и чтобы все слова были только на букву К!
— А полного изложения общей теории бесконечных автоматов ты случайно не предложишь? — заорал оскорбленный до глубины души Трурль. — Нельзя же ставить таких кретинских усло…
И не договорил, потому что сладкий баритон, заполнив собой весь зал, в этот момент отозвался:
Кот, каверзник коварный, кибэротоман,
К королеве кафров крадется Киприан.
Как клавесина клавишей, корсажа касается.
Красотка к кавалеру, конфузясь, кидается…
…Казнится краля, киснет: канул Купидон,
К кузине королевы крадется киберон!
Halt
Доиграются. В один прекрасный момент:
HTTP 500 Ой, все!
Banzeg
Отличный вариант для всяких женских сайтиков.
i360u
Для этого ИИ нужно скармливать фразы российских политиков.