«Нарисуй кошку за 30 секунд!.. О, я знаю, это кошка… А может быть, нет» — примерно в таком формате выдаёт результат распознавания рисунков нейросеть Quick, Draw!

Quick, Draw! — одна из новых игр, которую выпустили разработчики Google в рамках проекта A.I. Experiments. Здесь публикуются прикольные игрушки, которые позволяют даже ребёнку поиграть с искусственным интеллектом. Но есть игры и для взрослых.

Кроме удовольствия от игры и развлечения, эксперименты A.I. Experiments дают ещё и некоторое понимание того, на что способны нейросети и как их можно использовать на практике. Не только для развлечений.

Giorgio Cam


aiexperiments.withgoogle.com/giorgio-cam


Первая игра на сайте A.I. Experiments. Вероятно, самая интересная, по мнению разработчиков. Поместите объект перед объективом камеры на смартфоне или ПК, а нейросеть мгновенно составит стишок по итогу результата распознавания — и положит его под музыку! Иногда результат очень смешной. Особенно если навести камеру на необычные объекты.



В данном проекте используются программы MaryTTS, Tone.js, и Google Cloud Vision API. Исходный код Giorgio Cam опубликован, как и всех других игр на проекте.

Quick, Draw!


quickdraw.withgoogle.com


В игре Quick, Draw! искусственный интеллект даёт задание. Человек пытается быстро нарисовать, например, пальцем на планшете, а ИИ определяет, что изображено на рисунке. Получается весело, особенно если вы не очень умеете рисовать.

Что важно, нейросеть обучают следить за направлением движения пальца/курсора. За счёт этого она гораздо лучше распознаёт образцы.

Infinite Drum Machine


aiexperiments.withgoogle.com/drum-machine


Infinite Drum Machine показывает карту, на которой разные звуки инструментов размещены в соответствии со степенью их схожести. Если проводить мышкой по этому облаку, то звуки воспроизводятся по очереди. Если какой-то звук понравился, то размещаем его на драм-машине с четырьмя дорожками. Ну а затем запускаем на воспроизведение. Такое приложение стало бы хитом в Google Play. Впрочем, как и остальные игры на сайте A.I. Experiments.

Как сказано в описании, при разработке использовалась техника t-SNE, то есть нелинейного снижения размерности и визуализации многомерных переменных (t-distributed stochastic neighbor embedding). Алгоритм вычисляет цифровой отпечаток каждого звука и размещает его в многомерном пространстве, в соотношении с другими отпечатками. Для взаимодействия с человеком многомерное пространство пришлось сплющить до двухмерного.

Bird Sounds


aiexperiments.withgoogle.com/bird-sounds


Как и в предыдущей игре, здесь система с помощью техники t-SNE организовала по степени схожести тысячи звуков. Только звуки не инструментов, а птичьих голосов. Орнитологи десятилетиями собирали эту коллекцию.

Thing Translator


aiexperiments.withgoogle.com/thing-translator


«Переводчик вещей» переводит с одного языка на другой не слова, а предметы. Он буквально произносит вслух, как звучит любой предмет на выбранном вами языке.

Это всего лишь один пример того, что можно сделать, используя программные интерфейсы машинного обучения Google (Cloud Vision API + Translate API) — даже ничего не зная о машинном обучении.

A.I. Duet


aiexperiments.withgoogle.com/ai-duet


Ещё одна интересная музыкальная игра от Google. Вы начинаете играть мелодию — а компьютер продолжает её за вас, используя наиболее красивое и логичное продолжение.

Как несложно догадаться, при обучении нейросети воспроизводились тысячи существующих мелодий. ИИ постепенно начал понимать ноты и распознавать гармонию в мелодическом рисунке. Понимать, в каких местах мелодия должна менять направление, в каком ритме продолжать мелодию и т.д. Он постепенно сам составил карту наиболее популярных, то есть гармоничных последовательностей и переходов.

Для максимального кайфа к компьютеру, конечно, желательно подключить MIDI-клавиатуру. Тогда с ИИ можно организовать полноценный композиторский дуэт, играя мелодию по очереди. Он продолжает начатое вами, а вы подыгрываете его варианту.

Visualizing High-Dimensional Space


aiexperiments.withgoogle.com/visualizing-high-dimensional-space


Этот эксперимент помогает понять, что творится в «мозгах» искусственного интеллекта. Программа визуализирует это на экране. Именно здесь можно своими глазами увидеть многомерное пространство, которое упоминалось ранее, и понять, как работает волшебная техника t-SNE. Каким образом организуются данные в пространствах, где количество измерений больше трёх.

Одна из авторов объясняет в демонстрационном видеоролике, что даже людей можно представить в виде многомерных объектов в многомерном пространстве. Это легко. В одном измерении у нас параметр «дата рождения» — и в этом измерении мы связаны с другими такими же многомерными объектами (людьми). В следующем измерении у нас параметр «место работы» — в этом измерении совершенно другие взаимосвязи. И так далее. Абсолютно все люди на планете входят в эту многомерную сеть. Такое же многомерное пространство строится для значений слов, для изображений, для мелодий и для любых других данных. Всё это потом используется в реальных приложениях, когда нейросеть обучается распознавать образы, понимать значения отдельных слов в пространстве смыслов.

Разработанная Google техника визуализации будет полезна всем разработчикам, которые работают с многомерными пространствами, t-SNE и нейросетями.

What Neural Networks See


aiexperiments.withgoogle.com/what-neural-nets-see


Ещё один эксперимент, который показывает внутренности «компьютерного мозга». В данном случае речь идёт не об измерениях многомерного пространства, а о слоях нейросети, каждый из которых реагирует на определённые сигналы. При последовательной обработке многими слоями нейросети, где каждый следующий слой обрабатывает результат предыдущего, ИИ начинает распознавать фичи всё более высокого уровня.



И помните, чем больше вы играете с искусственным интеллектом Google — тем быстрее он обучается, используя ваши рисунки и наблюдая за поведением. К сожалению, люди могут не только обучить, но и испортить ИИ. Например, из-за неграмотности многие люди рисуют ураган в виде торнадо. И постепенно нейросеть откажется признавать ураганом рисунок тропического циклона, а будет считать ураганом только рисунок торнадо. В общем, всё как в жизни.
Поделиться с друзьями
-->

Комментарии (16)


  1. gsaw
    16.11.2016 21:54

    «Такое приложение стало бы хитом в Google Play. Впрочем, как и остальные игры на сайте A.I. Experiments.

    Как сказано в описании, при разработке использовалась техника t-SNE, то есть нелинейного снижения размерности и визуализации многомерных переменных (t-distributed stochastic neighbor embedding). Алгоритм вычисляет цифровой отпечаток каждого звука и размещает его в многомерном пространстве, в соотношении с другими отпечатками.»

    Вот все время думаю, почему этого не сделают? Сделали бы для эксперемента побор музыки под заданную мелодию в гугл-плейе. Сейчас судя по всему редакторы-люди подбирают музыку для радио и собирают плейлисты и порой вообще на мой взгляд не в тему.

    А так вот настроение есть послушать, что то вроде Роба Зомби, а оно порой чушь всякую подкидывает по ключевому слову «Рок». Я бы лучше задал бы семпл, и оно мне драйва насобирало бы в плейлист.

    Интересно, как раньше radio.fm подбирали музыку? Там мне подборки больше всего нравились.


    1. dfgwer
      16.11.2016 23:44

      Подозреваю, что подбор музыки запатентовали вусмерть


      1. samodum
        17.11.2016 13:28

        Всё верно.
        Вот был же 12 лет назад MusicMagic Mixer от Predixis (кто-нибудь ещё помнит такую прогу?). Потом его купила Pandora, если мне не изменяет память, а потом успешно закрыли.
        http://static.echonest.com/DukeListens/predixis_musicmagic_mixer.html
        И даже плагин для винампа был выпущен
        http://ru.winamp.com/plugin/musicmagic-mixer-free/1597


    1. ColorPrint
      17.11.2016 16:27

      ЯндексРадио еще есть… Но что-то мне кажется что там тоже тупо по тегам подбор


    1. ctacb
      17.11.2016 23:35

      У меня на PSP был плеер, который сортировал музыку по характеру. Но там, наверно, просто анализ спектрограмм, или как-то так.


  1. justiq
    17.11.2016 00:58

    Что делается чтобы отсеять тролле- или неграмотные записи? Модерация вроде как убивает весь смысл нейросети.


  1. Dendroid
    17.11.2016 04:45
    -2

    И помните, чем больше вы играете с искусственным интеллектом Google — тем быстрее он обучается, используя ваши рисунки и наблюдая за поведением.

    Сразу как-то расхотелось играть…


  1. Siroejka
    17.11.2016 10:21
    -2

    Сморожу глупость. Интересно, что ИИ харнит все формы написания цифры, и потом распознаёт их, а в мозгу человека хранится образ, вариант которого распознаётся, когда он поступает в качестве входных данных. Может это только кажется, что это готовый образ, а на самом деле это результат бесконечной выборки через мультиверс.


    1. koolshen
      17.11.2016 13:34

      Пожалуй, соглашусь с вашим первым предложением.


    1. RobosergTV
      17.11.2016 14:32

      нет, нейронная сеть может распознать то, что не видал раньше. Все дело в «фичах». В общем мат часть нужно курить.


  1. QDeathNick
    17.11.2016 12:25

    У Quick, Draw! потрясающее произношение. :)
    Ай но итс рифле.


    1. FiLunder7
      17.11.2016 13:34

      В разных браузерах и на разных устройствах у него разный голос. Видимо он системный войс-ту-спич использует.


  1. Volgarik
    17.11.2016 17:12

    Infinite Drum Machine — попробуйте поводить по карте звуков с тегом Human. Непередаваемые ощущения))


  1. Arxitektor
    17.11.2016 19:35

    Рисовалка классная ))


    1. Semenchik
      18.11.2016 15:04

      image


  1. Alcpp
    17.11.2016 23:34

    «A.I. Duet» позволяет только скачать код.

    А рисовалка прекрасна.