Компания Google запустила инициативу AIY Projects, чтобы совместить AI с DYI, то есть совместить программные приложения ИИ с наборами для сборки гаджетов. В результате, считает Google, мейкеры смогут изготовлять полезные устройства, которые помогут «решать реальные проблемы» в жизни. Эти гаджеты будут по-настоящему взаимодействовать с человеком. Например, распознавать речь, отвечать на вопросы и выполнять голосовые команды.

Первым проектом стал Voice Kit — демонстрационная система распознавания речи с подключением к Google Assistant (или без подключения). Как сказано в описании, в дополнении ко всем обычным функциям Google Assistant, тут вы сможете ещё добавлять в гаджет собственные пары вопросов и ответов. Приборчик выполнен в виде маленького картонного кубика с Rasberry Pi 3 внутри. Сборка набора из 12 деталей займёт примерно 1,5 часа.

Набор деталей можно получить бесплатно при подписке на журнал MagPi. Кстати, этот журнал доступен в цифровом виде — там описано множество удивительных проектов, в том числе в сфере машинного обучения, сделанных при помощи Rasberry Pi.

Набор продаётся и без журнала в магазинах Barnes & Noble и в британских магазинах WH Smith, Tesco, Sainsburys и Asda. Судя по всему, это пока единственные места, где продаётся набор. В набор входят интерфейсные платы, кабели, пластиковые держатели, динамик и кнопка. Не входят сама плата Raspberry Pi 3, карта SD, а также необходимые для сборки отвёртка и скотч. Главные компоненты — плата Voice HAT для распознавания речи и плата Voice HAT Microphone. Это новые платы, которые пока недоступна в свободной продаже по отдельности.



Google предлагает подробную инструкцию, как собирать гаджет. Начиная со скрепления Raspberry Pi 3 и платы Voice HAT,



сворачивания коробки…



… и скрепления всего этого в единый гаджет.





Далее предлагается скачать образ Voice Kit SD для записи на флеш-карту.

Периферийные устройства подключаются в разъёмы, выставленные в прорези картонной коробки: клавиатура (1), мышь (2) и монитор (3).



После загрузки с флеш-карты девайс готов к подключению к Google Cloud Platform по настроенному соединению WiFi. Там нужна настройка нового проекта через Google Assistant API, и затем устройство начнёт полностью нормально функционировать, принимая голосовые запросы и распознавая их в облаке.

Устройство сразу понимает основные англоязычные команды:

  • Сколько времени?
  • Расскажи шутку
  • Сделать музыку громче
  • Сделать музыку тише
  • Максимальная громкость
  • Привет (ответ: «И тебе привет»)

Как уже было сказано, можно добавлять собственные пары вопросов и ответов, то есть программировать ИИ на необходимые действия. Это делается в файле ~/voice-recognizer-raspi/src/action.py.

# =========================================
# Makers! Implement your own actions here.
# =========================================

import RPi.GPIO as GPIO

class GpioWrite(object):

    '''Write the given value to the given GPIO.'''

    def __init__(self, gpio, value):
        GPIO.setmode(GPIO.BCM)
        GPIO.setup(gpio, GPIO.OUT)
        self.gpio = gpio
        self.value = value

    def run(self, command):
        GPIO.output(self.gpio, self.value)

При желании можно использовать другие программные интерфейсы Cloud Speech API, которые переводят голосовую речь в текст и поддерживают 80 языков, в том числе русский, и обработку длинных звуковых файлов.

Разумеется, поддерживается подключение дополнительных сенсоров. Например, подключение принтера и других бытовых устройств с голосовыми командами:

  • Включить принтер
  • Приглушить свет в комнате
  • Включить чайник на кухне
  • Сварить яйца (т. е. Вскипятить воду ровно на четыре минуты)
  • Выключить праздничную гирлянду на ёлке



Бесплатно такой проект не осилить. Во-первых, сам набор продаётся отдельно, некоторые детали там уникальные. Во-вторых, за использование облачных API тоже нужно платить. Хотя второе не является обязательным условием. В принципе, распознавание речи можно осуществлять локально при помощи приложения на TensorFlow.

На Хабре рассказывалось о новой платформе Google для интернета вещей — Android Things. Так вот, и она вышла в версии для AIY Voice Kit, также как есть версия для Raspberry Pi и некоторых других dev-плат.



Фактически, такой гаджет способен заменить кнопки включения/выключения на всех домашних бытовых и электрических приборах: от пылесоса до микроволновой печи. Его можно использовать вместо приложения на смартфоне для более удобного голосового управления «умными» бытовыми приборами вроде термостата или программируемых лампочек. В конце концов, его можно подключить к роботу — общаться с ним и командовать голосом (типа «Скажи, когда у кошки кончится еда»).
Поделиться с друзьями
-->

Комментарии (13)


  1. GBenG
    06.05.2017 15:55
    +1

    Сразу напомнило вот эту коробку)

    Рик и Морти
    image


  1. AlexanderS
    06.05.2017 16:31
    +1

    демонстрационная система распознавания речи с подключением к Google Assistant (или без подключения)

    Вот автономка — очень интересно было бы. Я пробовал делать управление используя Easy VR Shield. Даже удивлялся насколько хорошо обученная плата распознаёт мой голос, пока не перешёл с ней в другую комнату )


  1. seri0shka
    06.05.2017 16:47
    +1

    Кошка быстрей скажет, что у неё кончилась еда )
    image


    1. lingvo
      06.05.2017 17:57
      +1

      Не понял — это ж Google Home с открытым API получается. Если он поддерживает русский и позволяет активацию голосом типа «Окей Гугл, включи свет в спальне» — то это супер-штука.
      Единственное, что с микрофонами? Они такие же чувствительные?


  1. Googlist
    06.05.2017 20:02

    Осталость только прикрутить DIY Google Dick и сказать «Ok, penis, rise and shine».


  1. Kostyanych
    06.05.2017 20:37

    Да, автономного бы распознавания…
    Как-то не хочется ставить себя на прослушку в Гугле.


    1. ntfs1984
      07.05.2017 02:39

      Тоже мне, проблема. Прослушкой больше, прослушкой меньше…


    1. volkot
      08.05.2017 10:31

      там есть «Big Green Buton» по которой активируется прослушивание


  1. mu3
    07.05.2017 04:50

    Набор продаётся и без журнала в магазинах Barnes & Noble и в британских магазинах WH Smith, Tesco, Sainsburys и Asda

    TNW говорит о сумме ~$50, включая RPi ?https://tnw.to/2qL601n?


  1. Einherjar
    07.05.2017 12:07
    +1

    Картонный корпус это конечно просто жуть. Гугл же, жадность как всегда зашкаливает — 20 грамм пластика в комплект положить жалко. Сделали б тогда уж плату в форм-факторе среднестатистической банки из под консервов или упаковки от кукурузных хлопьев — скроили бы еще больше заменив картон на онлайн-инструкцию где в ней ножом проковырять отверстия под разъемы.


    1. pOmelchenko
      08.05.2017 10:32

      Банку сложнее доставлять каробка куда больше чем вот такая упаковка. Да и конструктор нацелен на diy, а у этого контенгента уже в большинстве случаев куплен и собран другой конструктор позволяющий распечатать какой угодно корпус :)


  1. instalator
    08.05.2017 10:10

    Интересна цена.
    Если не смотреть на цену интересен вот этот продукт.


    1. lingvo
      08.05.2017 16:55

      Самое интересное в этом продукте это ReSpeaker Mic Array. Это то, чего не хватает большинству систем распознавания голоса.
      А если его привязать к тому же Raspberry и привязать распознавалку Google, то получится то же самое.