Компания Google запустила инициативу AIY Projects, чтобы совместить AI с DYI, то есть совместить программные приложения ИИ с наборами для сборки гаджетов. В результате, считает Google, мейкеры смогут изготовлять полезные устройства, которые помогут «решать реальные проблемы» в жизни. Эти гаджеты будут по-настоящему взаимодействовать с человеком. Например, распознавать речь, отвечать на вопросы и выполнять голосовые команды.
Первым проектом стал Voice Kit — демонстрационная система распознавания речи с подключением к Google Assistant (или без подключения). Как сказано в описании, в дополнении ко всем обычным функциям Google Assistant, тут вы сможете ещё добавлять в гаджет собственные пары вопросов и ответов. Приборчик выполнен в виде маленького картонного кубика с Rasberry Pi 3 внутри. Сборка набора из 12 деталей займёт примерно 1,5 часа.
Набор деталей можно получить бесплатно при подписке на журнал MagPi. Кстати, этот журнал доступен в цифровом виде — там описано множество удивительных проектов, в том числе в сфере машинного обучения, сделанных при помощи Rasberry Pi.
Набор продаётся и без журнала в магазинах Barnes & Noble и в британских магазинах WH Smith, Tesco, Sainsburys и Asda. Судя по всему, это пока единственные места, где продаётся набор. В набор входят интерфейсные платы, кабели, пластиковые держатели, динамик и кнопка. Не входят сама плата Raspberry Pi 3, карта SD, а также необходимые для сборки отвёртка и скотч. Главные компоненты — плата Voice HAT для распознавания речи и плата Voice HAT Microphone. Это новые платы, которые пока недоступна в свободной продаже по отдельности.
Google предлагает подробную инструкцию, как собирать гаджет. Начиная со скрепления Raspberry Pi 3 и платы Voice HAT,
сворачивания коробки…
… и скрепления всего этого в единый гаджет.
Далее предлагается скачать образ Voice Kit SD для записи на флеш-карту.
Периферийные устройства подключаются в разъёмы, выставленные в прорези картонной коробки: клавиатура (1), мышь (2) и монитор (3).
После загрузки с флеш-карты девайс готов к подключению к Google Cloud Platform по настроенному соединению WiFi. Там нужна настройка нового проекта через Google Assistant API, и затем устройство начнёт полностью нормально функционировать, принимая голосовые запросы и распознавая их в облаке.
Устройство сразу понимает основные англоязычные команды:
- Сколько времени?
- Расскажи шутку
- Сделать музыку громче
- Сделать музыку тише
- Максимальная громкость
- Привет (ответ: «И тебе привет»)
Как уже было сказано, можно добавлять собственные пары вопросов и ответов, то есть программировать ИИ на необходимые действия. Это делается в файле
~/voice-recognizer-raspi/src/action.py
.# =========================================
# Makers! Implement your own actions here.
# =========================================
import RPi.GPIO as GPIO
class GpioWrite(object):
'''Write the given value to the given GPIO.'''
def __init__(self, gpio, value):
GPIO.setmode(GPIO.BCM)
GPIO.setup(gpio, GPIO.OUT)
self.gpio = gpio
self.value = value
def run(self, command):
GPIO.output(self.gpio, self.value)
При желании можно использовать другие программные интерфейсы Cloud Speech API, которые переводят голосовую речь в текст и поддерживают 80 языков, в том числе русский, и обработку длинных звуковых файлов.
Разумеется, поддерживается подключение дополнительных сенсоров. Например, подключение принтера и других бытовых устройств с голосовыми командами:
- Включить принтер
- Приглушить свет в комнате
- Включить чайник на кухне
- Сварить яйца (т. е. Вскипятить воду ровно на четыре минуты)
- Выключить праздничную гирлянду на ёлке
Бесплатно такой проект не осилить. Во-первых, сам набор продаётся отдельно, некоторые детали там уникальные. Во-вторых, за использование облачных API тоже нужно платить. Хотя второе не является обязательным условием. В принципе, распознавание речи можно осуществлять локально при помощи приложения на TensorFlow.
На Хабре рассказывалось о новой платформе Google для интернета вещей — Android Things. Так вот, и она вышла в версии для AIY Voice Kit, также как есть версия для Raspberry Pi и некоторых других dev-плат.
Фактически, такой гаджет способен заменить кнопки включения/выключения на всех домашних бытовых и электрических приборах: от пылесоса до микроволновой печи. Его можно использовать вместо приложения на смартфоне для более удобного голосового управления «умными» бытовыми приборами вроде термостата или программируемых лампочек. В конце концов, его можно подключить к роботу — общаться с ним и командовать голосом (типа «Скажи, когда у кошки кончится еда»).
Поделиться с друзьями
GBenG
Сразу напомнило вот эту коробку)
AlexanderS
Вот автономка — очень интересно было бы. Я пробовал делать управление используя Easy VR Shield. Даже удивлялся насколько хорошо обученная плата распознаёт мой голос, пока не перешёл с ней в другую комнату )
seri0shka
Кошка быстрей скажет, что у неё кончилась еда )
lingvo
Не понял — это ж Google Home с открытым API получается. Если он поддерживает русский и позволяет активацию голосом типа «Окей Гугл, включи свет в спальне» — то это супер-штука.
Единственное, что с микрофонами? Они такие же чувствительные?
Googlist
Осталость только прикрутить DIY Google Dick и сказать «Ok, penis, rise and shine».
Kostyanych
Да, автономного бы распознавания…
Как-то не хочется ставить себя на прослушку в Гугле.
ntfs1984
Тоже мне, проблема. Прослушкой больше, прослушкой меньше…
volkot
там есть «Big Green Buton» по которой активируется прослушивание
mu3
TNW говорит о сумме ~$50, включая RPi ?https://tnw.to/2qL601n?
Einherjar
Картонный корпус это конечно просто жуть. Гугл же, жадность как всегда зашкаливает — 20 грамм пластика в комплект положить жалко. Сделали б тогда уж плату в форм-факторе среднестатистической банки из под консервов или упаковки от кукурузных хлопьев — скроили бы еще больше заменив картон на онлайн-инструкцию где в ней ножом проковырять отверстия под разъемы.
pOmelchenko
Банку сложнее доставлять каробка куда больше чем вот такая упаковка. Да и конструктор нацелен на diy, а у этого контенгента уже в большинстве случаев куплен и собран другой конструктор позволяющий распечатать какой угодно корпус :)
instalator
Интересна цена.
Если не смотреть на цену интересен вот этот продукт.
lingvo
Самое интересное в этом продукте это ReSpeaker Mic Array. Это то, чего не хватает большинству систем распознавания голоса.
А если его привязать к тому же Raspberry и привязать распознавалку Google, то получится то же самое.