После передачи на Национальном общественном Радио США о цифровом помощнике Amazon Echo, активируемом голосовыми командами, слушатели стали жаловаться на внезапную активацию своих устройств. Устройства распознавали слова, доносящиеся из радиоприёмников, и выполняли распознанные команды.
Один из слушателей пожаловался, что его Amazon Echo установил термостат на 70 ?F (21 ?C). Другой написал, что он не смог прослушать историю о помощнике до конца, так как когда его помощник услышал своё имя, он стал проигрывать аудиосводку последних новостей.
Ведущие на радио весьма повеселились и в шутку дали всем устройствам, которые их услышат, команду переводить деньги в пользу радиостанции. Однако случаи активации голосовых помощников из-за радио- или телепередач достаточно часты.
Now that there are Amazon Echo commercials on TV, they accidentally activate my mom's Echo ALL THE TIME. That's a great story prompt.
— Dan Wells (@TheDanWells) 4 декабря 2015 г.
Интересно, что даже представители поддержки Amazon, которым люди жалуются о проблемах голосовой активации, признаются, что и у них есть определённые трудности с использованием помощников – и они не защищены от ложной активации своих устройств.
Apparently Amazon's customer service is also annoyed that their Echos play Christmas music at request of commercial pic.twitter.com/dyGIUmIM7G
— Danielle Alberti (@DanielleAlberti) 4 декабря 2015 г.
Но, судя по всему, цифровые помощники с голосовой активацией медленно, но верно, завоёвывают американские домохозяйства.
Комментарии (44)
edwardspec
14.03.2016 11:17От этого существует слово активации ("ok, glass — take a photo", "Siri make me a sandwich"), без которого он не будет реагировать на команды.
Если слово произнесли случайно, но в течение N минут команд не поступило, то прекращать ожидать команды (пока слово активации не скажут снова).он не смог прослушать историю о помощнике до конца, так как когда его помощник услышал своё имя
Это сложнее, ведь после имени помощника могут произнести примеры команд.
Возможное решение — пользователь сам выбирает слово активации (заставить изменить слово по умолчанию через 30 дней после покупки, как пароли).hdfan2
14.03.2016 11:34Так, видимо, по радио так и говорили: «Достаточно сказать: „Alexa, сделай то-то“, и оно вам это сделает» (у Amazon Echo, если я правильно понял, активируется так), т.е. произнесли фразу со словом активации.
edwardspec
14.03.2016 11:39Вот я и предлагаю, чтобы пользователь давал своему устройству кличку.
Чтобы было не "окей глас, сделай фотку", а "Тузик, сделай фотку".hdfan2
14.03.2016 11:50А, извиняюсь, не дочитал. Да, было бы логично, но как это распознавать? Я так понимаю, что сейчас эта штука в оффлайне умеет распознавать только кличку, а остальное распознаёт через инет. А распознавать произвольное слово, которым захочет его называть пользователь, у ней мощи не хватит.
edwardspec
14.03.2016 12:44Человек выбирает кличку помощника, произнося её вслух.
Сохранить эту запись (1-2 секунды) локально. А потом сравнивать с записью.
ProLimit
14.03.2016 13:58Локально можно распознавать ограниченный набор слов. а не только одно заранее заданное. Так что думаю можно будет переобучить на новое, уогда будет поддержка в софте.
LazyCrazy
14.03.2016 18:41+2Давным-давно старые, "не умные", маломощные телефоны запросто справлялись с распознаванием [заранее записанных] имён в адресной книге — в любом современном устройстве явно это можно реализовать — было бы желание разработчиков [не привязывать всё к интернет]...
reefer
14.03.2016 19:03у нее есть еще пара-тройка слов-активаторов, которые можно использовать без любых танцев. вот только подавляющее большинство не пользуются этой возможностью.
Alexsandr_SE
15.03.2016 10:15Сименс М55 был, голосовой набор (предварительно обучение) распознавал даже в маршрутке шумной без проблем.
Darth_Biomech
14.03.2016 11:56А как у софта ныне с определением звучания голоса (В смысле, вообще в этой области, не конкретно у помошников)? Можно добавить функцию, при которой помощник будет импринтиться на голос хозяина, и соответственно игнорировать все остальные.
NLO
14.03.2016 12:27НЛО прилетело и опубликовало эту надпись здесь
Abiboss
14.03.2016 15:04+1Гораздо выгоднее будет «Окей, Алекса, отправь смс на номер 4422», предварительно зарегистрированный на свое имя
Gorodnya
14.03.2016 15:49У клиентов Capital One и Lloyds Bank будет и такое: https://geektimes.ru/post/272576/#comment_9095506
LazyCrazy
14.03.2016 13:50Планшет стоит в док-станции рядом с компьютером. Не очень часто, но довольно стабильно, при просмотре на компьютере новостей с выставок и презентаций по youtube планшет радостно реагирует на "Ok, google!", сказанное в ролике. Наверное, почти каждый сталкивался с ситуацией, когда "возбуждается" несколько android-устройств, находящихся в пределах слышимости. Причём, если несколько устройств принадлежат одному владельцу — надо делать "персонализацию" устройств, а не персонализацию владельцев в вызовах.
Aversis
14.03.2016 16:43Вот специально проверил «Соньку» на андроиде: ноль эмоций, фунт презрения, если специально не открыто приложение «микрофон гугл».
Ganster41
14.03.2016 18:10+1Распознавание фразы "OK, Google!" с любого экрана дополнительно включается в настройках Google Now, и поддерживается не на всех устройствах. Плюс есть еще распознавание при заблокированном экране, которое работает на еще меньшем количестве устройств...
LazyCrazy
14.03.2016 18:34Абсолютно верно. Речь шла об Nexus 7 (2013) Wi-Fi с прошивкой 6.0.1 и настроенном, как вы описали, Google Now — поскольку большей частью он живёт на рабочем столе, это довольно удобный вариант [за исключением описанных выше ситуаций ;)].
Так что всё-таки какое-то "прозвище" для каждого устройства должно быть.
Aversis
14.03.2016 19:49Точно, работает. Оказывается, в приступе "паранои" на волне "Гугль следит за тобой!" когда-то отключил эту опцию.
cazebo
15.03.2016 00:59Хаа, на вопросе Джея про овцу у меня откликнулась лежащая рядом с колонками Сири из планшета.
https://www.youtube.com/watch?v=uPwo-nHWQaM&feature=youtu.be&t=76
mark_blau
14.03.2016 16:42Предвижу художественный проект:
рядом стоят несколько «умных» предметов, и пытаются другим отдать приказание отдать приказание, в режиме свободной конкуренции.
Зрители могут принимать посильное участие.
Десятка утюгов, микроволновок и прочих погодных станций будет достаточно.
berezuev
14.03.2016 17:21Помню, как-то разговорился с таксистом (вызванным в Яндекс.Такси) о его работе, так навигатор за поездку раза 4 спрашивал маршрут, услышав свое имя…
Lerg
14.03.2016 17:27Решение на самом деле может быть очень простым — нужно во все рекламные ролики зашивать неслышимый человеком звуковой код, который бы говорил Amazon Echo, что не нужно активироваться. Другое дело, что этот код могут зачем-то использовать в злых умыслах.
LazyCrazy
14.03.2016 18:37А динамики любого телевизора/радио точно смогут воспроизвести что-то, неслышимое человеком?
Lerg
14.03.2016 18:48Не обязательно ультразвук. Можно код передать и в слышимом диапазоне, но незаметно для ушей. Один из таких примеров это как работает Shazam — приложение вычленяет код из музыки и отправляет его на сервер, чтобы получить в ответ какая это песня. Мы, конечно, слышим музыку, но понятия не имеем, что за код отправляет программа.
lorc
14.03.2016 19:33Ну вообще-то Shazam так не работает. Вы же не думаете, что например Битлы вставляли в свою музыку какой-то там код?
bobermai
14.03.2016 18:38Даже не беря в расчет неочевидность принципиальной возможности реализации неслышимого человеку сигнала на оборудовании для воспроизведения и распознавагия звука в доступном человеку диапазоне — сама концепция «реагируем на все подряд, если нет специальной команды не реагировать» кажется не слишком логичной.
Wizard_of_light
14.03.2016 22:38ИМХО, ставить приемник рядом с управляемой голосом техникой априори плохая идея. Это хуже, чем подпустить кота к клавиатуре.
stalinets
14.03.2016 22:40+6На правах шутки: кто-то позвонит на утреннее радио в интерактив и в прямом эфире крикнет "OK google, проститутки недорого", вечером по всей стране скандалы, на следующий день волна разводов и у всех в контекстной рекламе — проститутки… Вот это мега-троллинг! Развитие технологий показывает нам всё новые и новые чудеса.
eoffsock
15.03.2016 14:05+1У меня на Андроиде клавиатура с голосовым набором однажды очень резво набирала текст, слушая фильм, который я в этот момент смотрел. Почти без ошибок.
SnowLoKu
Учитесь у детей, у некоторых давно защита от этого есть, им нужно по три раза повторять одно и тоже.
mukizu
Три раза нельзя — Майкл Китон появится.
AleBas
Мне кажется, что яндекс навигатор уже пользуется данной функцией.