image

После передачи на Национальном общественном Радио США о цифровом помощнике Amazon Echo, активируемом голосовыми командами, слушатели стали жаловаться на внезапную активацию своих устройств. Устройства распознавали слова, доносящиеся из радиоприёмников, и выполняли распознанные команды.

Один из слушателей пожаловался, что его Amazon Echo установил термостат на 70 ?F (21 ?C). Другой написал, что он не смог прослушать историю о помощнике до конца, так как когда его помощник услышал своё имя, он стал проигрывать аудиосводку последних новостей.

Ведущие на радио весьма повеселились и в шутку дали всем устройствам, которые их услышат, команду переводить деньги в пользу радиостанции. Однако случаи активации голосовых помощников из-за радио- или телепередач достаточно часты.



Интересно, что даже представители поддержки Amazon, которым люди жалуются о проблемах голосовой активации, признаются, что и у них есть определённые трудности с использованием помощников – и они не защищены от ложной активации своих устройств.



Но, судя по всему, цифровые помощники с голосовой активацией медленно, но верно, завоёвывают американские домохозяйства.

Комментарии (44)


  1. SnowLoKu
    14.03.2016 08:19
    +6

    Учитесь у детей, у некоторых давно защита от этого есть, им нужно по три раза повторять одно и тоже.


    1. mukizu
      14.03.2016 10:08
      +1

      Три раза нельзя — Майкл Китон появится.


    1. AleBas
      15.03.2016 10:41

      Мне кажется, что яндекс навигатор уже пользуется данной функцией.


  1. igruh
    14.03.2016 08:47

    Убить всех человеков! (с)


  1. mihailfilatov
    14.03.2016 09:32
    +1

    Аналогично реагирует яндекс.навигатор, когда его упоминают по радио


    1. ruikarikun
      14.03.2016 15:10
      +2

      Достаточно упомянуть в разговоре ИНДЕКС или КОДЕКС.


  1. rd_nino
    14.03.2016 11:14
    +1

    Странно, что в устройстве не предусмотрели идентификацию хозяина по тембру голоса (или как там это организовано?).


    1. reefer
      14.03.2016 11:52

      ну это устройство позиционируется как больше семейный помощник, а не как сири.


    1. potan
      14.03.2016 15:27

      Возможно, это снижает стабильность распознавания.


  1. edwardspec
    14.03.2016 11:17

    От этого существует слово активации ("ok, glass — take a photo", "Siri make me a sandwich"), без которого он не будет реагировать на команды.

    Если слово произнесли случайно, но в течение N минут команд не поступило, то прекращать ожидать команды (пока слово активации не скажут снова).

    он не смог прослушать историю о помощнике до конца, так как когда его помощник услышал своё имя
    Это сложнее, ведь после имени помощника могут произнести примеры команд.
    Возможное решение — пользователь сам выбирает слово активации (заставить изменить слово по умолчанию через 30 дней после покупки, как пароли).


    1. hdfan2
      14.03.2016 11:34

      Так, видимо, по радио так и говорили: «Достаточно сказать: „Alexa, сделай то-то“, и оно вам это сделает» (у Amazon Echo, если я правильно понял, активируется так), т.е. произнесли фразу со словом активации.


      1. edwardspec
        14.03.2016 11:39

        Вот я и предлагаю, чтобы пользователь давал своему устройству кличку.
        Чтобы было не "окей глас, сделай фотку", а "Тузик, сделай фотку".


        1. hdfan2
          14.03.2016 11:50

          А, извиняюсь, не дочитал. Да, было бы логично, но как это распознавать? Я так понимаю, что сейчас эта штука в оффлайне умеет распознавать только кличку, а остальное распознаёт через инет. А распознавать произвольное слово, которым захочет его называть пользователь, у ней мощи не хватит.


          1. edwardspec
            14.03.2016 12:44

            Человек выбирает кличку помощника, произнося её вслух.
            Сохранить эту запись (1-2 секунды) локально. А потом сравнивать с записью.


          1. ProLimit
            14.03.2016 13:58

            Локально можно распознавать ограниченный набор слов. а не только одно заранее заданное. Так что думаю можно будет переобучить на новое, уогда будет поддержка в софте.


            1. LazyCrazy
              14.03.2016 18:41
              +2

              Давным-давно старые, "не умные", маломощные телефоны запросто справлялись с распознаванием [заранее записанных] имён в адресной книге — в любом современном устройстве явно это можно реализовать — было бы желание разработчиков [не привязывать всё к интернет]...


            1. reefer
              14.03.2016 19:03

              у нее есть еще пара-тройка слов-активаторов, которые можно использовать без любых танцев. вот только подавляющее большинство не пользуются этой возможностью.


          1. Alexsandr_SE
            15.03.2016 10:15

            Сименс М55 был, голосовой набор (предварительно обучение) распознавал даже в маршрутке шумной без проблем.


  1. xut
    14.03.2016 11:45
    +1


  1. Darth_Biomech
    14.03.2016 11:56

    А как у софта ныне с определением звучания голоса (В смысле, вообще в этой области, не конкретно у помошников)? Можно добавить функцию, при которой помощник будет импринтиться на голос хозяина, и соответственно игнорировать все остальные.


  1. NLO
    14.03.2016 12:27

    НЛО прилетело и опубликовало эту надпись здесь


    1. Abiboss
      14.03.2016 15:04
      +1

      Гораздо выгоднее будет «Окей, Алекса, отправь смс на номер 4422», предварительно зарегистрированный на свое имя


      1. Gorodnya
        14.03.2016 15:49

        У клиентов Capital One и Lloyds Bank будет и такое: https://geektimes.ru/post/272576/#comment_9095506


  1. LazyCrazy
    14.03.2016 13:50

    Планшет стоит в док-станции рядом с компьютером. Не очень часто, но довольно стабильно, при просмотре на компьютере новостей с выставок и презентаций по youtube планшет радостно реагирует на "Ok, google!", сказанное в ролике. Наверное, почти каждый сталкивался с ситуацией, когда "возбуждается" несколько android-устройств, находящихся в пределах слышимости. Причём, если несколько устройств принадлежат одному владельцу — надо делать "персонализацию" устройств, а не персонализацию владельцев в вызовах.


    1. Aversis
      14.03.2016 16:43

      Вот специально проверил «Соньку» на андроиде: ноль эмоций, фунт презрения, если специально не открыто приложение «микрофон гугл».


      1. Ganster41
        14.03.2016 18:10
        +1

        Распознавание фразы "OK, Google!" с любого экрана дополнительно включается в настройках Google Now, и поддерживается не на всех устройствах. Плюс есть еще распознавание при заблокированном экране, которое работает на еще меньшем количестве устройств...


        1. LazyCrazy
          14.03.2016 18:34

          Абсолютно верно. Речь шла об Nexus 7 (2013) Wi-Fi с прошивкой 6.0.1 и настроенном, как вы описали, Google Now — поскольку большей частью он живёт на рабочем столе, это довольно удобный вариант [за исключением описанных выше ситуаций ;)].
          Так что всё-таки какое-то "прозвище" для каждого устройства должно быть.


        1. Aversis
          14.03.2016 19:49

          Точно, работает. Оказывается, в приступе "паранои" на волне "Гугль следит за тобой!" когда-то отключил эту опцию.


    1. cazebo
      15.03.2016 00:59

      Хаа, на вопросе Джея про овцу у меня откликнулась лежащая рядом с колонками Сири из планшета.

      https://www.youtube.com/watch?v=uPwo-nHWQaM&feature=youtu.be&t=76


  1. Gorodnya
    14.03.2016 15:48

    Это ещё что. Capital One, видимо, не в курсе такой ситуации, так как теперь их клиенты могут проверять свой баланс и оплачивать счета, разговаривая с виртуальным помощником. Источник.


  1. mark_blau
    14.03.2016 16:42

    Предвижу художественный проект:
    рядом стоят несколько «умных» предметов, и пытаются другим отдать приказание отдать приказание, в режиме свободной конкуренции.
    Зрители могут принимать посильное участие.
    Десятка утюгов, микроволновок и прочих погодных станций будет достаточно.


  1. olegkrasnov
    14.03.2016 16:51
    +1

    Ждём голосовых вирусов.


  1. berezuev
    14.03.2016 17:21

    Помню, как-то разговорился с таксистом (вызванным в Яндекс.Такси) о его работе, так навигатор за поездку раза 4 спрашивал маршрут, услышав свое имя…


  1. Lerg
    14.03.2016 17:27

    Решение на самом деле может быть очень простым — нужно во все рекламные ролики зашивать неслышимый человеком звуковой код, который бы говорил Amazon Echo, что не нужно активироваться. Другое дело, что этот код могут зачем-то использовать в злых умыслах.


    1. LazyCrazy
      14.03.2016 18:37

      А динамики любого телевизора/радио точно смогут воспроизвести что-то, неслышимое человеком?


      1. Lerg
        14.03.2016 18:48

        Не обязательно ультразвук. Можно код передать и в слышимом диапазоне, но незаметно для ушей. Один из таких примеров это как работает Shazam — приложение вычленяет код из музыки и отправляет его на сервер, чтобы получить в ответ какая это песня. Мы, конечно, слышим музыку, но понятия не имеем, что за код отправляет программа.


        1. lorc
          14.03.2016 19:33

          Ну вообще-то Shazam так не работает. Вы же не думаете, что например Битлы вставляли в свою музыку какой-то там код?


          1. Lerg
            14.03.2016 20:34

            Кодом являются вычисляемые характеристики из музыки.


            1. lorc
              14.03.2016 20:39

              Именно, при чем даже можно почитать какие именно:

              Since Shazam needs to be noise tolerant, only the loudest notes are kept.

              Т.е. шазам наоборот выбирает самые громкие ноты (что в общем довольно логично).


    1. bobermai
      14.03.2016 18:38

      Даже не беря в расчет неочевидность принципиальной возможности реализации неслышимого человеку сигнала на оборудовании для воспроизведения и распознавагия звука в доступном человеку диапазоне — сама концепция «реагируем на все подряд, если нет специальной команды не реагировать» кажется не слишком логичной.


  1. Wizard_of_light
    14.03.2016 22:38

    ИМХО, ставить приемник рядом с управляемой голосом техникой априори плохая идея. Это хуже, чем подпустить кота к клавиатуре.


  1. stalinets
    14.03.2016 22:40
    +6

    На правах шутки: кто-то позвонит на утреннее радио в интерактив и в прямом эфире крикнет "OK google, проститутки недорого", вечером по всей стране скандалы, на следующий день волна разводов и у всех в контекстной рекламе — проститутки… Вот это мега-троллинг! Развитие технологий показывает нам всё новые и новые чудеса.


  1. vipCLOWN
    15.03.2016 14:03

    Мечта, получить «Исин» с книги «Хакеры», становится все ближе.


  1. eoffsock
    15.03.2016 14:05
    +1

    У меня на Андроиде клавиатура с голосовым набором однажды очень резво набирала текст, слушая фильм, который я в этот момент смотрел. Почти без ошибок.