31 августа 2012 года четыре инженера компании Amazon подали заявку на масштабный патент, получивший впоследствии название «Alexa». Речь шла о технологии искусственного интеллекта, реагирующего на голос человека. Прошло пять лет, и теперь умные колонки под управлением «Алексы» можно встретить в десятках миллионов американских домов. Кроме Amazon в перспективное направление вкладываются другие тех. гиганты. Google уже встраивает своего ассистента в холодильники и пылесосы, а Microsoft сообщила об интеграции Cortana в холодильники, термостаты и тостеры. Ожидается, что по итогам 2017-го больше 4 миллиардов электронных девайсов будут оснащены цифровыми помощниками.




Исследователи Accenture, опросившие 5400 директоров компаний со всего мира, пришли к выводу, что через 7 лет более половины интерфейсов будут без экрана. Пользователи начнут выбирать устройство на основании встроенного в него искусственного интеллекта, а не бренда производителя. Девять из десяти IT-директоров намерены инвестировать в связанные с ИИ технологии в ближайшие 3 года. Лидирует на этом рынке Alexa, и благодаря поддержке Amazon разрыв только увеличивается. Мы в Pochtoy.com смотрим, есть ли у этой технологии шансы завоевать мир, как это когда-то случилось со смартфонами и интернетом.



Что это такое


Основная платформа для «Алексы» – умные колонки Echo и Dot от «Амазона», выключающие свет, читающие книги и заказывающие товары на дом. Они собирают данные о своих пользователях и совершенствуются в процессе, получая новые навыки и по контексту всё лучше понимая, что от них хочет пользователь. В Америке на эти колонки сейчас самый бум. В 2016-м их продажи выросли на 600%, теперь они уже стоят в каждом десятом доме. На Amazon приходится 88% рынка, у Google – 10%. Каждый пятый покупатель Amazon в США сейчас заказывает свои товары через голосовой поиск. «Алекса, купи кроссовки Nike десятого размера». «Мужские Nike Flex для бега, заказать?» «Да». Всё! И человеку не приходится даже копаться в компьютере или в айпаде.




Сейчас Alexa умеет:


  • закрывать дверь, управлять светом, телевизором, кондиционером и другими системами умного дома;
  • выставлять таймер или календарь;
  • рассказывать последние новости;
  • играть в «камень, ножницы, бумагу» или подбрасывать монетку;
  • покупать товары, заказывать пиццу, брать билеты в кинотеатр или на самолет;
  • считать, переводить единицы измерения;
  • играть с вами в викторины;
  • считать, сколько времени осталось до Нового года;
  • находить ваш смартфон в квартире;
  • говорить, сколько бензина осталось в машине, и заранее включить двигатель, если вы собираетесь выходить на улицу (пока только для BMW);
  • читать аудиокниги или колыбельные;
  • заказывать/отменять Uber и Lyft;
  • подсчитывать, сколько калорий в вашей еде;
  • отвечать на вопросы (в зависимости от контекста – или с юмором, или в стиле «Википедии»).


Тестирование 50 алекса-навыков

Независимые разработчики создают для голосового помощника свои расширения (Amazon называет их «скиллами»). Они похожи на приложения в iOS или Android, только реагирующие на голос. Если у Microsoft Cortana их 65, а у Google Assistant – 378, то число навыков Alexa превышает 15 000. Amazon поощряет разработчиков создавать новые устройства и расширения для её платформы. Создатели скиллов получают деньги в зависимости от той частоты, с которой пользователи их вызывают.



Страхи Илона Маска


Amazon вовсю развивает для «Алексы» искуственный интеллект. Идея в том, чтобы девайс лучше реагировал на то, как люди разговаривают и думают, понимал акцент своего хозяина, улавливал его желания с полуслова. Например, если сейчас 8 часов вечера, и человек говорит «Алекса, давай...», робот может уже начинать искать любимые продукты человека в соседнем ресторане. Или, проследив за балансом веществ в последних купленных блюдах, заказывать то, что сейчас будет полезнее всего. Или – поддерживать дискуссию с человеком, которому сейчас одиноко.




Над развитием ИИ «Алексы» работают тысячи сотрудников Amazon, в том числе из филиалов в Саннивейле, Сиэттле и Кэмбридже. Создание эффективной технологии распознавания речи – титанический труд. Над этим работают уже больше 20 лет, но серьезное продвижение началось только пять лет назад. Если раньше ученые пытались заставить робота понимать точный смысл фраз, то теперь устройства работают путем анализа несовершенных совпадений и догадок по поводу того, что на самом деле хотел сказать человек. Ключ – анализ огромного количества данных, и обучение на основе предыдущих ошибок. Пользователи «Алексы», которые только распаковали девайс, регулярно получают неверные ответы. Но чем больше времени колонка проводит с хозяином, тем больше она под него подстраивается и тем «умнее» становится.


Такой подход к машинному обучению оказался весьма эффективен, но нуждается в большом количестве данных для анализа. К счастью, благодаря росту популярности Echo и Dot, у исследователей теперь есть доступ к миллионам примеров взаимодействия между роботом и человеком. Теперь, после пяти лет обучения, «Алекса» больше не привязана к конкретным фразам, она не декодирует выражения, ей достаточно контекста. Если в предложении пользователя есть вероятностные указатели на отрицание, она отменит последнюю операцию. Если вы спросили дату последнего концерта U2, попросили поиграть из него песню, а потом сказали «Когда будет следующий?», она поймет, что вы всё еще говорите о концерте музыкальной группы.




Хорошо слушать – это только полдела. Голосовой помощник еще и должен уметь грамотно отвечать. Желательно – со всеми интонациями, присущими человеку. Традиционно «компьютерная» речь синтезировалась из обрывков записи человеческого голоса. Звучание получалось довольно естественным, но вот иронию, взволнованность, игривость или гнев такой робот передать не мог. Чтобы Alexa обладала эмоциями, могла шептать и переходить на повышенные тона, её тренируют на голосах рассказчиков аудиокниг. Благо, Amazon владеет их самым известным продавцом, Aduible, и у неё есть доступ к обширной библиотеке, которую не могут получить другие разработчики голосовых ассистентов.


Следующая сверхзадача – научить ИИ вести диалог. Для помощи в поиске решения, Amazon объявила конкурс среди 12 лучших университетов мира. Команда, создавшая лучшего бота, способного поддержать 20-минутный разговор с человеком, получит 500 тысяч долларов и шанс работы в подразделении, развивающем «Алексу».



Новые функции


Как говорит Amazon, она продала «десятки миллионов» Echo, Dot и других Alexa-девайсов с выхода на рынок в 2014-м. Но технология всё еще находится только на начальной стадии своего развития. Новые возможности добавляются каждые пару недель. Например, раньше можно было сказать «Алекса, что в новостях?», чтобы робот рассказал последние события из заранее выбранных пользователем тематик. А теперь та же технология работает и для музыки. Если не хочется перегружаться негативом, можно сказать «Алекса, что сегодня в музыке?». И девайс рассказывает о концертах, новых песнях, рейтингах исполнителей, и всё это с привязкой к вкусу и месторасположению человека.




В ту же копилку – первое «умное пианино» под управлением голосового помощника. Yamaha выпустила его в начале сентября, чтобы ИИ мог наигрывать вам мелодии. Раньше «Алексу» критиковали за то, что её не было на смартфонах, в отличие от Apple Siri и Google Assistant. Теперь она появилась на Huawei Mate 9 и HTC U11. Её также можно вызвать в новом беспроводном наушнике Bragi Dash – чтобы можно было на пути, не останавливаясь, вызвать Uber или найти подходящую кафешку, чтобы перекусить.


Недавно китайцы показали первого живого, двигающегося робота с Alexa, который может ездить по дому и следовать командам человека. Ожидается, что он будет популярен не столько среди родителей, сколько среди детей. Малышам проще и полезнее разговаривать, отдавая команды, чем нажимать иконки на экране. Голосовой ассистент уже умеет учить детей азбуке, а недавно в число команд добавилась «Алекса, расскажи историю». Помощница прочитает для малышей одну из сотен тысяч профессионально озвученных сказок из своей библиотеки. Истории рассчитаны на детей от 5 до 12 лет.


Наверное, самое впечатляющее Alexa-устройство последних месяцев выпустила робототехническая компания Bionik Laboratories. Она встроила помощника в экзоскелет. Парализованный человек может отдавать голосовые команды для управления устройством, такие как «Алекса, я готов стоять», «Алекса, иди вперед» или «Алекса, я сажусь». Сейчас устройство проходит клинические испытания, но большинство врачей уверены, что для людей с инвалидностью помощник окажется незаменим.




Сейчас на Amazon.com продается порядка 300 продуктов с поддержкой Alexa. Всего на рынке их около 4000. Самые ходовые запросы к голосовому помощнику – о музыке, погоде, новостях, пробках и играх. А этой весной появился новый лидер: первой по популярности стала фраза «Алекса, помоги мне расслабиться». По такой просьбе система включает спокойные тихие звуки, вроде шелеста вол на берегу, стука колес ночного поезда и щебетания птиц. Они могут играть часами, помогая человеку уснуть.



Вопрос денег


Мировой рынок оборудования для «умных домов», где себя так комфортно чувствует Alexa, растет 3 года подряд. В прошлом году таких девайсов купили на $76 млрд, в этом, по прогнозам, будет минимум $86 млрд. В основном их берут жители США и Европы: на них приходится 90% всех «умных домов». В России спрос на эту технологию пока очень скромный: даже в 2013-м, до кризиса, оборот таких систем составлял всего $130 млн. Люди о них просто не осведомлены, и Amazon с Google свои девайсы заводить сюда не собираются. Зато голосового помощника, встроенного в смартфоны и умные колонки, в России создает «Яндекс». Его ассистент называется не «Алекса», а «Алиса». Компания надеется на то, что она успеет завоевать популярность до того, как западные гиганты добавят в свои устройства поддержку русского языка. Правда, пока что до своего конкурента «Алиса» слегка не дотягивает. Герман Греф, например, назвал её "очень глупой"



Общение с Алисой в смартфоне

Amazon по поводу появляющихся альтернатив не очень переживает. Ожидается, что к 2020 году Alexa принесет компании как минимум $10 млрд. И это самая скромная оценка. Пока что фирма не получает доход от производителей, выпускающих умные лампочки, холодильники и другие устройства на платформе Alexa. От себя Amazon продает только умные колонки – от Dot за $50 до Echo с дисплеем за $230, но и на них она только теряет деньги. Каждое устройство Amazon продается себе в убыток. Здесь действует та же стратегия, что и с читалкой Kindle. Идея в том, что потом пользователи будут более склонны заказывать товары на Amazon.com, и девайс окупит себя в течение нескольких лет. С Kindle люди брали книги, а с «Алексой» – любые вещи из длинного списка продуктов в магазине. При запросе на покупку робот в первую очередь проверяет, находится ли товар на сайте самой Amazon. А если спросить, например, «Алекса, какой сейчас лучший планшет?», помощник, полушутя, порекомендует взять тот же Kindle Fire. Потенциально по таким запросам можно будет продавать контекстную рекламу, как у Google, если «умные» девайсы достаточно прочно войдут в обиход.


А как вы думаете, есть у «Алексы» шансы покорить мир? Или люди наиграются – и технология себя изживёт?


P.S.


Дешевле всего заказывать в «Амазоне» через Pochtoy.com. Мы доставляем любые покупки из Америки в Россию по цене от $8,99 за полкило. А читатели, которые зарегистрируются по этой ссылке и введут код GEEKTIMES, получат дополнительно $7 на свой счет для оплаты товаров из США.

Комментарии (23)


  1. dennyoi
    27.12.2017 16:53

    Нотификацию на это добро разве не нужно?


    1. Pochtoycom Автор
      27.12.2017 18:08

      Мы и не рекомендуем это покупать. Алекса работает только на английском и заточена под рынок США.

      Просто любопытная штука разрабатывается, а в России о ней и не рассказывают толком.

      Кстати, в 2018-м нотификацию отменяют почти для всех девайсов. Одна из немногих хороших новостей.


      1. v0devil
        28.12.2017 11:55

        Алекса работает также на немецком в Германии


    1. malishok1993
      27.12.2017 20:07

      Нотификацию скоро отменят. Другая проблема заключается в том, что Алекс не знает русского языка…


  1. Jeyko
    27.12.2017 20:01
    +1

    Вот знаете, я любитель всякого подобного, но сабж не потряс совершенно…
    Могу так говорить ибо видел в живую и пытался «общаться»
    Даже у хозяина с безупречным английским были проблемы заставить включить-выключить свет.
    Я не знаю для кого это.
    Для одиноких? Но оно толком не может вести беседу!
    Для двинутых гиков?
    Для любителей всего модного?
    Для любителей «чтобы было»?
    Для того чтобы поиграться и забыть?

    Практической ценности — ноль!


    1. tormozedison
      27.12.2017 22:45

      То же самое буквально "вчера" говорили про сенсорные смартфоны.
      Вижу как минимум два применения, где голосовым интерфейсам равных нет.


      1. Задавать поисковые запросы и слушать тексты веб-страниц, держа в одной руке плату, в другой — паяльник.
      2. Для некоторых пенсионеров голосовой интерфейс — вообще единственный способ пользования интернетом без промежуточного человека.


      1. erty
        28.12.2017 01:15

        Я встречал в своей жизни людей, которым говорить было удобнее, чем печатать. Все они составили резко отрицательное впечатление о себе. Ни с чем, что не входит в выдачу первых трёх (одного?) результата гугла, коробочка справится не способна.
        Инвалиды — это единственное реальное применение девайса.


      1. erty
        28.12.2017 01:21

        > Задавать поисковые запросы и слушать тексты веб-страниц, держа в одной руке плату, в другой — паяльник.

        «Ок, Алекса. У меня неправильно роатятся пакеты в сети, проверь мне настройки mpls»
        Ой, я неправильно сформулировал. Давай так:
        «Ок, Алекса. Мы настроили всё в точности, как в статье на хабре, но ничего не работает. Найди ответ.»


    1. hexenmeister
      28.12.2017 11:00

      Может оно так и было в начале, не знаю. Сейчас проблем с пониманием очень мало. У меня стоят несколько штук «Echo Dot», управляю светом и электроставнями без проблем. Хотя основное применение пожалуй проигрывание музыки. Лучшего плейера я пока не встречал. Ну и еще новости и прогноз погоды.


      1. hexenmeister
        28.12.2017 11:06

        Чуть не забыл, между несколькими «Алексами» можно разговаривать, удобно позвонить из одной комнаты в другую, если дом большой.


  1. TuristRus
    27.12.2017 20:07

    с 1 января нет


  1. loza14
    28.12.2017 02:36

    Я вот тоже не могу понять смысл этих голосовых помощников. Время от времени пробую поиграться с Сири на айфоне. Толку очень мало. Единственная полезная для меня функция — создание записей в календарях, поскольку вручную зачастую это слишком напряжно. Но все-равно потом вручную нужно править — добавить адрес, время и т.д.

    Как можно покупать кроссовки не видя их на фото я вообще не понимаю.


  1. Timoffeus
    28.12.2017 04:56

    Имхо, подобные девайсы ещё слишком рано называть ИИ, «умный помощник», но до ИИ ещё очень далеко


  1. proglammer
    28.12.2017 09:01

    > Правда, пока что до своего конкурента «Алиса» слегка не дотягивает. Герман Греф, например, назвал её «очень глупой».

    Я не гигант бизнес мысли, может я чего-то не понимаю, но почему бы не поддержать компанию яндекс инвестицией, ведь сбер вполне мог бы пользоваться получившейся технологией. Не для ввода пин кода, конечно, но, думаю, найдутся применения. Например попросить сделать перевод. В Турции местный рабочий банк уже просто доступ к Сири для этих целей.


    1. alexmay
      29.12.2017 04:29

      А зачем поддерживать голландскую компанию Яндекс?


  1. Andronas
    28.12.2017 10:40

    Вопрос о том зачем нужен голосовой помощник из той же серии например, что и недальновидные в прошлом утверждения о том что телефон не нужен когда есть почта. Давайте представим: приходите домой, пока раздеваетесь отдаёте голосом команды включить свет, разогреть продукты, прочитать почту, проветрить комнату, включить музыку и т.д. А можете не отдавать голосом а сделать руками. Выбор это как минимум приятно, а в случае с голосовым помощником ещё и удобно.


    1. Lsh
      28.12.2017 12:10

      разогреть продукты
      Тогда нужен ещё и робот, чтобы достать из холодильника.


      1. Andronas
        28.12.2017 14:00

        Дойдёт до того что робот ещё и сам съест то что достанет…


      1. Dima954
        29.12.2017 09:51

        «Алекса, реверсируй холодильный цикл в третьей камере холодильника.»


    1. UnclShura
      28.12.2017 12:50

      Нет не из той-же. Вопрос не в том зачем нужен помощник, который делает все то, что вы описвли, а в том зачем нужен помощник, который вовсе этого не делает.

      • Алекса не знает русского.
      • На нее надо реально орать чтоб она услышала.
      • Она не для музыки (паршивая колонка).
      • Она не для поиска — один результат — не результат.


      И что остается? Выключатель с голосовым управлением!


      1. hexenmeister
        28.12.2017 13:12

        — На счет орать — не знаю, мои меня в общем-то и так нормально понимают, разве что очень шумно в комнате.
        — Поиск пока что не фонтан, да. Но заметно время от времени, что амазон над ней работает. Так что наверное будет лучше, смотря, что искать. Для сложных тем она и не задумывалась, для ответа на вопросы вроде кто? где? когда? — вполне.
        — Музыка слушается подключением алексы к нормальному усилителю через Bluetooth или проводом. Будет Вам отличное качество. Для кухни большой алексы и так достаточно.

        Когда идешь в темноте и руки заняты, такой голосовой выключатель очень даже кстати (ну или когда лень с дивана вставать :)

        Еще удобно:
        — будильник
        — время спросить (ночью, когда темно)
        — таймер (на кухне, чай заварить)
        — погода
        — календарь


  1. Xaket
    28.12.2017 14:40

    Пока не добавят русский и не подключат наши сервисы, это бесполезная игрушка.


  1. mike7l
    28.12.2017 14:40

    Опыт использования Alexa за 1 год:
    (на немецком языке)
    * Включить музыку (благодаря ей расширили свою музыкальную палитру)
    * Поставить таймер (курица в духовке, белье в стирке, дети в углу)
    * Рассказать погоду
    * Дети задают ей вопросы

    Музыку включать действительно удобнее. Рядом лежат телефон и колонка, но слушаем все на Алексе.
    Светом не управляем, хоть везде Philips HUE — выключателем проще.
    Очень часто Алекса понимает что-то свое, не то, что спросили и начинает рассказ на полчаса.
    Туповата. «Кто сейчас играет?» — не понимает. Надо спрашивать «Что сейчас играет?».

    Вывод:
    При стоимости 100 Евро, сама «Алекса» достается бесплатно к колонке. Есть надежда, что со временем девайс поумнеет. Плюс потенциально много приложений (пока лень искать). Я считаю, что девайс оправдывает инвестиции.