Только что мы представили наше новое устройство — Яндекс.Станцию Мини. Это компактная умная колонка, которая умеет воспроизводить музыку, управлять умным домом, ставить напоминания — и многое другое. А ещё это первая колонка с Алисой, управлять которой можно жестами.

Сегодня мы расскажем читателям Хабра несколько историй об этапах создания Станции Мини. От калибровки оптики и UX-тестирования до неочевидных особенностей работы с электропитанием. А ещё вы узнаете, что такое терменвокс и как он связан с устройством Яндекса.



Но для начала небольшой флешбэк.

В прошлом году мы рассказывали на Хабре о разработке «большой» Яндекс.Станции (а ещё платформы Yandex.IO, которую используем и мы, и партнёры). Это наше флагманское устройство с Алисой, сконструированное так, чтобы находиться в центре большой комнаты рядом с телевизором. У неё мощный 50-ваттный звук. Три активных динамика с широким диапазоном частот. Семь микрофонов, работающих как единый радар. HDMI-выход, в конце концов.

Весь этот год мы не стояли на месте. Голос Алисы становился всё более естественным. Она научилась решать проблему произношения для многих омографов, т. е. в зависимости от контекста правильно ставить ударения в словах, которые пишутся одинаково, но имеют разный смысл. Слух тоже развивался: недавно мы уже рассказывали о том, как учили Алису не откликаться на чужие имена. Недавно мы начали тестировать возможность узнавать владельца колонки по голосу.

А ещё мы запустили платформу умного дома. Теперь с помощью голоса можно управлять устройствами сторонних производителей и даже объединять их в сценарии. Отказ от пультов и кнопок в пользу голоса — ключевая особенность нашей платформы. А для этого Алиса должна быть рядом.

Кроме того, умная колонка — это ведь не только музыка, радио и видео, но и напоминания, будильник, погода, фактовые ответы, сказки и игры для детей и т. д. Устройство может пригодиться у кровати, в кабинете, на кухне, в любом другом уголке квартиры.

Поэтому мы решили сделать ещё одну Станцию — для тех, кому нужно более простое и компактное устройство с Алисой.

Уменьшаем устройство


Для мини-варианта не нужен громкий звук, поэтому тяжёлые и большие динамики заменили одним трёхваттным. Этого более чем достаточно для простых задач. Хотя даже он может доставить хлопот с электропитанием, если не учесть один нюанс, но об этом чуть позже.

Отказались от выхода на телевизор. Это снижает нагрузку, тепловыделение, а значит, и требования к электронике. Массивный металлический каркас Станции с пассивным радиатором для охлаждения тоже стал не нужен.

Вместо семи микрофонов оставили четыре, ведь улавливанию речи больше не мешает громкий звук. Но при этом микрофоны, как и в Станции, работают по принципу фазированных антенных решёток, или направленного микрофона. Устройство алгоритмически ищет в окружающем шуме голосовую команду со словом «Алиса». Затем определяет направление и очищает сигнал от шума, в том числе вычитает музыку. И только после этого сигнал идёт в облако и распознаётся.

Чтобы распознавание речи работало наиболее точно, нейросеть нужно тренировать на записях, которые наговорили именно на это устройство. Нет смысла брать нейросетевую модель из «большой» Станции, потому что её эффективность в Станции Мини будет уже не так высока.

Эту задачу можно решать разными способами. Например, нанять людей, чтобы они по бумажке зачитывали колонке фразы. Но мы получим мало записей, которые не похожи на настоящие обращения пользователей, потому что в реальности записи содержат непредсказуемый шум, наложения голосов и многое другое.

Поэтому мы не стали экономить на качестве и сразу заказали на фабрике несколько сотен готовых колонок, которые раздали участникам закрытого бета-тестирования в Яндексе в обмен на помощь в обучении нейросети. И это сработало.

Кстати, от аппаратной кнопки Mute, которая обесточивает микрофоны и отключает «слух» Алисы, отказываться не стали. Никакой особой сложности устройству она не добавляет и теперь находится сбоку.



А вот от остальных кнопок отказались. И здесь начинается самое интересное.

Добавляем магию и лазер


Взгляните на фотографию ниже. Это вид сверху на обе наши Станции. Сегодня мы не будем говорить о дизайне — попробуйте найти другое важное различие.



Обратите внимание: кнопок нет. И нет вращающегося кольца для регулировки звука. Если мы делаем маленькое, лёгкое устройство, почти вся электроника которого умещается на одной плате, то механические элементы только усложняют проект и увеличивают габариты.

Голос — наиболее естественный способ управления умными колонками. Но бывает, что человек говорит по телефону или обедает, поэтому дублёр всё же нужен. И мы нашли вариант. Причём не менее естественный.

Представьте себе: вы совершаете жест рукой — и любимая песня становится громче. Или просто кладёте на колонку ладонь — и будильник выключается.

Итак, как работает магия с жестами? За неё отвечает датчик глубины, который спрятан под крышкой устройства. Вот так он выглядит на плате при значительном увеличении (длина в реальности — всего 4 мм, толщина — и вовсе 1 мм):



Это вертикально излучающий инфракрасный лазер с длиной волны 940 нм в связке с принимающим фотодиодом. Луч отражается от препятствия над колонкой и возвращается. А так как скорость света известна, то можно в любой момент определить расстояние до объекта.



Кажется, достаточно купить датчик и подключить его к плате, чтобы всё отлично работало. Но нет.

Датчик спрятан внутри, над ним находятся отверстия в корпусе (а иначе как бы он работал). А значит, пыль и прочий мусор могут исказить измерения.

Нужна защитная пластина, которая накроет лазер и фотодиод, но при этом уместится в корпусе. Её материал строго регламентирован, поскольку далеко не все виды пластика хорошо работают в ближнем ИК-диапазоне. При большом желании из стекла тоже можно вырезать, но это достаточно сложно, а значит, очень дорого.



Более того, каждая защитная пластина производится методом литья и уникальна в буквальном смысле. Невозможно изготовить две идентичные пластины. А значит, каждая из них по-своему влияет на распространение луча. Если это не учесть, то мы получим погрешность в измерении расстояния.

Каждая новая Станция Мини проходит на конвейере этап калибровки датчика, чтобы учесть индивидуальные особенности линзы. Проще говоря, чтобы устройство воспринимало препятствие на высоте 15 см именно на этой высоте. Калибровка примерно так и происходит. Берутся листы из материалов, похожих на фотобумагу, но не пропускающих ИК-диапазон, и статично размещаются на известной высоте.

В итоге мы дошли до этапа, когда нужно протестировать точность работы датчика в собранном устройстве. Но оказалось, что готового промышленного приспособления для этого просто не существует. Ничего не поделать — соорудили свой аппарат. На фото ниже можно увидеть первый прототип в нашем офисе в Москве, собранный буквально из листов фанеры, распечатанных на 3D-принтере втулок, двух моторчиков и контроллера для управления ими. Эта штука автоматически перемещает платформу, имитирующую руку, над колонкой, чтобы оценить, насколько точно датчик определяет расстояние.



Чистовые экземпляры позже отправили на производство.

Стабилизируем питание


Самое время вспомнить об электропитании, о котором мы обещали рассказать выше.

Колонка потребляет энергию. В среднем немного, меньше 5 Вт даже на высокой громкости. Но, в отличие от многих других маленьких бытовых приборов, её потребление крайне неравномерно. Мы заметили этот эффект на раннем прототипе, когда использовали датчик жестов одновременно с прослушиванием вот этого трека:


Попробуйте угадать, что с ним не так? Резкие переходы к низким частотам. А чем низкие частоты отличаются от высоких? Амплитудой колебаний диафрагмы динамика. Чем она выше, тем больше энергии потребляет устройство.

Добавьте к этому управление жестами, голосовые команды, сетевой трафик — и вы получите короткие, но непредсказуемые мгновения, когда потребление подскакивает настолько, что простые блоки питания просто не справляются с поддержкой стабильного напряжения. Например, типовые зарядки для смартфонов на такое не рассчитаны, потому что у этого класса устройств есть аккумулятор и потребление достаточно равномерное. Колонка же, если питающее напряжение кратковременно просядет, может просто перезагрузиться.

Чтобы избежать этой проблемы, мы тестировали прототипы на звуке частотой 100 Гц. Именно на ней динамик создаёт наибольшую нагрузку. Наш внешний блок питания хоть и выглядит, как типовая зарядка с USB Type-C на 1,5 ампера, но готов к таким ситуациям. Более того, мы понимаем, что люди могут подключать собственные блоки питания, поэтому при разработке заменили внутренние преобразователи питания (так называемые DC-DC конвертеры) теми, которые способны выдержать кратковременные просадки напряжения. Конечно же, сторонние блоки питания бывают разные, мы их не тестируем и не рекомендуем, но решение с заменой преобразователей помогает.

Кстати, ещё мы учли пожелания пользователей: у белой Станции Мини белый блок питания и провод. Мелочь, а приятно.

Придумываем жесты


Стабильно работающие устройство и датчик — это только половина дела. Осталось придумать сами жесты. Лучший способ что-то придумать — собрать максимум идей, а потом поэтапно их отфильтровать и проверить. Мы так и поступили: организовали внутренний хакатон с призами. Любой сотрудник компании мог предложить и сразу реализовать свои жесты для устройства. В Яндексе такой подход хорошо работает.

Вариантов было много. Отсеивали мы их по нескольким критериям, но наиболее важных — два. Во-первых, если функция популярна и требуется часто, то и жест для неё должен быть простым и легко воспроизводимым. Во-вторых, удачный жест интуитивен. Можно написать инструкцию, снять обучающее видео, но всё это менее эффективно, чем старая добрая интуиция.

Мы быстро определились с жестом «Алиса, хватит». Пользователи уже привыкли просто класть руку на будильник, телефон, умные часы, чтобы остановить звук.

А вот с жестом регулировки звука всё оказалось не так очевидно. У нас было два варианта-победителя. В обоих подразумевалось, что звук регулируется с помощью воображаемой вертикальной шкалы над колонкой. Но достаточно ли просто поместить руку над колонкой: чем больше расстояние, тем выше громкость? Или лучше взять относительную шкалу и перемещать ладонь вверх/вниз для плавного изменения громкости?



Для поиска ответов на подобные вопросы хорошо подходит UX-тестирование. В Яндексе для этого создана специальная лаборатория: мы приводим туда людей с улицы и наблюдаем за тем, как они пользуются продуктом. Эта практика довольно полезна.

Мы надеялись, что на UX-тестировании однозначно победит один из двух вариантов. Но не в этот раз. Поведение людей разделилось примерно поровну. А значит, нужно проверить оба варианта. Так мы и сделали в рамках бета-тестирования, и его участники достаточно быстро указали на существенный недостаток абсолютной шкалы. Такой вариант приводит к тому, что случайный взмах руки (или полёт кота) могут неожиданно включить максимальную громкость. А это неприятно.

Вариант с относительной шкалой победил. Хотя и были доработки на основе отзывов пользователей беты. Например, добавили эвристику от случайных падающих предметов: чтобы звук менялся, ладонь должна на мгновение зависнуть на одной и той же высоте и только потом перемещаться. А ещё добавили звуковую индикацию уровней громкости, чтобы человек слышал, на сколько именно шагов он её изменил.

На этом можно было бы и закончить историю, но коллеги, работающие над жестами, оказались большими любителями музыки и нестандартных способов её воспроизведения.

Добавляем гравицапу


В ходе работы над жестами родилась такая идея: с помощью движения рук не только регулировать громкость, но и создавать музыку. Позднее мы вспомнили, что эта идея уже применяется в терменвоксе. Этот электромузыкальный инструмент создал в 1920 году советский изобретатель Лев Сергеевич Термен. Терменвокс работает так: движения рук изменяют ёмкость его колебательного контура и, соответственно, частоту звука. Просто послушайте самого изобретателя:



Классический инструмент Льва Термена использует электромагнитное поле и две антенны: для управления громкостью и высотой звука. У нас же есть только один инфракрасный луч, поэтому управлять можно чем-то одним. Громкость мы взяли за константу.

Разработать новый режим нам помог Пётр Термен — композитор и исполнитель на терменвоксе, правнук Льва Термена. А музыкант-экспериментатор Антон Маскелиаде и студия Monoleak создали для синтезатора инструментальные стили: от привычных пианино и гитары до необычных мечей и кастрюли. Можно играть даже космическую музыку — достаточно сказать: «Алиса, дай звук гравицапы». В коллекции уже есть несколько десятков инструментов, и она будет пополняться.

В терменвоксе малейшее движение руки изменяет частоту звука. Нужно быть профессионалом с крепкой рукой, чтобы точно попадать в ноты и воспроизводить что-то мелодичное. Мы же хотели, чтобы на нашей колонке играть музыку могли все. Поэтому для многих инструментальных стилей разделили воображаемый луч на сегменты, каждому из которых присвоили определённый звук.

Кстати, изначально режим синтезатора развивался как личный проект одного из наших коллег. Но дети, которых мы также приглашали на UX-исследование, с большим энтузиазмом отнеслись к новому режиму. Так мы поняли, что не надо скромничать и стоит довести личную инициативу до продукта.

***


Сегодня мы показали, что даже за небольшим и на первый взгляд простым устройством скрывается целая история и многочисленные технологические решения. Какие отдельные рассказы вы бы хотели услышать более подробно?

Мы верим, что будущее за голосовым управлением, ведь во многих случаях просто сказать — гораздо удобнее и естественнее, чем нажимать на кнопки. И новое устройство — ещё один шаг в этом направлении.

Комментарии (118)


  1. balamutang
    09.10.2019 12:50
    +1

    Вся эта штука с ик светодиодом-датчиком и синтезатором очень близка к D-Beam компании Roland, по патентам проверьте-подстрахуйтесь


    1. yvm
      09.10.2019 21:40

      «Вся эта штука» первое что приходит в голову, когда видишь TOF сенсор


      1. balamutang
        10.10.2019 18:23

        у Роланда был не TOF, там просто яркость пятна от ИК диода измерялась, калибруется вручную через меню синтезатора. 20 лет назад технологии были чутка подремучее :)


  1. vilgeforce
    09.10.2019 12:53
    +1

    «от аппаратной кнопки Mute, которая обесточивает микрофоны» — кнопка с фиксацией?


    1. spc
      09.10.2019 13:07
      +1

      Нет, там D-триггер.


  1. madf
    09.10.2019 12:55
    +1

    Угу и датчик полностью бесполезен при попадании солнечных лучей (т.к. солнышко имеет широкий диапазон излучения (не только в видимом спектре). :)
    В общем, когда открываешь статью с подобным заголовком, ожидаешь увидеть не стандартный набор картинок, а побольше «внутренностей».


    1. BarakAdama Автор
      09.10.2019 13:18
      +1

      Под прямыми солнечными лучами никакое устройство лучше не держать. Особенно летом :)


      1. madf
        09.10.2019 13:57
        +2

        Есть страны, где лето круглый год и интенсивность/продолжительность солнца в разы больше. И в таких странах жизнь продолжается, причем не нищая, цивилизация. Техника там функционирует нормально, да, есть свои нюансы, но в конечном остатке всё — ок.


    1. Paskin
      09.10.2019 22:41

      Все не так однозначно ;) Также как и в радарах, использование навороченной модуляции сигнала в сочетании с мощным DSP позволяет выделять сигнал даже из сильных помех.


      1. madf
        10.10.2019 11:27

        Однозначно, в колонке это так и сделано? Если «нет», то голословно (подобно философии)?


        1. Paskin
          10.10.2019 14:09

          В ToF-датчиках это сделано уже на уровне самой сборки. Там блок из лазера, матрицы и DSP из которого "торчит" только вход питания и SPI/I2C шина


  1. GennPen
    09.10.2019 13:02

    А что на счет простых жестов влево-вправо-вверх-вниз? Как колонка определяет с какой стороны находится пользователь? Ведь она не всегда находится ровно передом к пользователю, да и движения рукой не строго направлены в нужную сторону, и получается что хочешь сделать движение влево-вправо, а срабатывает вверх-вниз.


    1. BarakAdama Автор
      09.10.2019 13:05

      Жеста влево-вправо сейчас нет. «Вверх-вниз» для управления громкостью и синтезатора (громкость в этом случае константа), а также жест «накрыть рукой» для отключения звука.


      1. GennPen
        09.10.2019 13:34

        Немного не правильно выразился, не «вверх-вниз» а «вперед-назад».
        Так датчик получается только один? По картинке почему-то подумал что их четыре, наверное по кол-ву отверстий на верхней крышке.


        1. BarakAdama Автор
          09.10.2019 13:38
          +1

          Это отверстия для микрофонов. У колонки по кругу идут другие отверстия. Вот два из них — это датчик. Да, он один.


  1. trojan218
    09.10.2019 13:04
    +3

    а зачем это на гигтаймсе?)))) вот если бы кто-то написал статью как применять это устройство вне «экосистемы» яндекса… для дома… потому что так безопастнее ) то да))


    1. BarakAdama Автор
      09.10.2019 13:10
      +1

      Вы можете транслировать на неё звук с другого устройства по голубому зубу. Или управлять голосом своей (даже самодельной) железкой, подключив её к платформе умного дом.


      1. Mogwaika
        09.10.2019 14:17
        +3

        Уже без сертификатов можно? Локальный режим управления (не распознавания) приделали?


        1. BarakAdama Автор
          09.10.2019 14:20
          +2

          Нет, тут без изменений.


      1. rainwall
        09.10.2019 16:20

        Уточните, пожалуйста, как привязать самодельную железку? Очень интересная тема, но информацию не нашел.


        1. BarakAdama Автор
          09.10.2019 18:40
          +2

          Если упростить: вы создаёте своё железо, которое управляется из вашего облака, а потом связываете это облако с нашим облаком через api. Вот писали на старте: habr.com/ru/company/yandex/blog/453080


  1. spc
    09.10.2019 13:05

    Так как я (хвастаюсь) делал себе лампочку с управлением жестом (яркость, оттенок, режимы), то сразу вопрос: такую Алису поставишь на полку, где места меньше 15 см до крышки — и все, крышка, не будет работать?


    1. BarakAdama Автор
      09.10.2019 13:21
      +4

      О, это тоже отдельная микроистория. Мы эту ситуацию поймали на закрытых тестах. Алгоритмически добились того, чтобы колонка запоминала, что над ней постоянное препятствие. Жесты будут работать.


      1. spc
        09.10.2019 13:22

        Ну то есть автокалибровку по высоте вы тоже сделали )


  1. nemilya
    09.10.2019 13:14
    +1

    Спасибо за рассказ, "джедай" управление это круто)


  1. azzas
    09.10.2019 13:17

    Маленькое устройство с, скорее всего, относительно слабыми динамиками, которое может проигрывать музыку и что то искать в интернете и озвучивать это голосом. Мне кажется что только из за интеграции с другими устройствами умного дома оно может быть интересно гикам, но никак не обычным пользователям, потому как для них при цене в 4 тысячи девайсина с ооооооооочень ограниченным фунционалом. Регулирование громкости жестом ПРЯМО НАД КОЛОНКОЙ — оооочень сомнительная фича, как будто студенты схемотехнику осваивают. Купят ради встроенного терменвокса, запилят обзор и отложат на пыльную полку.


    1. spc
      09.10.2019 13:21
      +1

      По всяким акциям Алиса (лицензионная, на чужом железе), бывает, стоит 2К. Это, конечно, дороже просто китайской Bluetooth-колонки, но это и не просто китайская колонка.


      1. Nikolai46
        10.10.2019 08:58

        Alexa Echo Dot по акциям продаётся за $20, но там лазеров нету


        1. spc
          10.10.2019 10:06

          Рискну предположить, что это по акциям за бугром и, соответственно, надо будет добавить еще стоимость доставки. Плюс я так понимаю, у Алисы с русским языком получше будет.

          В общем, каждый выбирает свое.


          1. Nikolai46
            10.10.2019 16:14

            Я не про то что надо Алексу покупать, а про то что себестоймость должна быть ниже $20.


            1. artoym
              11.10.2019 10:56

              Амазон известен тем, что продаёт свою технику по себестоимости и даже ниже, чтобы получить больше пользователей для своих сервисов. Если человек сможет говорить «Добавь стиральный порошок в корзину», то точно будет чаще покупать на амазон.ком — вот и прибыль.


  1. trawl
    09.10.2019 13:24
    +2

    А как дела обстоят с приватностью?
    Используются ли данные, полученные с микрофона в таргетировании рекламы или других целях?


    1. BarakAdama Автор
      09.10.2019 13:33
      -4

      Колонка передаёт в облако и распознаёт только те фразы, которые содержат активационное имя «Алиса».


      1. JC_IIB
        09.10.2019 14:12
        +4

        Колонка передаёт в облако и распознаёт только те фразы, которые содержат активационное имя «Алиса».

        А как это отвечает на вопрос об использовании данных в таргетировании рекламы или других целях?


        1. mapcuk
          09.10.2019 23:08
          +4

          Если PR-отдел уходит от ответа, то скорее всего "да".


        1. BarakAdama Автор
          10.10.2019 09:02

          Данные с микрофона колонки для рекламы не используются.


          1. Mogwaika
            10.10.2019 11:18

            *только в «других целях», значит.


      1. trawl
        09.10.2019 14:22
        +1

        Вы ответили на вопрос, который я не задавал. Я понимаю, что вопрос неудобный, но честный ответ получить очень хочется.


        1. BarakAdama Автор
          10.10.2019 09:00

          Прошу прощения за ожидание. Когда вы сказали про микрофоны, я подумал про окружающий шум, поэтому и ответил про активацию.

          Данные с микрофона колонки для рекламы не используются.


          1. Ergistael
            10.10.2019 18:11

            Простите, не могли бы вы конкретизировать: используются ли для рекламы данные, полученые колонкой? как?


      1. Mishootk
        09.10.2019 15:57

        Если в доме живет девушка Алиса?


        1. spc
          09.10.2019 16:03
          +3

          Тогда из приложения Яндекс меняете ник на Прасковья.


          1. NivoRAZH
            09.10.2019 19:58
            +5

            Девушке.


            1. dernuss
              10.10.2019 00:02

              Если девушке, тогда через паспортный стол)


        1. BarakAdama Автор
          10.10.2019 09:04

          Можно заменить активационное имя на «Яндекс».


          1. seventh
            10.10.2019 10:07

            А на Ok, Google можно? )


          1. thegreedylizard
            10.10.2019 13:01

            А если сына зовут Яндекс?)


            1. HellFir-e
              10.10.2019 16:34

              Тут надо менять родителя по гарантии


  1. MinimumLaw
    09.10.2019 13:32
    +1

    А расскажите о Вашей дружбе с отечественными САПР. И DeltaDesign в первую очередь. Очень любопытно.


    1. lelik363
      09.10.2019 15:36

      Вроде бы в Altium рисуют…


      1. MinimumLaw
        09.10.2019 17:06

        Нам DeltaDesign хвалился, что и они принимали участие. Вот и хочется послушать. В каких частях, и в каком качестве. И пошло ли в серию сделанное. А то авторы САПР это авторы САПР, а разработчики это разработчики (дипломатично, чтоб ненароком никого не обидеть).


  1. 3aBulon
    09.10.2019 13:54
    +1

    Алиса то может и научилась ставить ударения, но новости по запросу читает другой робот, когда вы его на курсы русского языка запишите?
    Ну а мини конечно мы не купим, у нас ирбисов и декспов куча есть. И вообще, +1 функция — не круто вышло, как по мне…

    Если это «прикроватная» Алиса, то хотелось бы в ней часы видеть, добавить китайские часики сквозь сетку динамика светящие — слабо?


    1. BarakAdama Автор
      09.10.2019 14:05
      +1

      Хорошее замечание про диктора. Спасибо, обсудим.


  1. YaMishar
    09.10.2019 14:15

    Интересный вариант для подарка дочке от ДМ.
    Вот интересно, у меня (я правда не искушённый пользователь гаджетов) безо всякого UX тестирования изначально сложился ответ, что абсолютная шкала — зло (может и не абсолютное). Именно от потенциально больших перепадов.
    Кстати, вместо звукового подтверждения регулировки или в добавок к нему я бы предпочёл световое. То есть поставил ладонь, задержал на н-секунд, станция зажгла светодиод, приглашая настроить звук. Лучше даже шкалу ещё выводить (если её ещё нет).


    1. BarakAdama Автор
      09.10.2019 14:18

      Визуальная индикация изменения громкости тоже есть. Мы звуковое к ней добавили, чтобы нагляднее было.


  1. gibson_dev
    09.10.2019 15:00

    Что то не нашел, а мультирум поддерживается колонками. Чтобы в комнате поставить большую и к телевизору подключить а на кухне кинуть маленькую?


    1. BarakAdama Автор
      09.10.2019 15:06

      Подскажите, пожалуйста, что подразумевается под мультирумом? Если вы про их координацию друг с другом, то пока такого нет. Но интересно услышать и другие идеи.


      1. gibson_dev
        09.10.2019 15:20

        Да скорее всего я имел ввиду координацию, ну и с помощью одной управлять другой


      1. BigD
        09.10.2019 15:47
        +2

        1. Фраза «Включи свет», сказанная в комнате, где стоит одна из колонок, включает только там.
        2. Включение музыки на всех или на одной по выбору.
        3. Естественно, координация — отвечать должна только одна.


        1. anko__2000
          10.10.2019 11:36

          И еще, чтобы музыка следовала за пользователем


      1. androidt1c
        10.10.2019 09:08

        Мне, например, хочется слышать одну и ту же мелодию во всех комнатах одновременно, чтобы несколько колонок звучали синхронно, создавая общее звучание во всей квартире. Такое возможно?


        1. zee
          10.10.2019 11:31

          Посмотрите в сторону Sonos.


          1. androidt1c
            11.10.2019 10:27

            Цены безумные, далеко не 4 тыс. (при этом, сайт у них кто-то криворукий делал: в ширину не влезает, как ни крути масштаб)


            1. zee
              11.10.2019 15:20

              Согласен, дороговато, но их колонки действительно классные. Для мультирум-решений, чтобы «несколько колонок звучали синхронно» — это даже дёшево.


  1. Makc_K
    09.10.2019 15:43

    Как бы «Алиса» не стала предвестником «Телеэкрана» из 1984 Оруэлла.


    1. CrzyDocTI
      09.10.2019 16:22

      Вы написали этот комментарий в предвестник «Телеэкрана»=)


      1. Makc_K
        09.10.2019 16:23

        Тогда уж скорее маленькому «Большому Брату».


  1. halted
    09.10.2019 16:15

    мы не стали экономить на качестве и сразу заказали на фабрике несколько сотен готовых колонок, которые раздали участникам закрытого бета-тестирования в Яндексе в обмен на помощь в обучении нейросети. И это сработало.

    Алиса сейчас очень популярное имя у детей. Колонка проходила бета-тесты в семьях, где имеются маленькие девочки по имени Алиса?


    1. FFxSquall
      09.10.2019 16:20

      Можно настроить на фразу «Яндекс»


      1. Misaka10032
        09.10.2019 16:28
        +1

        А если в семье мальчик «Яндекс»?


        1. balamutang
          09.10.2019 18:39

          Нет такого слова, которое не могло бы быть еврейской фамилией? :)


  1. veydlin
    09.10.2019 16:22
    +2

    Микрофоны у неё лучше? Очень хотелось чтобы её «слух» был как человеческий, я могу сказать слова на кухне, не превышая голос, и другой человек услышит их в комнате. А вот irbis не слышит если не подойти ближе, чем на 1 метр, приходится повышать голос, он у меня тихий по дефолту

    В 50% случаях я понимаю, что лежа за ноутом в кровати мне гораздо комфортней просто найти в поисковике информацию, чем повышая свой голос, что для меня очень неприятно и не комфортно, просить Алису

    А ещё иногда засыпая я вспоминаю про какое-то дело, мне нужно поставить напоминание, в этот момент не хочется прогнать свою дремоту и хотелось бы, чтобы Алиса услышала твои слова, которые ты сказал вообще шепотом

    И ещё вопрос, не рассматриваете идею, где есть одна станция которая берет роль вычислительного сервера, и много мини колонок, которые связываются с ней и расставлены по всей квартире? Очень удобно получать ответ от Алисы в любой точке дома


    1. BarakAdama Автор
      09.10.2019 16:57

      «Слух» определяется далеко не только чувствительностью уха микрофона, но и способностью «сложить из шума слова» в «голове». Насколько мне известно, ещё никто не смог превзойти или хотя бы повторить человеческий мозг в этой задаче, но мы с каждым годом всё ближе к этому.

      За идею спасибо!


      1. vlad_egrv
        10.10.2019 10:32

        синезубые микрофончики можно еще выпустить чтобы развешивать по разным точкам дома и улучшать слышимость


      1. xDimus
        11.10.2019 17:47
        +1

        Помниться в обсуждении Яндекс Станции прозвучало мнение, что микрофоны могли бы быть и получше. В Станции Мини они такие же как в Станции или другие?


  1. HRF
    09.10.2019 16:53

    Было бы здорово если на Яндекс/Мини сделали поддержку протокола AirPlay2/ChromeCast — тогда бы она стала более функциональной и вписалась бы в экосистему с другими устройствами


  1. zenkov
    09.10.2019 17:03
    +1

    Ну вот :( Это ж DEXP и Irbis только с какой-то ненужной технологией махания руками. Сегодня у Amazon увидал www.amazon.com/gp/product/B07MLY3JKV Часто бывает свободная розетка которую легко выделить для помощника. У Amazon реальные кейсы использования устройств, а для кого вы свои делаете непонятно абсолютно. Кто смотрит видео на Станции? Кто этот человек? Кто предпочитает махание распальцовкой двум обычным кнопкам? Покажите его.


    1. dobrman
      10.10.2019 13:11

      На сколько я слышал у декспа и ирбис все не так красиво с микрофонами. Махания рукой как я понял — способ избежать лишней механики в угоду простоте и минимизации устройства, думаю использование такого органа управления дело привычки и вполне может прижиться. И про экосистему, если я правильно понял, разработчики как раз и целят в управление умными устройствами, но при этом упор на любые устройства, а не только те на которых Y нарисовано, так что экосистему вы можете выбирать себе по вкусу, а управлять через Алису. Если есть желание конечно.


    1. goodic
      11.10.2019 06:48

      я иногда смотрю. Сначала на кинопоиске в телефоне ищу что именно. А потом «Алиса включи...» и делаю это только потому, что есть подписка и колонка когда-то из интереса была подключена к телевизору.
      Если просто хочешь посмотреть что наовго на YouTube то голосовое управление тут полностью бесполезно. Если не знаешь конкретно что ты хочешь, голосом «листать» списки крайне неудобно.
      Еще использую «Алиса, включи эфир» как замену телеканалов родственникам. Но такое. Проще на PS4 все же YouTube запустить или Netflix и не мучать себя и окружающих.


  1. MorskoyZmey
    09.10.2019 17:05

    HDMI в этой версии нет?


    1. BarakAdama Автор
      09.10.2019 17:12

      Нет.


  1. vapersan
    09.10.2019 17:40

    Хотим пример игры на этом синтезаторе


    1. BarakAdama Автор
      09.10.2019 17:40

      Вот тут есть чуть-чуть видео youtu.be/qJM9Dfyej5E?t=78
      А вот тут можно найти примеры звуков из текущей коллекции yandex.ru/alice/station-mini/soundeffects


  1. tbl
    09.10.2019 18:52

    В этой колонке пофиксили проблему, когда колонка из-за узкой щелевой направленности микрофонов не слышит источник звука, который находится над ней в шумной комнате?


  1. 117
    09.10.2019 19:07

    Выход этой версии никак же не связан с подорожанием предыдущей версии на 1000 рублей, правда?


  1. Alex022
    09.10.2019 19:55
    +1

    Почему бы не сделать у такой колонки аудио вход, чтобы её можно было бы использовать и как УМНУЮ и как просто компьютерную колонку, тогда можно поставить на стол умную колонку и освободить место от компьютерных колонок. Просто, когда речь идёт о колонке подсознательно представляешь, что её можно использовать для подключения к компьютеру, ноутбуку, смартфону, а тут оказывается, что нельзя вот и получается КОГНИТИВНЫЙ ДИССОНАНС). Простое решение — добавить аудио вход (или возможность работы в качестве Bluetooth колонки), и насколько повышается функциональность и удобство в использовании для потенциальных пользователей, это может способствовать повышению продаж. Моё мнение.


    1. BarakAdama Автор
      09.10.2019 19:57

      Её можно использовать как bluetooth-колонку.


      1. Alex022
        09.10.2019 20:00

        Отлично!


      1. Zetoris
        09.10.2019 20:41
        +1

        Спросил сегодня у поддержки на счёт aptx, оказалось что его нет, и как я понял никакого другого HD кодека нет тоже? Просто, если у колонки есть выход на большую акустику, то хотелось бы чтоб звук по блютузу был качественный и без отставаний, чтобы станцию можно было использовать как аудио-хаб для звука с телефона и ноутбука.


      1. K0styan
        10.10.2019 12:23

        А мультипойнт поддерживает?


  1. Azya
    09.10.2019 21:12
    +1

    А есть где-то информация, или может быть вы расскажите, как используются записи, хранятся ли, сколько хранятся, как анализируются тп? К примеру недавно узнал, что для улучшения качества распознавания, некоторая часть записей передаётся на аутсорс и например воспроизводится публично, что хоть и обезличенно, но не очень приятно.


  1. dernuss
    09.10.2019 21:29

    Это вертикально излучающий инфракрасный лазер с длиной волны 940 нм в связке с принимающим фотодиодом.

    Очень похож на VL53L0X


  1. iva2000
    09.10.2019 22:08
    +1

    Две колонки в одной комнате объединяются в одну суперколонку с большим количеством распределенных микрофонов и разнесенными динамиками? Множество деревьев становится лесом? Ну или хотя бы две колонки не мешают и не перебивают друг-друга?
    Две колонки справа и слева от компьютера образуют акустическую систему 2.0? А две маленькие колонки и одна большая образуют акустическую систему 2.1?


  1. Psychosynthesis
    10.10.2019 03:41

    Три ватта всё-таки маловато… Хотя бы 10 было б…


    1. solariserj
      10.10.2019 11:39

      Согласен, ибо простая станция мне хватает на 2 комнаты, в 3 и на кухне уже не так слышно. Для 1-2 комнатной квартиры ок, но 3х и более уже не достаточно. Поэтому и подумал что хорошо если это будет дополнение к основной станции с удалённой колонкой и микрофоном для кухни.


  1. Akr0n
    10.10.2019 08:48
    -1

    Я верно понимаю, что согласно GDPR, Яндекс обязан давать пользователю возможность:
    1. Просмотреть, что там наслушала\насобирала Алиса за время пользования, какие сделала выводы по таргетингу\привычкам пользователя.
    2. При желании, полностью удалить все эти данные.
    Как это сделать?


    1. Andrey_Rogovsky
      10.10.2019 09:05
      -1

      Написать в головной офис ФСБ, там тебя вызовут и товарищ майор все про тебя расскажет.


  1. Andrey_Rogovsky
    10.10.2019 09:04
    -1

    Яндекс.Станция — ФСБ еще никогда не было так близко к тебе, юзернейм.


  1. Veeh
    10.10.2019 09:07
    +1

    А что насчёт качества звука?
    Да и вопрос как идёт разделение аудиовыхода на аккустику? К примеру если я подключил колонку к аудио ресиверу то он должен быть всегда включен потому что звук будет идти только через него или есть разделение, музыка только через аудиовыход, а общение через встроенный динамик?


  1. solariserj
    10.10.2019 09:11
    +1

    > Отказ от пультов и кнопок в пользу голоса — ключевая особенность нашей платформы.
    А вот как раз и не хватает пульта, в дополнение к голосу. Кричать Алиса потише, когда играет громкая музыка, или Алиса выключись из коридора при выходе. Да и вообще говорить когда вокруг все спят не хочется. Это ещё когда она не понимает правильно запрос, так хочется взять и о редактировать одну букву/слово Поэтому пульт или лучше приложение для телефона самое то для дублирования команд.
    Копка Mute прикольно но мне чаще была необходима кнопка выкл/вкл. Можно и поменьше на задней панели, но чтоб была а так приходилось тянутся за стол чтоб выдергивать из резетки не очень удобно.


  1. Tachyon
    10.10.2019 09:20

    От калибровки оптики...
    то есть она сейчас не только подслушивает, но и подглядывает? (сарказм конечно).
    Нужна защитная пластина, которая накроет лазер и фотодиод, но при этом уместится в корпусе. Её материал строго регламентирован, поскольку далеко не все виды пластика хорошо работают в ближнем ИК-диапазоне. При большом желании из стекла тоже можно вырезать, но это достаточно сложно, а значит, очень дорого. Более того, каждая защитная пластина производится методом литья и уникальна в буквальном смысле. Невозможно изготовить две идентичные пластины. А значит, каждая из них по-своему влияет на распространение луча. Если это не учесть, то мы получим погрешность в измерении расстояния.

    Что-то я сомневаюсь что литьё из спец пластмасс, и калибровка КАЖДОГО устройства обойдётся дороже, чем просто вырезать квадратик из стекла.


  1. spc
    10.10.2019 10:11

    Кстати, забудем про мультирум, aptX, многоканальную группировку и прочее, что превратит Алису в никому ненужного монстра за 100500 рублей.

    Вы лучше скажите, почему когда просишь ее включить Шопена и приходишь через час, то Алиса вместо классики наяривает Брайана Адамса? Что у них вообще с Шопеном было?


    1. dobrman
      10.10.2019 13:18

      Все просто, включила Шопена, стало скучно, поняла что кроме нее Шопена ни кто все равно не слушает и решила выбрать композицию на свой вкус Хорошо что не Шнура включила :)


    1. goodic
      10.10.2019 14:53
      +3

      После того как Станция проигрывает 1 трек по запросу (или все что есть по исполнителю) включается трек-лист на основе ваших предпочтений/похожая музыка с уклоном в сторону ваших предпочтений (а там как с википедией, пара переходов и читаешь про неудавшегося художника)


      1. spc
        10.10.2019 15:01

        О как. Я часто встречался с тем, что она по завершении списка замолкает. Но теперь надо будет плотно побеседовать с домашними. Потому что вчера кроме Б. Адамса, Алиса еще и Рамштайна врубила.


        1. BarakAdama Автор
          10.10.2019 16:03
          +1

          Скажите: «Алиса, давай познакомимся». Она запомнит ваш голос и запросы других членов семьи не будут влиять на ваши рекомендации. Эта возможность сейчас тестируется.


          1. goodic
            10.10.2019 16:21

            О. Попробую. Если станций несколько, с каждой знакомитья или на уровне аккаунта все подхватят?


            1. BarakAdama Автор
              10.10.2019 19:32

              Если модели разные, то познакомиться сейчас стоит на обеих. Проверить потом легко так: «Алиса, как меня зовут».


  1. GORKOFF
    10.10.2019 12:14

    Всем Яндекс.Станция хороша, но как не удавалось подключить к ней умный дом от Xiaomi, так и не удаётся, хотя поддержка заявлена.


    1. goodic
      10.10.2019 14:50

      У меня Алиса через аккаунт Xiaomi не только пылесосом и ночником управляет, но и устройствами Sonoff.


  1. goodic
    10.10.2019 14:48

    Казалось бы, вот оно. Микрофон для Алисы в коридор что бы и там голосовое управление стало доступно. Но пока они не научатся понимать, что их несколько в доме (и в каких помещениях они стоят), простое «Алиса, включи музыку» приведет к тому, что сразу несколько колонок начнет воспроизводить хоть и одно и то же, но с разной задержкой. Начните хотя бы с привязки к помещению что бы можно было сказать «Алиса, включи музыку в кабинете»?


    1. anko__2000
      11.10.2019 11:38

      Не одно и то же, разное


      1. goodic
        11.10.2019 11:47

        я больше одного трека не слушал в таком режиме. А начинают обычно с одного и того же все три колонки.


  1. SantyagoNN
    10.10.2019 19:33

    Сделайте Яндекс.Станция.Робот.Пылесос. :)
    Всегда ездит за хозяином, убирается за ним, хорошо его слышит.


  1. Face_of_Boe
    10.10.2019 19:33

    Сделайте еще возможность автоотключения по таймеру, пожалуйста) Говоришь ей, «Включи такую-то музыку на полчаса» и засыпаешь под любимую музыку


    1. BarakAdama Автор
      10.10.2019 19:34

      Уже. Можно просто сказать: «Алиса, выключил музыку через ...».


  1. Akr0n
    11.10.2019 03:16

    Со сценариями сделано неюзабельно. Можно выполнить только одну голосовую команду на Станции, и что-то переключить на розетках\лампочках.
    А если я хочу послушать погоду, потом новости, потом включить музыку — все одним сценарием? Неужели так сложно реализовать добавление в сценарий нескольких запросов к Алисе друг за другом?


  1. Mogwaika
    11.10.2019 17:55

    Кстати, BarakAdama, тут отвечаете только вы, т.к. разработчикам запрещено отвечать, они могут отвечать, но боятся наболтать лишнего из NDA или они пилят новую версию с утра до ночи и им некогда заходить на хабр?