Многие подсознательно воспринимают умные колонки как что-то несложное в разработке. «Ну правда, что там такого: динамик, микрофон, светодиоды да Wi-Fi». Мы в VK захотели создать инновационный продукт, и в итоге прошли интересный путь от идеи до выхода на рынок нашей малышки для всех и каждого — VK Капсулы Нео. С виду вполне типичная умная колонка таит в себе технологические решения, которые в будущем постараются повторить в своих продуктах другие компании. 

Меня зовут Борис Каганович, я директор по разработке и производству умных устройств в VK. В этой статье я расскажу о том, как появилась идея создать колонку и какой путь мы прошли от идеи продукта до его реализации. 

От идеи до проекта

В 2020 году вышла первая умная колонка с Марусей — Капсула. Пандемия уже набирала обороты и в СМИ наперебой прогнозировали кризис полупроводников. Опыт предыдущих запусков и кропотливая работа с рисками помогли команде пройти путь к началу продаж без фатальных ошибок и потрясений. 

Уроки риск-менеджмента пригодились нам и во время работы над следующим продуктом — Капсулой Мини. Её запуск состоялся в 2021 году, в самый пик «чипагеддона» и антиковидных ограничений. У Капсулы Мини появилось несколько версий, построенных на разных аппаратных платформах. Так мы подготовились к возможным перебоям в поставках чипов, и, как выяснилось, не зря.

Первые два продукта показали игривый и живой характер Маруси. Капсулу можно было гладить по голове и она мурчала, а в Мини у Маруси появились выразительные глазки, которые мы назвали eyemoji. Размышляя над развитием линейки продуктов, команда сосредоточилась на том, что вызывало в наших пользователях эмоции от восторга до умиления. Так появился образ исключительно доступной компактной умной колонки с уютным дизайном и часами-глазками.

Мы в R&D-команде VK знали, что умные колонки в Китае достигли наиболее бюджетного сегмента рынка и активно там закрепляются. Поверить, что команда готова к созданию максимально бюджетной колонки с часами, получилось не сразу. Некоторое время было потрачено на исследования рынка, онлайн-встречи с производителями чипов и компаниями, которые уже прошли этот путь в Китае. К полученной информации в команде относились критически. Так, например, мы запланировали 12-15 месяцев от начала проекта до запуска серийного производства несмотря на то, что опыт китайцев указывал на 24-36 месяцев разработки.

Чтобы сделать продукт сбалансированным и востребованным у целевой аудитории, продуктовая команда колонки проверила довольно много гипотез. Часть продуктовых требований претерпела трансформацию уже в процессе разработки. Вот буквально несколько примеров:

Расположение элементов управления, микрофонов и датчика освещенности. Рассматривалось несколько вариантов с учетом эргономики, дизайна и оптимального расположения микрофонов и датчика. К выбору очевидного решения пришли не сразу.

Возможность повесить колонку на стену. У людей может быть занято место на столе, или уже есть другие умные колонки. При этом:

  1. Придётся в стену вбивать гвозди или вкручивать шуруп, на это многие покупатели не пойдут.

  2. Рядом с висящей колонкой должна быть розетка, а значит ей понадобится длинный провод, который далеко не всем будет удобен. 

  3. Маруся слышит лучше, когда колонка стоит на столе или другой горизонтальной поверхности.

Настенного крепления VK Капсула Нео не получила.

Промышленная кастомизация. Среди вариантов были нестандартные цвета и изображения персонажей, нанесённые на корпус колонки промышленным способом, прямо на фабрике. Вместо этого появилось максимально элегантное и лёгкое решение: в комплекте с колонками стандартных цветов прилагаются наборы разных наклеек с маскотами из социальной сети ВКонтакте. 

Риски

Их и правда было очень много. Мы решили делать колонку на RTOS — операционной системе, которую можно встретить в компактных гаджетах, вроде фитнес-браслетов, наушников и умных часов. Вот только раньше мы с ней не сталкивались, поэтому разработку под эту ОС пришлось осваивать на ходу. 

Выбор платформы

В момент выбора чипсета для Нео сбалансированных решений конкретно для умных колонок на рынке не было. В выборе пришлось полагаться не только на соответствие техническим требованиям, но и в ряде случаев на интуицию. ARM или RISC-V, минимально необходимый размер RAM и Flash-памяти, тип и количество интерфейсов для подключения динамиков, микрофонов, датчика освещения и дисплея — в условиях закрытых границ, медленной логистики и сжатых сроков проекта многое из этого команда выбирала без предварительного тестирования.

Разработка

Технологическое превосходство нашей новой платформы и самой RTOS, как ни странно, в её минималистичности. Разработчики оказались перед задачей поместить функциональность умной колонки в шестнадцать раз меньший объем памяти, чем был в других наших устройствах, и заставить ресурсоёмкие алгоритмы обработки речи эффективно работать на малопроизводительных процессорных ядрах.

Рынок платформ под RTOS оказался узким: большинство доступных нам чипсетов было предназначено для внутреннего рынка Китая, документация тоже была на китайском, весьма скудная, и писалась она под специфичные требования местных заказчиков. Пришлось искать баланс между полнотой документации, открытостью платформы, доступностью SDK и готовностью производителя к общению, пусть даже через посредника. В какой-то момент мы работали сразу с несколькими производителями, допуская, что основной уступит место резервному. Так и произошло. 

Документация на китайском, SDK надёжно защищен от Development. Ну, ОК. Перевели документы, нашли способ работать с SDK, который по неизвестным нам причинам несколько раз переезжал с одной версии ОС на другую, а потом обратно. Так команда приобрела экспертизу в RTOS.

Дизайн

У нас было несколько вариантов дизайна на выбор. Могли взять самые технологичные и дешёвые, но выбрали, конечно, самый лучший и красивый ???? Сложность сборки и стоимость корпуса оптимизировали по ходу проекта. Особенно заставил попотеть подбор материала и технологии покраски, чтобы светодиоды чётко и ярко светили через корпус любого цвета. Для каждого цвета колонки пришлось провести десятки экспериментов и тестов. 

Качество звука

Звук у всех Капсул отличный, и у команды есть задача улучшать его в каждом новом продукте. На звучание любой акустики огромное влияние оказывает корпус: его конструкция, объём, состав и толщина материала, плотность сопряжения деталей. Было интересно находить решение для сразу нескольких задач: например, упрощать (удешевлять) конструкцию, избавляясь от соединений, потенциально способных усилить вибрацию или вызвать дребезжание. 

Немало внимания потребовал и выбор конструкции акустической камеры — коробки, в которую монтируется динамик. Выбор стоял между открытой конструкцией с фазоинвертором, камеры с пассивным излучателем и так называемой закрытой конструкции — наиболее технологичной, но в теории обещающей более скромные частотные характеристики. Именно закрытая конструкция победила в тестах, показав сравнимую АЧХ с Капсулой Мини и меньший коэффициент нелинейных искажений. Результат настолько удивил, что тесты пришлось повторить несколько раз, чтобы сделать осознанный выбор.

В результате звучание у VK Капсулы Нео получилось сбалансированным, чистым и глубоким.

Алгоритмы распознавания речи

В предыдущих колонках у нас было четыре микрофона, а в VK Капсуле Нео — всего два. Новая конфигурация микрофонной решетки = новые алгоритмы обработки естественной речи. За рекордный срок команда машинного обучения VK разработала свои алгоритмы KWS и VQE (voice quality enhancement), которые распознают ключевое слово и естественную речь, а также очищают её от шумов и определяют направление до говорящего с колонкой человека. По качеству эти алгоритмы превосходят аналоги и работают ничуть не хуже, чем в старших колонках линейки.

Большие достижения маленькой команды

Ежедневные встречи команды разработки и постоянная коммуникация с поставщиками компонентов поддерживали максимальный приоритет нашего проекта в графике партнёров. Для каждого критичного компонента обязательно подбирался резервный вариант на случай форс-мажора.

Проект с самого первого дня был спланирован таким образом, чтобы лучшим сценарием для массового производства был запуск раньше плана, а допустимым — запуск точно по плану. Помогла в том числе тщательная проработка логистики образцов. Посылки с образцами колонок совершали кругосветные путешествия на космических скоростях, сохраняя проектный график. Проект заметно прокачал экспертизу логистической команды VK.

Анализируя успех проекта, следует отметить, что команды R&D VK и фабрики-партнёра фактически объединились. Общие задачи, общий трекер и общие цели победили расстояние в 7000 км, языковой барьер и разницу в менталитете. Менеджеры проекта с обеих сторон большие молодцы. 

Технологическое лидерство

Нам удалось занять свою нишу на рынке умных колонок: VK Капсула Нео стала самой дешёвой умной колонкой с часами. Команда разработчиков успешно подковала блоху всего с 16 МБ памяти, а команда продукта добавила к милым глазкам Маруси забавные стикеры и сохранила отличное качество звука для малышки Нео.

Новинка вызвала живой интерес у конкурентов и лидеров рынка электроники. Их представители приезжали на фабрику, просили образцы колонок и плат. Мы, конечно, осуждаем промышленный шпионаж, но готовы делиться опытом, если он полезен для рынка и не нарушает NDA. 

Мы освоили новую платформу, возможно даже первыми за пределами Китая. Научились оптимизировать код, многократно сжимая его размер и снижая требования к производительности процессора. Научились работать с новыми типами памяти и усилителей, с новой конфигурацией микрофонов. Разработали качественные, профессиональные встроенные алгоритмы обработки речи, заменившие сторонние решения во всех наших продуктах. Показали рынку путь к по-настоящему доступным умным колонкам.

Комментарии (21)