Все вокруг говорят про голосовых помощников, Алису, Google Assistant, что они умеют, чего не умеют… А мы взяли и написали фреймворк для создания мобильных голосовых ассистентов. Да еще и с открытым исходным кодом! Пока мы это сделали только для Android, и теперь ищем крутого iOS-разработчика, кто с легкостью портирует Kotlin код на Swift.

Под катом рассказываем, зачем мы вообще это делаем, что у нас получилось и кого именно мы ищем в команду Aimybox.



Так получилось,


что мы в Just AI уже давно занимаемся говорящими роботами, голосовыми ассистентами и всякими чатботами. Под капотом у нас свои технологии NLP (процессинг естественного языка) и целая платформа, визуальные конструкторы и все-все-все.

Тем временем рынок говорящих устройств


и приложений растет и цветет! Не только Amazon, Google, Яндекс – десятки компаний, от мала до велика, стремятся создать и запустить своего голосового помощника или девайс.

«Зачем? Кому оно надо?»


– восклицают пользователи. А им говорят – «Голосовой помощник – это же круто! Скоро все только с ними и будут разговаривать!». Нет, оно, конечно, удобно. Если помощник умный, понимает всё-всё и работает быстро-быстро. Но если посмотреть на это дело с другой стороны, то мы увидим, что…

Бизнесу нужна одна голосовая функция


Ну или парочка. Но самое важное – нужно быстро и с легкостью добавить голосового помощника в уже существующее мобильное приложение. И чтоб его после этого можно было кастомизировать как угодно.

Как это выглядит на практике. Есть мобильное приложение, в нем много кнопок и всяких других UI-элементов. Например, мобильный банк. Что хочет банк? Чтобы в приложении появилась кнопочка микрофона, пользователь на нее нажимает и говорит: «Переведи деньги маме». Вместо трех тапов по экрану – один. Дальше приложение может просто открыть один из своих экранов с уже заполненным полем получателя.

Или вот: «Где выдают доллары?». И приложение открывает карту с банкоматами нашего банка, которые умеют выдавать это дело в радиусе километра от пользователя.

Что сложного?


Казалось бы, просто добавил кнопку в приложение, подключил какое-нибудь распознавание речи, синтезатор речи, NLP-движок там, сделал красивый GUI со скроллом, с отображением процесса распознавания речи (чтоб не хуже, чем у Google), все синхронизировал, протестировал. Баги отловил. Понял, что все не так просто…



Вот мы и подумали,


что можем создать фреймворк, который всю эту сложность прячет под капот (покрытый тестами) и позволяет разработчику быстро добавить голосового помощника с нужными функциями в его уже работающее мобильное приложение. Мы же давно съели всех собак на пути создания голосовых приложений и знаем, какие там подводные камни.

Что получилось




Aimybox! Открытый, бесплатный, кастомизируемый SDK и готовый голосовой помощник, которого можно добавить в свое мобильное приложение, словно онлайн-чат на сайт. В нем мы воплощаем весь свой опыт создания речевых решений. Но при этом не завязываем ассистента на какие-то конкретные движки распознавания, синтеза и NLP. Ну чтобы можно использовать в своем ассистенте любые движки независимо друг от друга, а Aimybox правильно синхронизирует их работу. А еще у него красивый UI!

Вот что мы рассказывали про Aimybox на конференции по разговорному AI Conversations:


Опенсорс при этом действительно рулит,


потому что сторонние разработчики (те же банки) должны иметь полный контроль над тем, что они встраивают в свои приложения. Это все-таки голосовой интерфейс, мало ли что он там делает внутри…

А там внутри


есть уже готовые модули различных движков распознавания и синтеза речи, NLP и голосовых активаций. Есть готовый кастомизируемый GUI ассистента. Есть документация и пример того, как это все легко и просто внедрить в свое приложение. Но все это пока только под Android!

Поэтому мы ищем iOS-мастера,


который горит желанием не бесплатно присоединиться к проекту и портировать Kotlin на Swift. И готов создать первого в мире открытого голосового ассистента под iOS, код которого нестыдно опубликовать на Github на всеобщее порицание сообщества.

Вдруг ты – тот самый, кто умеет читать прекрасный Kotlin и писать не менее прекрасный Swift? Пиши на che@just-ai.com. Тебя ждет команда Just AI, мир голосовых ассистентов, распознавания и синтеза речи, NLP и отличный повод вписать еще один классный проект в свое портфолио!

Комментарии (0)