Голосовой помощник – стремительно развивающийся тренд. Контакты своего голосового помощника скоро будут давать также, как раньше давали контакты секретаря или офиса. Некоторые платформы предлагают создать себе голосовых помощников самостоятельно и будто бы для этого не нужны навыки программирования.
Предыстория
У меня уже есть опыт создания голосовых роботов разного уровня сложности.
Как-то мой брат озадачился завести себе голосового помощника. Ему были названы платформы с визуальным «nocode» редактором, и казалось, что задача решена. Велико было удивление, когда брат позвонил и сказал, что там совсем ничего не понятно. «Как там может быть что-то непонятно? Там все понятно, специально же для обычных людей сделано.» - думал я. «Берешь квадратики, соединяешь стрелочками, все же просто.»
Договорились встретиться в кафе, чтобы продемонстрировать, как легко и просто за 5 минут создать себе голосового помощника уровня «привет – как дела – пока». Ну а дальше - если идея понятна, то повторяй и улучшай.
Но!
Это занимает 5 минут на привычном десктопе с большим экраном. Когда же в кафе зашли со смартфона – все совсем не так, действительно ничего не понятно.
Похоже на то, как если человек давно живет в своей квартире и хорошо в ней ориентируется, то при выключенном свете он также найдет кухню, чайник, посуду. Но если он пришел в гости первый раз, и выключили свет, то уже сложности.
Так и здесь. Хорошо, что я реально знал, где что находится, и по визуальной памяти соединил несколько квадратиков. И то с огромными усилиями, ругательствами, и минут за 40, а не легко и просто за 5.
Итак, что же у нас есть распространенного, чтобы обычный человек, непрограммист, мог «легко и просто» создать себе голосового помощника.
AimyLogic
Платформа с визуальным «безкодовым» редактором.То есть на экране есть квадратики, в них можно вносить различные данные, и соединять квадратики стрелочками.
Плюсы:
На большом экране все очень удобно и понятно.
Голосового помощника уровня «привет – как дела – пока» создать действительно легко.
Созданного помощника можно подключать ко многим провайдерам телефонии и другим каналам.
Наличие бесплатного тарифа, регистрируешься и осваиваешься.
Минусы:
Экрана смартфона явно не хватает на виджеты платформы.
Если делать помощника посложнее, например, хотя бы просто много вопросов и много ответов, то нужно или очень большие квадратики, или много квадратиков, или добавлять считывание из базы, циклы, сравнения, а это уже относится к навыкам программирования
Дополнительно:
Связываться с другим сервисом через http-запрос – удобно программисту, довольно непревычно непрограммисту.
Обзвоны создаются легко, хотя обращение со списком номеров и отправление результатов диалогов себе в базу данных требует навыков программирования.
Огромный плюс: можно публиковать помощника/бота практически во все существующие каналы – телефон, telegram, Алиса и так далее.
Дальше можно погружаться в функционал платформы. Есть подключение синтеза голосов, распознавания речи, воспроизведение файлов, обучение нейронной сети и прочее, но это уже для тех, кто погрузился. Для программистов – удобно. Для непрограммистов – скорее сложно, чем легко и просто.
МТТ
Платформа с визуальным «безкодовым» редактором. Сам визуальный редактор очень похож на AimyLogic, даже особо нечего и обозревать.
Минус в том, что (возможно, но не точно) платформа предназначена для увеличения телефонного трафика МТТ со всеми соответствующими последствиями, то есть созданный помощник/бот остается в МТТ, не публикуется в другие каналы, никуда не переносится, и для начала работы нужно внести аванс порядка 20 000 рублей. Довольно дорого, чтобы просто человеку, не компании и не корпорации, что-то начать, попробовать, потестировать.
BotWinnik
Предельно упрощенный подход. Голосовой помощник создается в 1 клик – в telegram нужно нажать кнопку «Создать». Считается, что на этом голосовой помощник создан. Дальше предлагается перейти по индивидуальной ссылке в гугл-таблицу и там добавлять фразы возможного диалога. В одну колонку – фразы человека, в другую - фразы помощника. С помощником можно общаться по индивидуальной ссылке в интернет. Еще 1 кликом созданного помощника можно установить в Алису.
Система полностью соответствует статусу «безкодовая», так там совсем нечего программировать - нужно только добавлять фразы в гугл-таблицу.
Плюсы:
Все предельно просто при создании и применении.
Используются telegram и гугл-таблица, то есть удобно и со смартфонов.
Бесплатно.
Минусы:
В общем-то пока не совсем понятно, для чего именно такой голосовой помощник нужен, хотя уже прослеживается применение – вместо операторов отвечает на простые вопросы.
Вывод
Искусственный интеллект постепенно набирает обороты, инструменты создания голосовых помощников уже создаются и развиваются.
Все движется к тому, что в самое ближайшее время мы увидим аналогию с созданием сайтов – простого голосового помощника сможет создавать любой человек, просто задавая шаблон на конструкторе и добавляя контент и функционал. И конечно, управлять таким конструктором будет возможно голосом.
OlegZH
Правильно ли я понимаю, что голосовой помощник нужен для того, чтобы стать цифровым двойником человека, и заменять владельца в определённых ситуациях?
AnatolyBelov Автор
Скорее, помощник просто берет на себя часть функций.
Например, в самолете есть режим "автопилот". Компьютер не становится двойником человека, а берет на себя часть функций, с которыми может справиться.
Так и здесь. Голосовой помощник может взять на себя, например, ответы на часто встречающиеся вопросы. Или, наоборот, задавать вопросы по списку и фиксировать ответы.
А человек в это время может заниматься чем-то более творческим или другими более важными делами, например ходить в спортзал или играть с ребенком. Голосовой помощник в это время отрабатывает "рутину".