«Центр речевых технологий» (ЦРТ) разрабатывает платформу для создания голосовых ассистентов под рабочим названием «Варвара», рассказали «Коммерсанту» два собеседника, близких к компании. Варвара должна составить достойную конкуренцию Алисе от «Яндекса», а также американским «девушкам» Сири (Apple), Алексе (Amazon) и Кортане (Microsoft).
Как и «Яндекс», компания ЦРТ тоже рассчитывает поставлять голосового помощника по лицензии производителям сторонних продуктов, в том числе смартфонов и умных колонок. Соответствующие изделия «Яндекса» (колонка и смартфон) — это скорее технологические прототипы для демонстрации жизнеспособности технологии потенциальным партнёрам. Настоящую прибыль можно получить только от крупных контрактов на массовый продукт. Сейчас Алиса работает, например, в умных колонках сторонних производителей Irbis A и Elari SmartBeat, а также в умных часах Elari KidPhone 3G и наушниках Sony XPeria Duo.
Варвару можно будет встроить в любое устройство или приложение или подключить из облака. Предполагается, что она будет поддерживать биометрическую авторизацию (возможно, распознавание хозяина по голосу): «Ей можно доверить приватную информацию — к почте, мессенджерам или мобильному банку. Письма и сообщения она озвучит, только если услышит голос пользователя и распознает его как живого человека, а не запись», — сообщил один из собеседников «Коммерсанта».
В отличие от «Яндекса», у ЦРТ большой опыт в разработке речевых технологий. Компания успешно продаёт решения для распознавания и синтеза голоса, а также лицевой идентификации. Среди клиентов — банки, сотовые операторы, государственные и правоохранительные органы. По словам источников, ЦРТ ведёт переговоры с несколькими крупными компаниями. Выпускать собственную колонку не планирует.
Кроме Алисы и Варвары, в ближайшее время ожидается появление голосового помощника Маруся от Mail.ru Group, а «Тинькофф-банк» планирует запустить голосового ассистента под рабочим названием Олег.
Комментарии (21)
Ghool
26.03.2019 16:16Црт, если я верно понимаю, это ребята, которые купили прогу «читатель»
Читатель — было лучшее приложение для воспроизведения голого текста голосом. Конечно, воспроизведение прогой не сравнить с тем, как читает живой человек, но если выбирать из существующих — лучшее. Я через него много книжек послушал.
К сожалению, новые владельцы перестали развивать приложение и с апгрейдом ios на айфоне это приложение умерло :((
Ещё у них есть прога, которая из mp3 сделает word (типа файнридера для голоса).
Пару лет назад я проверял — работало так себе.
Но опять же, других решений просто нет :((
Если кто знает рабочую прогу на windows, которая умеет выдать в текст диктуемое голосом — поделитесь плизCHolfield
26.03.2019 16:26Вы точно искали? Еще в 1999 году была прога Dragon Dictate (Горыныч в русском варианте), думаю, хуже не стало.
Вот:
http://ru.lmgtfy.com/?q=%D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0+%D0%B4%D0%BB%D1%8F+%D0%B4%D0%B8%D0%BA%D1%82%D0%BE%D0%B2%D0%BA%D0%B8+%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0
RicoScrewdriver
26.03.2019 16:53+1А чем Вам гугловый сервис Speech-to-Text не подходит? Русский поддерживает (и еще 120 языков), пунктуацию ставит. Насколько мне известно, для Ютуб они генерируют субтитры тоже на этом движке. Можете включить любое видео с русской озвучкой и посмотреть качество распознавания.
dolphin4ik
26.03.2019 16:21Знаком с технологиями воспроизведения и восприятия голоса у ЦРТ… им ещё лет 5-10 работать до текущего мирового уровня.
nehaev
27.03.2019 13:06Хотелось бы узнать, почему вы так считаете?
Как минимум синтез на русском языке у них работает весьма неплохо по сравнению с тем же гуглом. Желающие могут сравнить сами, у них есть демо на https://voicefabric.ru/ Там правда нет Варвары, о которой речь в новости, но есть другие женские голоса.
Skyneon
27.03.2019 17:28Не сильно лучше Яндекс/Гугл, а лицензирование просто космос, мы как то подсчитали для нашего небольшого колл-центра, выходило 1.5млн в год, поэтому клиентов у этого ЦРТ — 2,5 компании. Технологии почти все on-demand, работает все на Windows, API жутко не удобное. Облачная версия API с движка — космически дорогая. Как итог ЦРТ еще лет 5-10 работать до текущего мирового уровня.
nehaev
27.03.2019 18:27Да, тоже с таким сталкивался у них. Но мой вопрос к комментатору выше был больше про сами подходы к синтезу/распознаванию.
ПС. Если не секрет, у кого в итоге купили голосовой движок?
jrthwk
26.03.2019 17:21А вот такой вопрос на обратную тему — а что там с распознаванием речи, и более того есть ли щас что-то что худо-бедно распознает японский?
dth_apostle
26.03.2019 17:25+3Пока Алиса — единственный голосовой ассистент, с которой можно поддерживать беседу на русском языке. К сожалению, американские Сири (Apple), Алекса (Amazon) и Кортана (Microsoft) понимают только английский и не могут составить конкуренцию российским «девушкам» на местном рынке.
Со 2го абзацаложневерная информация: google assistant и сири вполне понимают русский язык. Что за неподготовленность?
Cenzo
27.03.2019 03:58Письма и сообщения она озвучит, только если услышит голос пользователя и распознает его как живого человека, а не запись
А это как, простите? На каждый запрос человек будет проговаривать капчу?
Tachyon
27.03.2019 06:34Ну вот ещё одним голосовым помощником будет больше. Интересно кто-нибудь уже организовывал беседу двух голосовых помощников?
на подобии хомячков-повторюшек
karl93rus
Олег… Тиньков такой Тиньков :)
TyVik
А при не вежливом обращении к боту вам заблокируют счёт.