«Центр речевых технологий» (ЦРТ) разрабатывает платформу для создания голосовых ассистентов под рабочим названием «Варвара», рассказали «Коммерсанту» два собеседника, близких к компании. Варвара должна составить достойную конкуренцию Алисе от «Яндекса», а также американским «девушкам» Сири (Apple), Алексе (Amazon) и Кортане (Microsoft).

Как и «Яндекс», компания ЦРТ тоже рассчитывает поставлять голосового помощника по лицензии производителям сторонних продуктов, в том числе смартфонов и умных колонок. Соответствующие изделия «Яндекса» (колонка и смартфон) — это скорее технологические прототипы для демонстрации жизнеспособности технологии потенциальным партнёрам. Настоящую прибыль можно получить только от крупных контрактов на массовый продукт. Сейчас Алиса работает, например, в умных колонках сторонних производителей Irbis A и Elari SmartBeat, а также в умных часах Elari KidPhone 3G и наушниках Sony XPeria Duo.

Варвару можно будет встроить в любое устройство или приложение или подключить из облака. Предполагается, что она будет поддерживать биометрическую авторизацию (возможно, распознавание хозяина по голосу): «Ей можно доверить приватную информацию — к почте, мессенджерам или мобильному банку. Письма и сообщения она озвучит, только если услышит голос пользователя и распознает его как живого человека, а не запись», — сообщил один из собеседников «Коммерсанта».

В отличие от «Яндекса», у ЦРТ большой опыт в разработке речевых технологий. Компания успешно продаёт решения для распознавания и синтеза голоса, а также лицевой идентификации. Среди клиентов — банки, сотовые операторы, государственные и правоохранительные органы. По словам источников, ЦРТ ведёт переговоры с несколькими крупными компаниями. Выпускать собственную колонку не планирует.

Кроме Алисы и Варвары, в ближайшее время ожидается появление голосового помощника Маруся от Mail.ru Group, а «Тинькофф-банк» планирует запустить голосового ассистента под рабочим названием Олег.

Комментарии (21)


  1. karl93rus
    26.03.2019 15:36

    Олег… Тиньков такой Тиньков :)


    1. TyVik
      26.03.2019 15:52
      +2

      А при не вежливом обращении к боту вам заблокируют счёт.


  1. Ghool
    26.03.2019 16:16

    Црт, если я верно понимаю, это ребята, которые купили прогу «читатель»

    Читатель — было лучшее приложение для воспроизведения голого текста голосом. Конечно, воспроизведение прогой не сравнить с тем, как читает живой человек, но если выбирать из существующих — лучшее. Я через него много книжек послушал.
    К сожалению, новые владельцы перестали развивать приложение и с апгрейдом ios на айфоне это приложение умерло :((

    Ещё у них есть прога, которая из mp3 сделает word (типа файнридера для голоса).
    Пару лет назад я проверял — работало так себе.
    Но опять же, других решений просто нет :((

    Если кто знает рабочую прогу на windows, которая умеет выдать в текст диктуемое голосом — поделитесь плиз


    1. CHolfield
      26.03.2019 16:26

      Вы точно искали? Еще в 1999 году была прога Dragon Dictate (Горыныч в русском варианте), думаю, хуже не стало.
      Вот:
      http://ru.lmgtfy.com/?q=%D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0+%D0%B4%D0%BB%D1%8F+%D0%B4%D0%B8%D0%BA%D1%82%D0%BE%D0%B2%D0%BA%D0%B8+%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0


    1. telobezumnoe
      26.03.2019 16:36

      есть бот в вк… https://vk.com/club153585640


      1. Ghool
        27.03.2019 21:13

        Попробую, спасибо


    1. RicoScrewdriver
      26.03.2019 16:53
      +1

      А чем Вам гугловый сервис Speech-to-Text не подходит? Русский поддерживает (и еще 120 языков), пунктуацию ставит. Насколько мне известно, для Ютуб они генерируют субтитры тоже на этом движке. Можете включить любое видео с русской озвучкой и посмотреть качество распознавания.


  1. dolphin4ik
    26.03.2019 16:21

    Знаком с технологиями воспроизведения и восприятия голоса у ЦРТ… им ещё лет 5-10 работать до текущего мирового уровня.


    1. nehaev
      27.03.2019 13:06

      Хотелось бы узнать, почему вы так считаете?


      Как минимум синтез на русском языке у них работает весьма неплохо по сравнению с тем же гуглом. Желающие могут сравнить сами, у них есть демо на https://voicefabric.ru/ Там правда нет Варвары, о которой речь в новости, но есть другие женские голоса.


      1. Skyneon
        27.03.2019 17:28

        Не сильно лучше Яндекс/Гугл, а лицензирование просто космос, мы как то подсчитали для нашего небольшого колл-центра, выходило 1.5млн в год, поэтому клиентов у этого ЦРТ — 2,5 компании. Технологии почти все on-demand, работает все на Windows, API жутко не удобное. Облачная версия API с движка — космически дорогая. Как итог ЦРТ еще лет 5-10 работать до текущего мирового уровня.


        1. nehaev
          27.03.2019 18:27

          Да, тоже с таким сталкивался у них. Но мой вопрос к комментатору выше был больше про сами подходы к синтезу/распознаванию.


          ПС. Если не секрет, у кого в итоге купили голосовой движок?


        1. Ghool
          27.03.2019 21:15

          Так вы только на цены жалуетесь, почему 5-10 лет?


  1. jrthwk
    26.03.2019 17:21

    А вот такой вопрос на обратную тему — а что там с распознаванием речи, и более того есть ли щас что-то что худо-бедно распознает японский?


  1. dth_apostle
    26.03.2019 17:25
    +3

    Пока Алиса — единственный голосовой ассистент, с которой можно поддерживать беседу на русском языке. К сожалению, американские Сири (Apple), Алекса (Amazon) и Кортана (Microsoft) понимают только английский и не могут составить конкуренцию российским «девушкам» на местном рынке.

    Со 2го абзаца ложневерная информация: google assistant и сири вполне понимают русский язык. Что за неподготовленность?


    1. zahmTOD
      26.03.2019 21:21

      Ализар Копи-паст же.


  1. Cenzo
    27.03.2019 03:58

    Письма и сообщения она озвучит, только если услышит голос пользователя и распознает его как живого человека, а не запись

    А это как, простите? На каждый запрос человек будет проговаривать капчу?


  1. Tachyon
    27.03.2019 06:34

    Ну вот ещё одним голосовым помощником будет больше. Интересно кто-нибудь уже организовывал беседу двух голосовых помощников?

    на подобии хомячков-повторюшек


    1. xirahai
      27.03.2019 10:30

      Как-то пробовал стравить двух Алис на смартфонах. После нескольких пробных попыток, рекорд получился 10 минут их болтовни, без вмешательства человека.


  1. ArgentMind
    27.03.2019 09:09

    Прикольно, только я картавый…


  1. Eugeniy2014
    27.03.2019 14:57

    Как прочитал-Олег, сразу вспомнил программу Однажды в России.Там персонаж был отбитый на голову-Олег… Надеюсь не будет дежавю


  1. Vorchun
    27.03.2019 19:42

    Сейчас есть боты звонилки. Наверно, есть боты автоответчики. Вот хочется в живую увидеть, как Варвара будет общаться с Алисой )

    Кейс может за уши притянут, но суть — бот с ботом.