Не всем было удобно запускать наши минималистичные примеры в колабе, поэтому мы сделали бесплатного телеграм-бота, который основан на наших последних моделях синтеза речи.

Бот содержит весь основной функционал последних моделей (работает мгновенно, имеет максимально высокое качество, есть автоматическая простановка ударений и буквы ё). Более подробно об ограничениях и особенностях работы можно узнать в методах /help и /faq.

Также в ближайшем будущем мы раскатим небольшое "полу-праздничное" обновление, которое как нам кажется порадует многих пользователей.

Как воспользоваться

Нужно просто пройти по ссылке или просто открыть страницу бота @silero_voice_bot в Телеграме. Затем:

  • Введите команду /start для старта;

  • /help и /faq помогут понять основные допущения и ограничения в работе;

Мы тщательно всё протестировали и свели список основных краевых случаев в вышеописанные команды. Если вы найдете новые краевые кейсы, там указаны прямые контакты, можете написать нам. Мы не прячемся и не кусаемся.

Ключевые особенности и отличия от существующих решений

Сразу чтобы вы понимали — мы разрабатываем свои собственные алгоритмы, а не просто перекладываем ваши персональные данные в "джейсончики" в АПИ корпораций (как с недавнего времени делает например сам Телеграм). Все алгоритмы и разработки, участвующие в работе бота, наши собственные.

Тут дальше не вижу смысла особо растекаться, можете найти аналогичный раздел в этой статье на Хабре, там все написано.

Дальнейшее развитие

Этот бот по идее сильно проще по функционалу и наполнению (и является как бы "закрытым") по сравнению с ботом для распознавания голосовых сообщений, с ним можно общаться только напрямую. Поэтому не ожидается каких-то радикальных краевых кейсов.

С другой стороны существующие ограничения в боте, отсутствие каких-либо прослоек для нормализации текста - это наш намеренный выбор.

Возможно когда-нибудь мы доберемся и до других интересных кейсов (пародирование фразы голосом персонажа, генерация коротких аудио-книг или сказок своим голосом), но особо четких планов пока нет.

UPDATE

  • Причина "отваливания" бота была банальной - человеческий фактор, все поправили;

  • Бот также не работал на iOS и MacOS, теперь должно работать;

Комментарии (14)


  1. Altaev
    12.08.2022 13:39

    Что-то не работает :(


    1. snakers4 Автор
      12.08.2022 13:42

      Бот немного прилег. Смотрим уже.


      1. snakers4 Автор
        12.08.2022 14:14

        Вообще странно. Когда бот лежал, сам сервис пинговался, а телега будто не отвечала.


        1. snakers4 Автор
          12.08.2022 15:51
          +1

          В итоге нашли причину, все в человеческом факторе, перепутали деплой и дев, и перевешивали вебхуки не там, сам бот работает)


  1. SerJook
    12.08.2022 13:42
    +3

    Хорошее качество синтеза. Осталось сделать так, чтобы этот бот автоматически проговаривал отправляемые мной сообщения другому собеседнику (чтобы бесить его), а исходный текст не отправлялся.


  1. Ob1Van
    12.08.2022 13:59
    +2

    А почему бот игнорирует цифры в тексте ?


    1. snakers4 Автор
      12.08.2022 13:59

      Потому, что там нет нормализации текста.


      1. Akr0n
        12.08.2022 16:09
        +2

        Да уж, без цифр как-то печально.


  1. wyfinger
    12.08.2022 16:41
    +4

    Очень надо это в телефон, для озвучивания аудиокниг (если добавите цифры и отдельные слова на английском).
    Качество сильно лучше Vocalizer Expressive 2


  1. TegroTGR
    13.08.2022 05:29

    А если ещё и в Telegram Web App реализовать, вообще красота будет.


    1. snakers4 Автор
      13.08.2022 05:29

      Бот точно так же работает и в веб клиенте телеги


      1. kostin
        13.08.2022 06:51

        1. snakers4 Автор
          13.08.2022 07:25

          Ну мы всячески старались сделать его удобным без этой фичи


        1. AigizK
          14.08.2022 12:48

          А кто мешает вам поднять на своем сервере синтез этот и реализовать в webapps?