
Мы не так давно опубликовали SAPI5-обёртку для нашего синтеза на 20 языков России и СНГ. В этот раз опять немного сошлись звёзды и мы уже публикуем улучшение наших читалок. Чтобы не растекаться мыслью по древу и не повторяться, вот краткий список улучшений (полную подводку можно прочитать в прошлой статье):
Добавлена рудиментарная читалка чисел и английских букв на русском языке;
Теперь есть два инсталлятора, один на базе
v5_5_ru(голоса Силеро), другой — на базеv5_cis_base_nostress(голоса России и СНГ). Суммарно поддерживаются все те же 20 языков (включая русский);Скорость (в идеальных условиях) остаётся в районе x100 реального времени для обеих моделей;
Модель теперь умеет сама ставить ударения на трёх языках: русском, белорусском и украинском;
Для русского языка также добавлена возможность автоматически решать омографы;
Славянские языки работают на базе модели, которая обязательно требует ударения. В прочих ударениях модель "сама" ставит ударения;
Некоторое количество баг-фиксов: небольшие фиксы по запросам пользователей, фикс отзывчивости моделей и "фризов", фикс артефактов при использовании ускорения и высоты голоса;
Также добавлен трекинг по словам для удобства пользования;
Добавлен конфигуратор для ударений (включать-выключать ударения и омографы).
Поддержка вопросов (и готовящаяся) поддержка эмфаз пока не доехала в SAPI5, но в целом тут неясен интерфейс для этого добра.
Повторимся, что наш синтез настолько быстрый, что его можно использовать как локальный синтез в Windows на CPU, так и как экранную читалку. И да, вы верно всё поняли. Из коробки будет работать с Балаболкой и другими подобными программами (и не требует видеокарту) на "калькуляторах".
Будем признательны вам за обратную связь и комментарии!
Конфигуратор
После установки программа предложит вам создать ярлык и раздел в меню "Пуск" для конфигуратора:

Его можно использовать без перезапуска приложений, в которых используется читалка. Полное разделение флагов (ставить или не ставить букву ё, ставить или не ставить односложные слова) — для простоты завозить сюда не стали.
Также напомним, что управлять ударением можно и вручную постановкой плюсика перед нужной гласной.

Как скачать
С прошлого раза многократно усилились различные блокировки всего, чего только можно. Поэтому мы даём два способа скачать читалки:
Установка:
Cкачать
.exeфайл, установить, настроить конфигуратор;Установить программу для озвучки текста, которая работает с SAPI5-интерфейсом. Я тестировал на Балаболке, но у вас может быть своя любимая.
Системные требования:
64-битная Windows;
Мы тестировали на Windows 10 и Windows 11;
Windows XP скорее всего не будет работать, Windows 7 не тестировали.
Будем признательны вам за обратную связь, по сути это пробный релиз для сбора граблей. Обратите внимание, что языки в принципе можно смешивать и что один и тот же диктор присутствует по два раза - как бы на русском и на своём родном языке (у части дикторов русский тоже родной, или более родной, там зависит от человека).
Дисклеймер
В инсталляторе присутствуют реквизиты для добровольных донатов разработчику SAPI5-интерфейса. Если вам очень сильно поможет читалка - вы можете поддержать его напрямую. Обращаю также внимание, что человек не в последнюю очередь старался и для себя, т.к. является незрячим.
Ссылки
Первый релиз читалок - https://habr.com/ru/articles/981992/;
Программа Балаболка - https://www.cross-plus-a.com/ru/balabolka.html;
Наши модели для простановки ударений - https://github.com/snakers4/silero-stress;
Наши модели синтеза - https://github.com/snakers4/silero-models;
Новые модели опубликованные в рамках проекта - https://github.com/snakers4/silero-models?tab=readme-ov-file#v5-cis-base-models;
Примеры запуска моделей для языков России и СНГ;
Обновление проекта
silero-stress.