Всем привет!
Многие знают, что в Windows есть встроенная функция «Распознавание речи», а в новых версиях — «Голосовой ввод» (Win + H). Это неплохие инструменты, но меня в них всегда
смущали несколько моментов: непрозрачность в вопросах приватности, ограниченная кастомизация и глубокая интеграция в систему, которую не всегда удобно настраивать.
Хотелось чего‑то простого, гарантированно оффлайнового и с открытым исходным кодом, чтобы точно знать, как оно работает. Так родилась идея создать Scribe — полностью
автономного и максимально гибкого голосового ассистента.
В основе — приватность, автономность и гибкость
Чтобы обеспечить полную автономность, я выбрал в качестве движка распознавания речи Vosk. Это позволяет Scribe работать со всеми доступными моделями Vosk, а это более 30 языков на выбор пользователя. Все данные обрабатываются локально, не отправляя ни байта за пределы компьютера.
Весь проект написан на Python с использованием фреймворка PyQt5, что обеспечивает совместимость со старыми версиями ОС, включая Windows 7.
Ключевые возможности Scribe
Я постарался реализовать функции, которых мне не хватало в других программах:
-
Полное управление через глобальные горячие клавиши. Это одна из главных особенностей Scribe. Вы можете настроить системные хоткеи, которые будут работать из любого
приложения, и с их помощью:Запускать и останавливать режим транскрибации.
Активировать режим выполнения команд.
Мгновенно переключать модели распознавания на лету, выбирая нужный язык или точность без входа в меню.
-
Продвинутые голосовые команды. Вы можете создавать команды для выполнения практически любых действий:
Запуск программ, включая современные UWP-приложения.
Открытие сайтов и файлов.
Выполнение любых комбинаций клавиш (например, «скопировать всё» для Ctrl+A, Ctrl+C).
Механизм нечеткого сравнения. Если вы ошиблись в произношении на одну-две буквы или программа не совсем точно распознала фразу, команда все равно будет выполнена. Это
значительно повышает удобство использования.-
Два режима ввода текста. Scribe может вводить распознанный текст двумя способами:
Эмуляция клавиатуры: Прямой посимвольный ввод.
Вставка из буфера обмена: Мгновенная вставка всего распознанного текста. Этот способ работает быстрее и создает меньше нагрузки на процессор.
Автозамена (Hotstrings). Позволяет настроить "горячие строки" — короткие ключевые слова, которые Scribe автоматически заменяет на заранее заданный большой кусок текста.
Максимальная кастомизация. В программу встроено множество настроек, позволяющих адаптировать ее под себя: от внешнего вида до тонкой настройки распознавания.
Низкое потребление ресурсов. Программа изначально оптимизирована, чтобы не нагружать систему. Дополнительно в настройках есть опции, позволяющие еще сильнее снизить
нагрузку на "железо".
Установка не требуется
Scribe — это портативное приложение. Достаточно скачать исполняемый файл, положить его в любую новую пустую папку и запустить. Программа сама создаст рядом с собой все
необходимые файлы и каталоги. Никаких записей в реестре и мусора в системе.
Текущая сборка предназначена для Windows x64 (протестировано на Win 7, 8, 8.1, 10 и 11).
Проект открыт для всех
Scribe — это полностью открытый проект, распространяемый под лицензией GPLv3. Я верю в силу сообщества и буду рад любой обратной связи, идеям по улучшению или помощи в
разработке.
Небольшой совет: при выборе моделей Vosk учитывайте, что более легковесные модели загружаются значительно быстрее и требуют меньше ресурсов, но могут уступать в точности
распознавания. Для мощных ПК лучше подойдут более "тяжелые" и точные модели.
Scribe — это инструмент для тех, кто ценит приватность, производительность и полный контроль над своим ПО. Скачивайте, пробуйте и делитесь идеями по развитию проекта.
Полезные ссылки:
Спасибо за внимание! Готов ответить на ваши вопросы в комментариях.
Комментарии (10)
Emulyator
04.08.2025 19:40Скачал, запустил, загрузил модель vosk-model-ru-0.42 (~3,5гига на диске). Программа стартует несколько минут и съедает больше 5 гигов оперативки. Программа не умеет обрабатывать аудиофайлы и не имеет русскоязычной версии интерфейса (каюсь, может я не нашел куда жать). К сожалению микрофона под рукой не было, так что сравнить с whisper не получилось. Если вы этой программой пользуетесь в повседневной жизни, поделитесь, пожалуйста, парой удачных практических примеров применения.
ArtyomBoyko
04.08.2025 19:40Модель https://huggingface.co/artyomboyko/whisper-small-ru-v4
Пространство:
https://huggingface.co/spaces/artyomboyko/whisper
Это мои наработки.
Ещё очень понравилась модель:
https://huggingface.co/openai/whisper-large-v3-turbo
Она от создателей и многоязыковая. Пространства использующие её тоже сможете найти в карточке модели.
AIgrator Автор
04.08.2025 19:40Заходите в настройки, и там на вкладку General Settings справа будет пункт Interface Language выбираете любой из более чем 30 языков
Sleuthhound
04.08.2025 19:40Питон и низкое потребление ресурсов - звучит довольно смешно.
>Механизм нечеткого сравнения. Если вы ошиблись в произношении на одну-две буквы или программа не совсем точно распознала фразу, команда все равно будет выполнена.
А вот тут действительно страшно стало.
Отформатируй диск Z. Поняла вас, форматирую диск С...
Занавес. Не делайте так.
AIgrator Автор
04.08.2025 19:40Ну если Вы там создадите скрипт который будет форматировать диск C или любой другой, и настроите программу на запуск этого скрипта то да программа его запустит, ну так Вы сами написали этот скрипт и фактически запустили его. Сама по себе программа ни чего не запускает. Код программы открыт и доступен для ознакомления и сборки на своем ПК.
ArtyomBoyko
Почему не Whisper? Языков было бы больше гораздо.
AIgrator Автор
Whisper пробывал сначала с Whisper но там мой ноут ревел как ракета, а с моделями от Vosk после загрузки, ни какой нагрузки на процессор почти не заметно.