• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом STT

ASR на CPU. Как выбрать бэкенд, настроить Triton и не потерять в точности +9

  • 21.04.2026 13:47
  • vs_nikulin
  • 0
  • Блог компании MWS AI
  • Блог компании МТС
  • Блог компании Конференции Олега Бунина (Онтико)
  • Машинное обучение
  • Natural Language Processing

ASR на CPU. Как выбрать бэкенд, настроить Triton и не потерять в точности +9

  • 21.04.2026 13:47
  • vs_nikulin
  • 0
  • Блог компании MWS AI
  • Блог компании МТС
  • Блог компании Конференции Олега Бунина (Онтико)
  • Машинное обучение
  • Natural Language Processing

llama.cpp теперь умеет работать с речью +17

  • 13.04.2026 02:06
  • SlavikF
  • 17
  • Искусственный интеллект
  • Звук

Телефонный звонок → структурированный JSON: строим STT + LLM пайплайн на Python +3

  • 08.04.2026 05:16
  • SmartAgent
  • 8
  • Искусственный интеллект
  • Машинное обучение
  • Обработка изображений

Я протестировал 30+ голосовых AI-движков и собрал переводчик быстрее Google Meet. Бенчмарки, цены, грабли +12

  • 28.03.2026 04:28
  • Kir_Moisha
  • 7
  • Голосовые интерфейсы
  • macOS
  • Анализ и проектирование систем
  • Исследования и прогнозы в IT

Тестирование алгоритмов шумоподавления для сложных акустических условий +2

  • 15.03.2026 19:00
  • Gfer
  • 0
  • Habr
  • DIY или Сделай Сам
  • Звук
  • Экология

T-one — открытая русскоязычная потоковая модель для телефонии +54

  • 22.07.2025 10:52
  • A-n-d-r-e-w-y
  • 13
  • Блог компании Т-Банк
  • Искусственный интеллект
  • Машинное обучение
  • Open source

Сравнение систем распознавания русского языка 2024 +8

  • 17.10.2024 04:00
  • snakers4
  • 15
  • Машинное обучение
  • Искусственный интеллект
  • Голосовые интерфейсы
  • Яндекс API

Быстрее, выше, сильнее в распознавании речи: SpeechKit, SaluteSpeech или SpeechFlow?

  • 14.08.2024 10:15
  • ArchitectSimbirSoft
  • 0
  • Блог компании SimbirSoft
  • Машинное обучение
  • Научно-популярное
  • Natural Language Processing

Yandex SpeechSense: STT для тех, кто преисполнился

  • 15.07.2024 10:02
  • helenkapatsa
  • 0
  • Python
  • Яндекс API
  • Data Engineering

Руководство по началу с нуля настройки решений речевой аналитики Яндекс SpeechSense и документации по платформе

  • 21.06.2024 18:27
  • Rebelqwe
  • 0
  • Python
  • PowerShell
  • Визуализация данных
  • Искусственный интеллект
  • Serverless

Сравнение Vosk и Whisper

  • 13.05.2024 20:48
  • sanitar1988
  • 8
  • C#
  • .NET

ИИ-го-го или как AI-стартапу с TTS сэкономить копеечку: синтез речи из палок и веток для low-resource языков

  • 07.05.2024 05:08
  • albonemo
  • 6
  • Блог компании Raft
  • Машинное обучение
  • Искусственный интеллект

Разметка данных: неочевидные затраты на голосовые технологии

  • 15.12.2023 10:43
  • kucev
  • 1
  • Data Mining
  • Big Data
  • Машинное обучение
  • Искусственный интеллект

Обновляем сравнение систем распознавания русского языка +13

  • 20.01.2023 10:32
  • snakers4
  • 8
  • Машинное обучение
  • Искусственный интеллект
  • Голосовые интерфейсы
  • «
  • 1
  • 2
  • »
Страница 1 из 2
ЛУЧШЕЕ

  • Сегодня
  • Вчера
  • Позавчера
09:01

Реверсим штатный ключ сигнализации JAC-Москвич +21

07:02

userver 3.0 — большой релиз фреймворка для IO‑bound‑программ, переход на C++20 +20

08:00

Автоматизируем создание глобального роутера для связи выделенного и облачного серверов +18

07:00

PicoClaw на Arduino Uno Q +18

07:05

Если трос оборвался. Что произойдет с кабиной лифта в самом плохом случае? +16

09:01

Тридцать три тысячи жизней: самое громкое киберпреступление в истории Финляндии +13

08:17

Разработка RC-машинки с BLDC. Подход с нуля +13

07:06

Рецензия на книгу «Основы разработки приложений для iOS» +11

08:17

Свежий взлом Kelp/Aave на $200 млн, или почему я не инвестирую в DeFi +10

08:00

Анализ и модернизация коннектора баз данных с помощью AI-агентов +10

07:09

Возвращение легенды: почему Fortran снова в топе и где его использовать сегодня +9

06:20

IT-монополии наперегонки сращиваются с государством: кто быстрее? +9

09:56

Онбординг сотрудников на удаленке.  Опыт «Инфостарта» +8

10:20

Внутри АЛУ микропроцессора 8085 +7

08:24

У женщины нашли опухоль мозга, о которой её предупредили голоса в голове +7

06:16

5 стадий поиска работы в IT +6

06:00

Apache Cloudberry — преемник Greenplum? +6

06:00

Как слить 250 миллионов долларов с помощью ChatGPT: мастер-класс от главы Krafton +6

09:30

Запускаем Qwen3.6 35B-A3B + opencode локально на RTX 4070 12GB — AI-ассистент для разработки без облака +5

06:36

Дни «зеродеев» сочтены +5

08:00

Я удалил backpropagation из нейросети. Она обучилась методами XIX века +79

11:37

Ревью вайб-кода с гнильцой, который притворяется оптимизированным С++ кодом +65

16:24

Я много лет пытался повысить продуктивность и качество жизни — эксперименты над собой (Часть 1) +56

06:30

Инфраструктура Шрёдингера: как вывести ИТ-ресурсы из суперпозиции и знать всё об активах наверняка +51

07:00

Как устроена торговля между звёздными системами +44

14:43

Почему время замедляется при ускорении? Объяснение, которое вы нигде не найдёте +41

09:01

Что было бы, если бы Linux распространялся под BSD +40

13:01

Голоса в компьютере: поющие сидя +32

10:04

— Мам, купи Suno. — У нас есть Suno дома! ACE‑Step XL 4B — русскоязычная музыкальная студия с открытым исходным кодом +31

17:50

AGI уже стучится в дверь человечества. А мы всё ещё думаем, что он станет нашим лучшим другом +24

09:01

12 проблем с отбором резюме: чиним найм по науке +23

06:40

Как организовать балансировку нагрузки Backend приложений Java Spring Cloud + Kubernetes +23

15:24

Просто про волновое сопротивление кабеля +22

10:55

Чем занимается инженер отдела сопровождения разработки: от предсерийного образца до стабильного продукта +22

07:15

Часы на ВЛИ ИВ-18 +21

11:11

Как (не) перевернуть строку, или Ох, уж этот Unicode +20

07:23

Как я искал проблему в режиме работы, а упёрся в осанку: почему сутулость у меня заметно ухудшала память +16

04:53

Кризис инструментария API: почему разработчики бегут от Postman и его клонов? +16

07:07

Конденсаторное травление печатных плат или фотоэлектрический плоттер ;-)? +15

05:38

Чип размером с приусадебный участок +15

05:16

Win32 API и ностальгия по окнам странной формы +152

08:00

Ремонт блока питания с Power Delivery. 470 граммов электроники +110

13:01

Электроинструмент становится хуже, и это делается намеренно +105

12:07

Как ИИ-агенты стали новым оружием скамеров на Хабр Карьере +73

20:16

Perl — зря забытый язык программирования? +50

07:05

Механический калькулятор. Как работает арифмометр? +42

09:01

Готовимся к отключению. Эффективные форматы для упаковки и раздачи HTML-страниц +40

12:00

Linux 7.0 и что изменилось в ядре после очередного цикла разработки +34

08:00

Программирование с AI-ассистентом — похороните меня под плинтусом +30

08:12

Легенды 90-х — кто придумал и производил жвачки Turbo, Love is… и TipiTip +29

18:33

Выделение регистров процессора при помощи генетического алгоритма +27

11:35

Vibe++ очень простой язык для промпт-программистов. А почему бы и не да? +27

17:21

Ракета, которая не взлетела: почему компании отказываются от OpenStack +26

04:59

Замедление Телеграма замедлилось, а также законопроект об уголовной ответственности за крипту в РФ +26

09:05

Объяснение лямбда исчисления через Python +25

12:15

Как переложить нагрузку по code review с разработчиков на LLM +23

08:30

Что такое «мышечная память» и можно ли её развить? +18

01:54

Нейропластичность для разработчика — как учиться эффективнее +18

07:21

«Великое очищение» в работе с контентом: что осталось от роли редактора +17

07:00

Не просто OpenBMC: как мы сделали свой BMC +16

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Win32 API и ностальгия по окнам странной формы +152

    • 285

    Почему время замедляется при ускорении? Объяснение, которое вы нигде не найдёте +41

    • 249

    Электроинструмент становится хуже, и это делается намеренно +105

    • 191

    Perl — зря забытый язык программирования? +50

    • 87

    Я много лет пытался повысить продуктивность и качество жизни — эксперименты над собой (Часть 1) +56

    • 80

    Как устроена торговля между звёздными системами +44

    • 72

    Vibe++ очень простой язык для промпт-программистов. А почему бы и не да? +27

    • 54

    Senior Backend не существует. Вы ищете троих +6

    • 45

    Просто про волновое сопротивление кабеля +22

    • 41

    Наконец-то он готов: исчерпывающий гайд о запрете иностранных слов в России — всё самое важное в одном посте +7

    • 41

    Ремонт блока питания с Power Delivery. 470 граммов электроники +110

    • 37

    Маск передумал: Model 2 возвращается, но рынок бюджетных авто уже занят китайцами +7

    • 34

    Что было бы, если бы Linux распространялся под BSD +40

    • 33

    Готовимся к отключению. Эффективные форматы для упаковки и раздачи HTML-страниц +40

    • 31

    Ревью вайб-кода с гнильцой, который притворяется оптимизированным С++ кодом +68

    • 29

Подписка


  • Главная
  • Контакты
© 2026. Все публикации принадлежат авторам.