• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом STT

Почему Cluely и другие плохо слышат русских айтишников: разбор того, как Whisper ломается и что мы сделали с этим +13

  • 22.04.2026 19:18
  • billiedark
  • 7
  • Машинное обучение
  • Разработка под e-commerce
  • Искусственный интеллект
  • Python
  • Linux

ASR на CPU. Как выбрать бэкенд, настроить Triton и не потерять в точности +11

  • 21.04.2026 13:47
  • vs_nikulin
  • 0
  • Блог компании MWS AI
  • Блог компании МТС
  • Блог компании Конференции Олега Бунина (Онтико)
  • Машинное обучение
  • Natural Language Processing

ASR на CPU. Как выбрать бэкенд, настроить Triton и не потерять в точности +11

  • 21.04.2026 13:47
  • vs_nikulin
  • 0
  • Блог компании MWS AI
  • Блог компании МТС
  • Блог компании Конференции Олега Бунина (Онтико)
  • Машинное обучение
  • Natural Language Processing

llama.cpp теперь умеет работать с речью +17

  • 13.04.2026 02:06
  • SlavikF
  • 17
  • Искусственный интеллект
  • Звук

Телефонный звонок → структурированный JSON: строим STT + LLM пайплайн на Python +3

  • 08.04.2026 05:16
  • SmartAgent
  • 8
  • Искусственный интеллект
  • Машинное обучение
  • Обработка изображений

Я протестировал 30+ голосовых AI-движков и собрал переводчик быстрее Google Meet. Бенчмарки, цены, грабли +12

  • 28.03.2026 04:28
  • Kir_Moisha
  • 7
  • Голосовые интерфейсы
  • macOS
  • Анализ и проектирование систем
  • Исследования и прогнозы в IT

Тестирование алгоритмов шумоподавления для сложных акустических условий +2

  • 15.03.2026 19:00
  • Gfer
  • 0
  • Habr
  • DIY или Сделай Сам
  • Звук
  • Экология

T-one — открытая русскоязычная потоковая модель для телефонии +54

  • 22.07.2025 10:52
  • A-n-d-r-e-w-y
  • 13
  • Блог компании Т-Банк
  • Искусственный интеллект
  • Машинное обучение
  • Open source

Сравнение систем распознавания русского языка 2024 +8

  • 17.10.2024 04:00
  • snakers4
  • 15
  • Машинное обучение
  • Искусственный интеллект
  • Голосовые интерфейсы
  • Яндекс API

Быстрее, выше, сильнее в распознавании речи: SpeechKit, SaluteSpeech или SpeechFlow?

  • 14.08.2024 10:15
  • ArchitectSimbirSoft
  • 0
  • Блог компании SimbirSoft
  • Машинное обучение
  • Научно-популярное
  • Natural Language Processing

Yandex SpeechSense: STT для тех, кто преисполнился

  • 15.07.2024 10:02
  • helenkapatsa
  • 0
  • Python
  • Яндекс API
  • Data Engineering

Руководство по началу с нуля настройки решений речевой аналитики Яндекс SpeechSense и документации по платформе

  • 21.06.2024 18:27
  • Rebelqwe
  • 0
  • Python
  • PowerShell
  • Визуализация данных
  • Искусственный интеллект
  • Serverless

Сравнение Vosk и Whisper

  • 13.05.2024 20:48
  • sanitar1988
  • 8
  • C#
  • .NET

ИИ-го-го или как AI-стартапу с TTS сэкономить копеечку: синтез речи из палок и веток для low-resource языков

  • 07.05.2024 05:08
  • albonemo
  • 6
  • Блог компании Raft
  • Машинное обучение
  • Искусственный интеллект

Разметка данных: неочевидные затраты на голосовые технологии

  • 15.12.2023 10:43
  • kucev
  • 1
  • Data Mining
  • Big Data
  • Машинное обучение
  • Искусственный интеллект
  • «
  • 1
  • 2
  • »
Страница 1 из 2
ЛУЧШЕЕ

  • Вчера
  • Позавчера
05:38

TSMC: почему 90% передовых чипов в мире делают на одном взрывоопасном острове +114

11:07

Что на самом деле происходит в комнате с пирамидками и почему после неё не верят даташитам на микросхемы +30

08:01

OpenSearch Dashboards и как веб‑интерфейс упрощает работу с кластером +29

07:05

Дело 2005г.: Sony BMG против собственных покупателей или как защита от пиратства превратилась в руткит +24

12:00

Возвращение испанской барахолки: аудиосистемы, интернет по проводке, баян и кое-что еще +23

12:04

Тихий перфоратор для соседа: как спроектировать тактовый генератор с распределенным спектром +19

09:01

Редкий китайский суперстрат Vorson TS-K-6 +19

14:55

Есть ли жизнь после Cisco ISE? Распаковка и тест-драйв российского NAC от Eltex в сетевой лаборатории +18

13:01

АПаем возможности паять: переход на новый паяльник +18

05:35

Обзор релиза Kubernetes 1.36: перестаём пересобирать образы, чистим «зомби» PVC и читаем логи без SSH. Разбор 68 фич +16

05:49

Почему я так придираюсь к вёрстке (и вам советую) +14

15:22

Вы еще спрашиваете, почему все ненавидят рекрутеров? +13

14:15

Подводные камни распараллеливания автотестов +13

11:41

Чит-код для ИТ-карьеры: как рецензирование книг помогает проходить собесы в бигтех и прокачивать личный бренд +13

14:05

Intl: мощный браузерный API, который вы, возможно, не используете +12

09:49

Я устал каждый раз гуглить одно и то же в nginx — и сделал инструмент, который объясняет конфиги на русском +12

08:50

Как дообучать локальные LLM в 2026 году: практическое руководство +12

13:03

Доступность товара в «Магните»: от эвристик до CUSUM и GEE-тестов +11

09:30

API-безопасность 2026: почему защита требует нового подхода +11

04:34

AI КОМП-АС — разбор фреймворка. C: Скейлинг AI на проде +11

19:02

Минцифры идёт на зачистку. Малые операторы — под нож… +233

09:01

Реверсим штатный ключ сигнализации JAC-Москвич +73

09:01

Тридцать три тысячи жизней: самое громкое киберпреступление в истории Финляндии +55

08:17

Разработка RC-машинки с BLDC. Подход с нуля +53

12:00

Практическое руководство по Qwen: установка, настройка vLLM и работа через API +42

11:39

Ловим время в формате DCF77 +38

07:02

userver 3.0 — большой релиз фреймворка для IO‑bound‑программ, переход на C++20 +33

13:01

Устанавливаем почтовый сервер Addy.io для одноразовых почтовых адресов +32

15:30

Я много лет пытался повысить продуктивность и качество жизни — эксперименты над собой (Часть 2) +26

07:05

Если трос оборвался. Что произойдет с кабиной лифта в самом плохом случае? +26

13:47

Зачем айтишнику писать книги, и почему сейчас — самый лучший момент? +24

08:00

Автоматизируем создание глобального роутера для связи выделенного и облачного серверов +24

11:21

CSS для тех, кто спал и проснулся +23

07:00

PicoClaw на Arduino Uno Q +23

16:25

$1.8 миллиарда, два брата и ноль проверок: как The New York Times попалась на AI-хайп +20

06:20

IT-монополии наперегонки сращиваются с государством: кто быстрее? +20

11:17

Как ускорить верификацию: советы для инженеров и менеджеров аппаратной разработки +19

09:30

Запускаем Qwen3.6 35B-A3B + opencode локально на RTX 4070 12GB — AI-ассистент для разработки без облака +18

07:06

Рецензия на книгу «Основы разработки приложений для iOS» +17

07:09

Возвращение легенды: почему Fortran снова в топе и где его использовать сегодня +16

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Минцифры идёт на зачистку. Малые операторы — под нож… +233

    • 444

    Парадокс «кадрового голода» 2026: почему вакансий меньше, а работать некому? -8

    • 147

    Роботы заменят людей? +5

    • 85

    TSMC: почему 90% передовых чипов в мире делают на одном взрывоопасном острове +114

    • 75

    Покупатель попросил готовить дом к его приезду и приносить ему еду. Тогда я понял, за что берут 900 тысяч за сотку +8

    • 48

    Реверсим штатный ключ сигнализации JAC-Москвич +73

    • 41

    Зачем айтишнику писать книги, и почему сейчас — самый лучший момент? +24

    • 36

    Если трос оборвался. Что произойдет с кабиной лифта в самом плохом случае? +26

    • 33

    Что на самом деле происходит в комнате с пирамидками и почему после неё не верят даташитам на микросхемы +30

    • 29

    Ловим время в формате DCF77 +38

    • 29

    Запускаем Qwen3.6 35B-A3B + opencode локально на RTX 4070 12GB — AI-ассистент для разработки без облака +18

    • 28

    5 стадий поиска работы в IT +14

    • 27

    Android. Три буквы. Российские приложения +14

    • 25

    Как я полдня воевал с VPN, поддержкой и Озоном — и всё-таки победил -13

    • 25

    DLSS 5 — не провал. Будущее рендеринга: глубокий технический взгляд на новые подходы после 15-ти лет в геймдеве +4

    • 24

Подписка


  • Главная
  • Контакты
© 2026. Все публикации принадлежат авторам.