• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом STT

Почему Cluely и другие плохо слышат русских айтишников: разбор того, как Whisper ломается и что мы сделали с этим +13

  • 22.04.2026 19:18
  • billiedark
  • 8
  • Машинное обучение
  • Разработка под e-commerce
  • Искусственный интеллект
  • Python
  • Linux

ASR на CPU. Как выбрать бэкенд, настроить Triton и не потерять в точности +11

  • 21.04.2026 13:47
  • vs_nikulin
  • 0
  • Блог компании MWS AI
  • Блог компании МТС
  • Блог компании Конференции Олега Бунина (Онтико)
  • Машинное обучение
  • Natural Language Processing

ASR на CPU. Как выбрать бэкенд, настроить Triton и не потерять в точности +14

  • 21.04.2026 13:47
  • vs_nikulin
  • 0
  • Блог компании MWS AI
  • Блог компании МТС
  • Блог компании Конференции Олега Бунина (Онтико)
  • Машинное обучение
  • Natural Language Processing

llama.cpp теперь умеет работать с речью +17

  • 13.04.2026 02:06
  • SlavikF
  • 17
  • Искусственный интеллект
  • Звук

Телефонный звонок → структурированный JSON: строим STT + LLM пайплайн на Python +3

  • 08.04.2026 05:16
  • SmartAgent
  • 8
  • Искусственный интеллект
  • Машинное обучение
  • Обработка изображений

Я протестировал 30+ голосовых AI-движков и собрал переводчик быстрее Google Meet. Бенчмарки, цены, грабли +12

  • 28.03.2026 04:28
  • Kir_Moisha
  • 7
  • Голосовые интерфейсы
  • macOS
  • Анализ и проектирование систем
  • Исследования и прогнозы в IT

Тестирование алгоритмов шумоподавления для сложных акустических условий +2

  • 15.03.2026 19:00
  • Gfer
  • 0
  • Habr
  • DIY или Сделай Сам
  • Звук
  • Экология

T-one — открытая русскоязычная потоковая модель для телефонии +54

  • 22.07.2025 10:52
  • A-n-d-r-e-w-y
  • 13
  • Блог компании Т-Банк
  • Искусственный интеллект
  • Машинное обучение
  • Open source

Сравнение систем распознавания русского языка 2024 +8

  • 17.10.2024 04:00
  • snakers4
  • 15
  • Машинное обучение
  • Искусственный интеллект
  • Голосовые интерфейсы
  • Яндекс API

Быстрее, выше, сильнее в распознавании речи: SpeechKit, SaluteSpeech или SpeechFlow?

  • 14.08.2024 10:15
  • ArchitectSimbirSoft
  • 0
  • Блог компании SimbirSoft
  • Машинное обучение
  • Научно-популярное
  • Natural Language Processing

Yandex SpeechSense: STT для тех, кто преисполнился

  • 15.07.2024 10:02
  • helenkapatsa
  • 0
  • Python
  • Яндекс API
  • Data Engineering

Руководство по началу с нуля настройки решений речевой аналитики Яндекс SpeechSense и документации по платформе

  • 21.06.2024 18:27
  • Rebelqwe
  • 0
  • Python
  • PowerShell
  • Визуализация данных
  • Искусственный интеллект
  • Serverless

Сравнение Vosk и Whisper

  • 13.05.2024 20:48
  • sanitar1988
  • 8
  • C#
  • .NET

ИИ-го-го или как AI-стартапу с TTS сэкономить копеечку: синтез речи из палок и веток для low-resource языков

  • 07.05.2024 05:08
  • albonemo
  • 6
  • Блог компании Raft
  • Машинное обучение
  • Искусственный интеллект

Разметка данных: неочевидные затраты на голосовые технологии

  • 15.12.2023 10:43
  • kucev
  • 1
  • Data Mining
  • Big Data
  • Машинное обучение
  • Искусственный интеллект
  • «
  • 1
  • 2
  • »
Страница 1 из 2
ЛУЧШЕЕ

  • Сегодня
  • Вчера
  • Позавчера
05:30

Я думал, что просто не могу найти себя — пока не разобрался, как на самом деле работает СДВГ +4

00:23

ИИ в трейдинге: почему всё сложнее, чем кажется +3

05:30

От MinIO к SeaweedFS: опыт замены S3-хранилища +2

06:53

Как ретроспектива меняет команды в ИТ, бизнесе и жизни +1

05:22

От workslop к реальной пользе: как я выбрал и настроил ИИ-агента для Go-разработки (инструкции, конфиги, рекомендации) +1

05:00

Решала, который не решает: что Антонио Дамасио понял про руководителей ещё в 1994-м +1

09:49

Российская инфраструктура стала тихой гаванью для киберпреступников. Причем тут Руцентр, Рег.Ру и DDoS-Guard? +111

13:01

Морковка «пассивного дохода» отравила целое поколение предпринимателей +62

09:01

Взрыв чёрной дыры ожидается в ближайшие 10 лет +36

08:50

Тайна Motorola StarTAC: полный анализ схемотехники телефона из 90-х +30

07:05

Каким был мобильный телефон до появления сотовой связи. Часть 1 +27

08:00

Строим самолеты в Minecraft: результаты конкурса на сервере Selectel +25

06:15

SSH по требованию: что умеет socket activation и почему я перестал держать туннели открытыми +25

16:20

Claude Code это инициативный junior с памятью золотой рыбки. 5 правил контроля для production +23

09:00

Pragmata взломали за два дня до релиза. Шесть слоёв защиты Denuvo и как их обходят через гипервизор +22

05:01

Облава на инсайдеров с Polymarket, а также уход Тима Кука на почетную пенсию +21

12:00

Android, iOS и немного Python: подходит ли Kivy для реальных кроссплатформенных задач? +20

15:18

Что происходит с QA в 2026 году: результаты опроса 800+ специалистов +16

11:10

Интерславик. Он же  Interslavic  или Medžuslovjansky. Искусственный «Усредненный» между славянский язык общения +14

07:01

Redis для QA +14

20:27

CraftHub — или как я устал редактировать JSON вручную и написал редактор +13

13:56

Я считал тюленей в океане, дрон упал в воду, и теперь я должен 50 млн +13

10:38

Рерайт текстов в 2026: большой разбор сервисов для редакций от SEO-помоек начала 10-х до мультиагентных систем +13

17:37

Как Cursor с Claude Opus снёс продакшен базу данных за 9 секунд +12

13:25

Миллион в месяц за блокировки интернета, или чем отличается капитализм от социализма +12

20:57

Отзыв о конференции Инженеры Будущего 2026 или как я сделал свой проект (это ужас) +11

10:46

Фирма из 14 человек vs завод с 93-летней историей: Наглядный пример того, как убивают заводы +239

13:01

Как фотографируют в космосе +70

09:55

far2l 2.8.0 в Ubuntu 26.04: новые классные фичи +70

09:01

Как поставить точку на беспорядке +69

08:45

Маленькие секреты детского фонографа +65

08:00

Кислород из лунного грунта и новая космическая гонка: кто собрался строить инфраструктуру на Луне +25

00:00

Gemini перестал работать с VPN. Что делать? +25

11:30

Эстонская сланцевая энергетика: от революции к контрреволюции +24

08:00

Linux 7.1: отказ от прошлого и подготовка к новому железу +22

10:50

Потоковая запись ADC семплов на STM32 +17

19:15

Модель термогенеза пчелы +16

14:17

Почему Йеллоустоун может работать совсем не так, как считалось ранее +14

17:10

Как мы продавали компьютеры в 90-х. Новые хлопоты +13

09:53

Применение платы Arduino Due для измерения параметров вибрации при балансировке роторов +13

13:10

Знакомство с одним прогоном Mythos применительно к Firefox: а разговоров-то было? +12

08:37

Вышел DeepSeek V4. Почему это очень плохо для США? +12

04:34

Наглядный пример, зачем нужны агенты +11

18:31

Zigbee датчик контроля дверного замка v2 +10

16:08

Ищи меня в клубе: как за 200+ лет книжные клубы превратились из хобби для богачей в рабочий способ «прокачаться» в ИТ +10

06:15

История изобретения гусеницы (гусеничного хода) +10

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Фирма из 14 человек vs завод с 93-летней историей: Наглядный пример того, как убивают заводы +239

    • 766

    Gemini перестал работать с VPN. Что делать? +25

    • 98

    С чего начинается Родина для ИИ? Мы строим российскую когнитивную архитектуру -2

    • 87

    Кислород из лунного грунта и новая космическая гонка: кто собрался строить инфраструктуру на Луне +25

    • 78

    hh выкатил фичу, которая убьет ваши отклики и найм окончательно +8

    • 76

    Я работал по 12 часов в день и через месяц понял, что проблема была не в часах +5

    • 52

    «Очевидный вопрос»: годовой эксперимент по изучению семантического табу +9

    • 49

    far2l 2.8.0 в Ubuntu 26.04: новые классные фичи +70

    • 48

    Как Cursor с Claude Opus снёс продакшен базу данных за 9 секунд +12

    • 47

    Наглядная эволюция человека, на коротком отрезке времени +8

    • 47

    Российская инфраструктура стала тихой гаванью для киберпреступников. Причем тут Руцентр, Рег.Ру и DDoS-Guard? +111

    • 46

    Pragmata взломали за два дня до релиза. Шесть слоёв защиты Denuvo и как их обходят через гипервизор +22

    • 46

    Как возникает реальность? Новая математическая модель. Сравнение с другими теориями -5

    • 44

    Миллион в месяц за блокировки интернета, или чем отличается капитализм от социализма +12

    • 39

    Потоковая запись ADC семплов на STM32 +17

    • 37

Подписка


  • Главная
  • Контакты
© 2026. Все публикации принадлежат авторам.