• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом инференс

vLLM, LoRA и GPU-кластеры: техническая анатомия обогащения поисковой выдачи Авито мультимодальными моделями +4

  • 23.04.2026 09:12
  • Kirill0720
  • 0
  • Блог компании AvitoTech
  • Машинное обучение
  • Искусственный интеллект

Compute crunch пришёл: как считать экономику LLM в 2026 +7

  • 17.04.2026 18:33
  • Xronofag
  • 7
  • Анализ и проектирование систем
  • Бизнес-модели
  • Искусственный интеллект
  • Облачные вычисления

DRAматургия GPU в Kubernetes: зачем нужен DRA, если Device Plugin работает? Разбираем грабли AI-инфраструктуры +14

  • 08.04.2026 09:31
  • Myskat_90
  • 2
  • Блог компании Флант
  • DevOps
  • Kubernetes
  • Искусственный интеллект
  • IT-инфраструктура

TurboQuant. Новый алгоритм сжатия от Google +12

  • 25.03.2026 20:46
  • meliksetyan
  • 10
  • Сжатие данных
  • Алгоритмы
  • Исследования и прогнозы в IT

Конец эпохи вероятностного ИИ: почему гонка за GPU от Nvidia — это архитектурный тупик -4

  • 24.03.2026 07:43
  • Aqsaqal
  • 20
  • Машинное обучение
  • Проектирование и рефакторинг
  • IT-инфраструктура
  • Алгоритмы
  • Высоконагруженные системы

Линейка HighFreq или как выжать из облака максимум для инференса, ML и других высоких нагрузок +40

  • 13.03.2026 08:00
  • oneastok
  • 0
  • Блог компании Selectel
  • IT-инфраструктура
  • IT-компании
  • Высоконагруженные системы
  • Машинное обучение

Как мы запустили GPU NVIDIA H200 в Selectel, или почему в золотую лихорадку непросто продавать лопаты +46

  • 10.10.2025 09:30
  • skovalev
  • 11
  • Блог компании Selectel
  • IT-инфраструктура
  • IT-компании
  • Искусственный интеллект
  • Машинное обучение

Что нового в NVIDIA Rubin CPX — платформе для AI, представленной на AI Infra Summit +5

  • 25.09.2025 06:26
  • mClouds_editor
  • 5
  • Блог компании mClouds.ru
  • IT-инфраструктура
  • Искусственный интеллект
  • Компьютерное железо
  • Читальный зал

Архитектура LPU и будущее AI без задержек +2

  • 11.09.2025 10:20
  • python_leader
  • 0
  • Искусственный интеллект
  • Будущее здесь
  • Машинное обучение
  • Исследования и прогнозы в IT

Как приручить LLM: подбор инфраструктуры для инференса. Часть 1 +43

  • 29.08.2025 08:01
  • antonaleks605
  • 2
  • Блог компании Selectel
  • IT-инфраструктура
  • Машинное обучение
  • Высоконагруженные системы
  • IT-компании

LLM-инференс в 20 раз быстрее, чем на GPU! Как подключить агента-кодера с CLINE и Cerebras -2

  • 22.08.2025 09:56
  • bogdoslavik
  • 0
  • Программирование
  • Лайфхаки для гиков
  • Текстовые редакторы и IDE

Оптимизация инференса больших языковых моделей: комплексный анализ современных подходов и практических реализаций +3

  • 11.08.2025 16:10
  • ivan_isaev
  • 1
  • Python
  • Работа с видео
  • Обработка изображений

Сравнение двух СнК одного тех. процесса с точки зрения инференса нейронных сетей +2

  • 02.07.2025 07:15
  • NelSon29
  • 4
  • Искусственный интеллект
  • Процессоры

Что же такое TPU +83

  • 25.06.2025 13:01
  • interpres
  • 12
  • Блог компании RUVDS.com
  • Машинное обучение
  • Компьютерное железо
  • Процессоры
  • Искусственный интеллект

Видеокарты для нейросетей: две RTX 5060 Ti 16GB или одна RTX 3090 24GB? Тест LLM‑инференса +25

  • 18.06.2025 08:00
  • dmitrifriend
  • 34
  • Блог компании BotHub
  • Компьютерное железо
  • Искусственный интеллект
  • Машинное обучение
  • «
  • 1
  • 2
  • 3
  • »
Страница 1 из 3
ЛУЧШЕЕ

  • Вчера
  • Позавчера
07:32

Это — всё что вам надо знать о белых списках: как устроены и 6 рабочих способов обхода +266

09:01

Почему не взлетели дирижабли? Часть 19: советские дирижабли накануне войны +35

02:32

Yggdrasil-ng: как я переписал Yggdrasil на Rust за 3.5 дня и неделю фиксил один баг +26

13:01

Я проверил Wi-Fi 7 на практике: 3+ Гбит/сек по воздуху и нюансы +19

13:16

Опасный ток: как плакаты и карикатуры поддерживали страх и что за ним стояло +17

15:06

Сломал руку, купил Pixel 10, возненавидел Gboard и написал свой офлайн-голосовой ввод для Android на GigaAM v3 +15

07:25

Что тренд грядущий нам готовит: как Netflix меняет правила игры в киноиндустрии на примере отчета Still Watching 2025 +15

06:11

Локальные LLM на слабом железе — что ставить, как запустить, чего ждать +14

12:05

Лучший промпт для LLM. Бессмысленный поиск +11

07:48

Накануне ввода «реестра криптанов» в РФ, давайте обратимся к французскому опыту +11

13:30

IT: от сокращения до оффера. Полезные заметки на полях +10

08:00

Пять одноплатников 2026: новые чипы, больше памяти и неожиданные форматы +10

17:45

StaticECS — Bitmap Entity Component System +9

13:35

Kotlin — моя любовь, Java — моя судьба. История одного возвращения +9

00:03

От регулярок к ANTLR4: три архитектурных решения на парсере бизнес-формул +7

18:37

Своя почта против Gmail +6

16:02

Квантовый сапёр и квантовый тетрис: изучение квантовых феноменов через компьютерные игры +6

14:40

Пять неочевидных вещей, которые я узнал, запуская кино-соцсеть: от robots.txt-ловушки до 24-мерной математики вкуса +6

13:42

Почему у тиранозавра маленькие ручки? +6

12:30

Проблема промпта «пиши как человек» +6

09:28

Глухарь ESPшный — мемуары охотника +121

08:06

Тренд на деградацию: как я написал прокси-шакализатор на Next.js, чтобы помочь замедлить интернет +83

09:01

Ваш RAG не умеет думать. А мой умеет +71

07:01

Кустарные вакуумные триоды Клода Пайяра. Часть 6. Приспособления, оснастка +45

17:52

Как работать с DDR4 +30

11:40

Реализация автоудаления блокирующих сессий в MS SQL +30

13:15

Вторая жизнь старого смартфона в качестве домашнего сервера +29

13:01

Золотой стандарт оптимизации: разбираем реализацию RollerCoaster Tycoon +29

08:05

КД-6. Конференц-телефон советской эпохи +26

16:46

Права в Linux: chown/chmod, SELinux context, символьная/восьмеричная нотация, DAC/MAC/RBAC/ABAC +25

08:00

Ленты коротких видео: как оптимизировать, чтобы вас смотрели больше +25

19:56

Воскрешение NumLockCalc после 17 лет забвения +24

13:14

Сравнительный анализ RISC-V микропроцессоров picorv32 и scr1 при использовании в FPGA +23

00:33

«Трубы» зовут — вспоминаем историю скринсейверов +23

07:50

Сапборд с мотором и немного о физике +22

07:05

О технологиях домашнего производства пластиковых/металлических деталей +19

09:15

Книга «Изучаем DDD — предметно-ориентированное проектирование». Подробный читательский обзор +18

12:13

Как СМИ рождают “хакеров” и как сам Глава группировки слил секретные методы DDoS +16

08:00

Как подключить Kafka UI к кластеру Kafka в DBaaS +16

09:14

Первое решение суда поразило всех, но второе оказалось еще хлеще: иск на 766 000 000 ₽ за надпись «Я люблю свою семью» +15

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Это — всё что вам надо знать о белых списках: как устроены и 6 рабочих способов обхода +269

    • 87

    Сапборд с мотором и немного о физике +22

    • 64

    Вторая жизнь старого смартфона в качестве домашнего сервера +29

    • 61

    Глухарь ESPшный — мемуары охотника +121

    • 51

    «Трубы» зовут — вспоминаем историю скринсейверов +23

    • 44

    Воскрешение NumLockCalc после 17 лет забвения +24

    • 41

    Первое решение суда поразило всех, но второе оказалось еще хлеще: иск на 766 000 000 ₽ за надпись «Я люблю свою семью» +15

    • 33

    Новинки КОМПАС-3D v24 Home +11

    • 33

    Как работать с DDR4 +30

    • 28

    Тренд на деградацию: как я написал прокси-шакализатор на Next.js, чтобы помочь замедлить интернет +83

    • 26

    Как в СНГ выбирают людей для AI-внедрения — и почему это страшно. Кейс из жизни +6

    • 25

    Kotlin — моя любовь, Java — моя судьба. История одного возвращения +9

    • 23

    Yggdrasil-ng: как я переписал Yggdrasil на Rust за 3.5 дня и неделю фиксил один баг +26

    • 23

    Выбираем таск-менеджер в 2026: сравниваю 10 сервисов по 8 параметрам +5

    • 23

    Локальные LLM на слабом железе — что ставить, как запустить, чего ждать +14

    • 21

Подписка


  • Главная
  • Контакты
© 2026. Все публикации принадлежат авторам.