• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом vllm

Как в СНГ выбирают людей для AI-внедрения — и почему это страшно. Кейс из жизни +6

  • 24.04.2026 09:05
  • yakvenalex
  • 25
  • IT-компании
  • Программирование
  • Карьера в IT-индустрии
  • Искусственный интеллект
  • Python

vLLM, LoRA и GPU-кластеры: техническая анатомия обогащения поисковой выдачи Авито мультимодальными моделями +4

  • 23.04.2026 09:12
  • Kirill0720
  • 0
  • Блог компании AvitoTech
  • Машинное обучение
  • Искусственный интеллект

Практическое руководство по Qwen: установка, настройка vLLM и работа через API +48

  • 22.04.2026 12:00
  • natlysky
  • 16
  • Блог компании Selectel
  • Искусственный интеллект
  • Машинное обучение
  • Python
  • Open source

Как мы научили ИИ подбирать мебель по архитектурным чертежам +4

  • 21.04.2026 04:14
  • Tehnologika
  • 2
  • Обработка изображений
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

ИИ Анализ новостного сентимента как торговый сигнал +6

  • 19.04.2026 11:59
  • tripolskypetr
  • 11
  • Финансы в IT
  • Искусственный интеллект
  • Анализ и проектирование систем
  • TypeScript

KV-Cache в LLM: разбираем инференс через 9 ключевых вопросов +4

  • 10.04.2026 11:21
  • YUNGC0DE
  • 0
  • Машинное обучение
  • Искусственный интеллект

Один timestamp, один round-robin, один плавающий список tools: 7 анти-паттернов, которые убивают префикс кэша LLM +17

  • 30.03.2026 08:00
  • Ser_no
  • 3
  • Искусственный интеллект
  • Блог компании Битрикс24

Как я приручил 30-миллиардник на RTX 3090: Тестируем Nemotron-Cascade-2 в домашнем сетапе +13

  • 28.03.2026 14:06
  • Antra
  • 14
  • Искусственный интеллект

vLLM Production Stack. Часть 1: Базовые возможности vLLM +2

  • 27.03.2026 16:09
  • Bambarambambum
  • 0
  • DevOps
  • Системное администрирование
  • Видеокарты
  • Kubernetes

Собственная облачная LLM на 16 ГБ VRAM — часть 1: базовая сборка, tools и MCP +50

  • 06.03.2026 08:00
  • yakvenalex
  • 16
  • Блог компании Selectel
  • Python
  • Программирование
  • Искусственный интеллект
  • IT-инфраструктура

Снижаем стоимость инференса. Часть 1. Популярные подходы и что помогло нам повысить утилизацию GPU на 70% +8

  • 24.09.2025 11:38
  • ddgudynin
  • 2
  • Блог компании Cloud.ru
  • Облачные сервисы
  • IT-инфраструктура
  • Искусственный интеллект
  • DevOps

Как запустить свою LLM для инференса. Руководство по запуску: Ollama, vLLM, Triton, LM Studio, llama.cpp, SGLang +24

  • 20.09.2025 19:31
  • maksimov_m
  • 0
  • Machine Learning
  • Машинное обучение
  • Python
  • DevOps

Как мы научили LLM отвечать на вопросы абитуриентов в крупнейшем вузе страны +12

  • 09.09.2025 05:00
  • SGERCEN
  • 20
  • Python
  • Natural Language Processing
  • Искусственный интеллект

GPT-OSS-20B / 120B: Сухие цифры после реальных тестов +4

  • 20.08.2025 09:16
  • Dmitrii-Chashchin
  • 6
  • Машинное обучение
  • Искусственный интеллект

Где живут LLM: разбираем инференс-кластер YADRO и гоняем в нем модели +21

  • 30.07.2025 08:44
  • jet-47
  • 4
  • Блог компании YADRO
  • Искусственный интеллект
  • Высоконагруженные системы
  • Машинное обучение
  • Natural Language Processing
  • «
  • 1
  • 2
  • »
Страница 1 из 2
ЛУЧШЕЕ

  • Вчера
  • Позавчера
05:06

Мне прислали фишинг под MAX. Я разобрал ссылку и нашёл уязвимость в их API +248

09:13

Центры обработки данных в космосе — это ужасная, кошмарная и совершенно бесполезная идея +39

08:05

Палиха П-750. Последний телефон с АОН двухтысячных +28

12:09

f4 0.1.1-alpha: первый публичный релиз асинхронного клона Far Manager на Go +27

09:01

Вайбкод и безопасность: как не задеплоить уязвимости вместе с фичами +26

13:01

Электровакуумные геттеры. Бариевые газопоглотители +22

08:01

Сколько памяти нужно для жизни: стресс-тест старого и нового железа +19

09:16

Я «нанял» AI-команду разработки и управлял ею через Kanban: опыт на реальном продукте +15

10:59

Copy.Fail (CVE-2026-31431) — больше чем LPE +10

09:49

Чтение на выходные: «Технофеодализм: Что убило капитализм» Яниса Варуфакиса +9

12:15

Простой мониторинг Synology NAS с Grafana и Prometheus +8

07:16

Вы неправильно используете clone() в Rust +8

14:05

Я люблю «Героев меча и магии», но пару моментов бы поменял +7

08:15

7 метрик, которых не хватало моему AI-хуманизатору. Спасибо Хабровской модерации +7

12:23

Как не сойти с ума в 2026 году +5

10:45

Разработка многосекционного гибридного СВЧ-ответвителя +5

05:40

Мой опыт установки Sentry self-hosted +5

16:49

Scala Digest. Выпуск 40 +4

13:50

People management. Изменения, которые будут стоить 0 рублей. Спойлер: потому что вы уже за это платите +4

04:12

Как «красивый» Ruby-синтаксис украл request из Grape и поломал нам Rate Limiting +4

10:32

Владелец наркобизнеса из даркнета о РКН и импортозамещении +73

07:11

Забытая, но доступная: операционная система Windows Embedded POS Ready 2009 +48

07:05

Про Турбину Теслы +46

12:15

Как действительно отдохнуть на майских +36

05:43

Zed 1.0: эпоха Electron-редакторов — всё +35

09:01

Как получить экстремальные давления «на коленке» +34

13:00

Тестируем программы для вскрытия биткойн-головоломок +31

08:00

Shrek Linux: кастомизируем Kubuntu для любителей «Шрека» +28

19:52

Далёкие гамма-небеса. Современная трактовка пузырей Ферми +23

20:58

От диплома до подвала: история браузерной игры с настоящими RC-машинками +22

12:00

Новый GPU в противовес NVIDIA? Bolt Graphics Zeus +22

11:00

Что будет, если пихать кофеин под глаза +21

13:48

MAX и метка Spyware в Cloudflare: что это значит и к чему может привести +19

10:42

Откуда в YADRO конструктивизм: ищем ответы в истории авангарда +16

08:45

Шаттлы, бомбардировщики, космические лаборатории: история аэрокосмических компьютеров IBM 4 Pi +16

08:07

Космический телескоп имени Нэнси Грейс Роман наконец-то готов +15

06:05

ТЗ за 30 минут: как быстро погружаться в новый проект без потери качества +15

16:19

Как Claude и Ollama решили мою вечную проблему на Ozon +14

19:45

Разработка с Obsidian + Claude. Практический гайд +13

16:39

Месяц утечек у Anthropic, деградация Claude Code, двойное покушение на Альтмана: главные события апреля в ИИ +13

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Владелец наркобизнеса из даркнета о РКН и импортозамещении +73

    • 183

    Zed 1.0: эпоха Electron-редакторов — всё +35

    • 118

    Мне прислали фишинг под MAX. Я разобрал ссылку и нашёл уязвимость в их API +248

    • 65

    Центры обработки данных в космосе — это ужасная, кошмарная и совершенно бесполезная идея +39

    • 56

    Про Турбину Теслы +46

    • 54

    Карпати объяснил, почему ваши навыки программирования скоро станут ненужными. Или нет -13

    • 49

    Я дал джунам тестовое уровня senior – и вот что получилось +12

    • 36

    С++ с нуля в 2026 году: почему нужно сразу учить C++20 и забыть про дедовские туториалы +12

    • 31

    MAX и метка Spyware в Cloudflare: что это значит и к чему может привести +19

    • 27

    Я люблю «Героев меча и магии», но пару моментов бы поменял +7

    • 24

    Забытая, но доступная: операционная система Windows Embedded POS Ready 2009 +48

    • 23

Подписка


  • Главная
  • Контакты
© 2026. Все публикации принадлежат авторам.