vLLM, LoRA и GPU-кластеры: техническая анатомия обогащения поисковой выдачи Авито мультимодальными моделями 23.04.2026 09:12 Kirill0720 0 Блог компании AvitoTech Машинное обучение Искусственный интеллект
Compute crunch пришёл: как считать экономику LLM в 2026 +7 17.04.2026 18:33 Xronofag 7 Анализ и проектирование систем Бизнес-модели Искусственный интеллект Облачные вычисления
DRAматургия GPU в Kubernetes: зачем нужен DRA, если Device Plugin работает? Разбираем грабли AI-инфраструктуры +14 08.04.2026 09:31 Myskat_90 2 Блог компании Флант DevOps Kubernetes Искусственный интеллект IT-инфраструктура
TurboQuant. Новый алгоритм сжатия от Google +12 25.03.2026 20:46 meliksetyan 10 Сжатие данных Алгоритмы Исследования и прогнозы в IT
Конец эпохи вероятностного ИИ: почему гонка за GPU от Nvidia — это архитектурный тупик -4 24.03.2026 07:43 Aqsaqal 20 Машинное обучение Проектирование и рефакторинг IT-инфраструктура Алгоритмы Высоконагруженные системы
Линейка HighFreq или как выжать из облака максимум для инференса, ML и других высоких нагрузок +40 13.03.2026 08:00 oneastok 0 Блог компании Selectel IT-инфраструктура IT-компании Высоконагруженные системы Машинное обучение
Как мы запустили GPU NVIDIA H200 в Selectel, или почему в золотую лихорадку непросто продавать лопаты +46 10.10.2025 09:30 skovalev 11 Блог компании Selectel IT-инфраструктура IT-компании Искусственный интеллект Машинное обучение
Что нового в NVIDIA Rubin CPX — платформе для AI, представленной на AI Infra Summit +5 25.09.2025 06:26 mClouds_editor 5 Блог компании mClouds.ru IT-инфраструктура Искусственный интеллект Компьютерное железо Читальный зал
Архитектура LPU и будущее AI без задержек +2 11.09.2025 10:20 python_leader 0 Искусственный интеллект Будущее здесь Машинное обучение Исследования и прогнозы в IT
Как приручить LLM: подбор инфраструктуры для инференса. Часть 1 +43 29.08.2025 08:01 antonaleks605 2 Блог компании Selectel IT-инфраструктура Машинное обучение Высоконагруженные системы IT-компании
LLM-инференс в 20 раз быстрее, чем на GPU! Как подключить агента-кодера с CLINE и Cerebras -2 22.08.2025 09:56 bogdoslavik 0 Программирование Лайфхаки для гиков Текстовые редакторы и IDE
Оптимизация инференса больших языковых моделей: комплексный анализ современных подходов и практических реализаций +3 11.08.2025 16:10 ivan_isaev 1 Python Работа с видео Обработка изображений
Сравнение двух СнК одного тех. процесса с точки зрения инференса нейронных сетей +2 02.07.2025 07:15 NelSon29 4 Искусственный интеллект Процессоры
Что же такое TPU +83 25.06.2025 13:01 interpres 12 Блог компании RUVDS.com Машинное обучение Компьютерное железо Процессоры Искусственный интеллект
Видеокарты для нейросетей: две RTX 5060 Ti 16GB или одна RTX 3090 24GB? Тест LLM‑инференса +25 18.06.2025 08:00 dmitrifriend 34 Блог компании BotHub Компьютерное железо Искусственный интеллект Машинное обучение