Квантизация больших языковых моделей: FP32, BF16, INT8, NF4 и QLoRA 15.05.2026 12:57 Qwertcoser 0 Машинное обучение Алгоритмы Высоконагруженные системы Облачные вычисления Big Data
Как засунуть 62ГБ в 15ГБ и не сойти с ума: Партизанский MLOps на примере Gemma 4 31B +8 02.04.2026 18:33 Livadies 13 Машинное обучение Искусственный интеллект Python DevOps Open source