Публикации с тегом NF4 / forpes.ru

Публикации с тегом NF4

Квантизация больших языковых моделей: FP32, BF16, INT8, NF4 и QLoRA

Как засунуть 62ГБ в 15ГБ и не сойти с ума: Партизанский MLOps на примере Gemma 4 31B +8

Страница 1 из 1