Скрытая цена LLM: как KV-cache увеличивает стоимость инференса и как эту проблему решает Google TurboQuant +20 04.05.2026 07:00 konstantin_kozhin 0 Блог компании МТС Искусственный интеллект Машинное обучение Natural Language Processing Сжатие данных