Quantization Aware Training. Или как правильно использовать fp16 inference в TensorRT +2 21.05.2021 09:22 pagin 7 Высокая производительность Программирование Серверная оптимизация Машинное обучение Искусственный интеллект
Джедайская техника уменьшения сверточных сетей — pruning +21 27.12.2019 07:10 pagin 4 Исследования и прогнозы в IT Высокая производительность Python Программирование Машинное обучение Искусственный интеллект