Quantization Aware Training. Или как правильно использовать fp16 inference в TensorRT +2 21.05.2021 09:22 pagin 7 Машинное обучение Искусственный интеллект Программирование Высокая производительность Серверная оптимизация
Джедайская техника уменьшения сверточных сетей — pruning +21 27.12.2019 07:10 pagin 4 Машинное обучение Искусственный интеллект Программирование Высокая производительность Python Исследования и прогнозы в IT