深度压缩网络详解

Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding 神经网络是计算密集型和内存密集型,很难使它们用有限的硬件资源去部署在嵌入式系统中。为了解决这种限制,本文引入“深度压缩”,一共有三个阶段的流水线:剪枝、量化和霍夫编码,它们一起工作去减...