面向嵌入式系统的深度神经网络压缩和加速方法及系统

发布日期：2019-12-05 来源：301.0 点击：

本发明公开了一种面向嵌入式系统的深度神经网络压缩方法及系统，所述方法包括：获取待压缩的原始神经网络模型；对所述神经网络模型中各层的过滤器/输出神经元进行重要性评估；基于重要性评估结果，对所述神经网络模型中各层的过滤器/输出神经元采用聚类方法进行分组；根据预设的每层的压缩率，采用聚类中心确定弱连接并进行裁剪，得到压缩后的模型；将压缩后的模型通过局部和全局微调恢复它的识别性能；将所述压缩后的模型部署到嵌入式系统中，采用本发明的压缩方法，一方面降低网络的存储空间和加速网络的推断，另一方面保持网络的识别精度。

面向嵌入式系统的深度神经网络压缩和加速方法及系统

联系我们

友情链接