本发明公开了一种面向嵌入式系统的深度神经网络压缩方法及系统,所述方法包括:获取待压缩的原始神经网络模型;对所述神经网络模型中各层的过滤器/输出神经元进行重要性评估;基于重要性评估结果,对所述神经网络模型中各层的过滤器/输出神经元采用聚类方法进行分组;根据预设的每层的压缩率,采用聚类中心确定弱连接并进行裁剪,得到压缩后的模型;将压缩后的模型通过局部和全局微调恢复它的识别性能;将所述压缩后的模型部署到嵌入式系统中,采用本发明的压缩方法,一方面降低网络的存储空间和加速网络的推断,另一方面保持网络的识别精度。