面向FPGA的卷积神经网络压缩平台

Neural Network Compression Platform on FPGA

下载PDF

导出

摘要模型压缩对于在资源有限的设备上实时部署卷积神经网络(CNNs)非常重要。采用模型剪枝和量化作为主要方案,由于剪枝的解空间较大,剪枝结构优化仍然具有挑战性,同时由于指令集的不同需要设计面向FPGA的手动量化。提出了一种剪枝子结构优化方法来提高FPGA资源利用率,并对剪枝模型进行训练后手动量化。使用Wasserstein距离测量各层过滤器的灵敏度,揭示了模型性能和特征图的Wasserstein距离之间的联系,采用动态规划算法以指导剪枝子结构优化。针对FPGA手动设计8比特量化方案,降低了计算成本和推理时延。在ImageNet数据集上对VGG-16取得了27倍的压缩,同时在加速器上推理一张图片仅需7.1 ms。 A pruned sub-structure optimization method is proposed to improve FPGA resource utilization and to manually quantize the pruned model.This paper uses the distance to measure the sensitivity of filters,and reveals the connection between model performance and Wasserstein distance between feature maps,and a dynamic programming algorithm is used to guide the pruned sub-structure optimization.The 8-bit quantization scheme is manually designed for FPGAs to reduce computational cost and inference latency.A 27-fold compression is achieved on VGG-16 with ImageNet dataset,while inferencing an image just need 7.1 ms on the accelerator.

作者孙琪茗曹姗

机构地区上海大学通信与信息工程学院

出处《工业控制计算机》 2023年第10期119-121,共3页 Industrial Control Computer

基金国家自然科学基金项目(61904101) 上海科技委员会(21ZR1422200) 国家重点研发计划资助(2019YFE0196600)。

关键词模型剪枝子结构优化灵敏度手动量化现场可编程门阵列 model pruning sub-structure optimization sensitivity manual quantization field programmable gate array

分类号 TP183 [自动化与计算机技术—控制理论与控制工程] TN791 [电子电信—电路与系统]

引文网络
相关文献

参考文献2

1何家俊,苏成悦,罗荣芳,施振华,陈堆钰,罗俊丰.基于FPGA的量化推理CNN加速系统研究与设计[J].计算机测量与控制,2022,30(9):162-169. 被引量：2
2满涛,郭子豪,曲志坚.卷积神经网络的FPGA并行加速设计与实现[J].电讯技术,2021,61(11):1438-1445. 被引量：9

二级参考文献11

1王海,阙沛文.超声信号采集模块的设计[J].计算机测量与控制,2007,15(6):816-819. 被引量：2
2许思琦.基于Linux的FPGA+ARM高速数据采集系统设计[J].计算机测量与控制,2017,25(4):172-175. 被引量：3
3李小燕,张欣,闫小兵,任德亮,李彦青,傅长娟.基于FPGA的卷积神经网络加速系统[J].河北大学学报（自然科学版）,2019,39(1):99-105. 被引量：6
4郑文凯,杨济民.在FPGA上实现及优化加速卷积神经网络的方法[J].山东师范大学学报（自然科学版）,2019,34(2):186-192. 被引量：3
5窦阳,卿粼波,何小海,廖海鹏.基于FPGA的CNN加速器设计与实现[J].信息技术与网络安全,2019,38(11):96-101. 被引量：6
6吴艳霞,梁楷,刘颖,崔慧敏.深度学习FPGA加速器的进展与趋势[J].计算机学报,2019,42(11):2461-2480. 被引量：63
7孙磊,肖金球,夏禹,顾敏明.改进的基于嵌入式SoC卷积神经网络识别模型[J].计算机应用与软件,2020,37(3):257-260. 被引量：5
8雷小康,尹志刚,赵瑞莲.基于FPGA的卷积神经网络定点加速[J].计算机应用,2020,40(10):2811-2816. 被引量：11
9马晓光,蒋占军.卷积神经网络图像识别算法的FPGA加速优化研究[J].兰州交通大学学报,2021,40(5):51-57. 被引量：3
10满涛,郭子豪,曲志坚.卷积神经网络的FPGA并行加速设计与实现[J].电讯技术,2021,61(11):1438-1445. 被引量：9

共引文献9

1吴宇航,何军.基于FPGA加速的行为识别算法研究[J].电子测量技术,2022,45(13):25-32. 被引量：5
2何家俊,苏成悦,罗荣芳,施振华,陈堆钰,罗俊丰.基于FPGA的量化推理CNN加速系统研究与设计[J].计算机测量与控制,2022,30(9):162-169. 被引量：2
3贾子龙,潘士杰,郭子昊,唐进,姚燕.基于FPGA的声纹识别系统设计[J].电子器件,2022,45(4):997-1003. 被引量：2
4谭会生,徐界铭,张驾祥.BP神经网络FPGA实现结构的优化设计[J].计算机工程与应用,2022,58(21):264-271. 被引量：6
5谢文鑫,史纪广,李宙童,黄启俊.心电信号监测轻量化残差神经网络硬件IP设计[J].电子设计工程,2023,31(19):15-19.
6齐娜,傅巍,李金平,吕颖,刘海龙.基于水声传感器的高保真加密传输方法[J].传感器与微系统,2024,43(1):153-156. 被引量：1
7乔建华,吴言,栗亚宁,雷光政.面向微控制器的卷积神经网络加速器设计[J].电子器件,2024,47(1):48-54.
8刘谦,王林林,周文勃.基于FPGA的YOLOv5s网络高效卷积加速器设计[J].电讯技术,2024,64(3):366-375. 被引量：2
9吴铭,黄国宁,汪保祥,宋可平,鄢秋荣,吴武飞.基于FPGA的多路视频采集及AI加速[J].南昌大学学报（工科版）,2024,46(3):386-394.

1黄丹阳,罗伊琳,朱映秋.面向第三方支付平台非结构化大数据分布特征的融合聚类算法[J].经济管理学刊,2023,2(3):179-208. 被引量：1
2牟唯嫣,靳旭玲,熊世峰.Wasserstein空间最大最小距离设计的构造及其近似算法[J].系统科学与数学,2023,43(9):2364-2372. 被引量：2
3邱晓蕾,张红梅,严海兵.基于量化的CNN恶意代码检测方法[J].计算机仿真,2023,40(7):224-228. 被引量：2
4李瑞明,余强,吴煜锴.车速预测的增程式电动汽车能量管理策略[J].西安工业大学学报,2023,43(5):447-459. 被引量：1
5李川.基于道路设计与交通规划的道路选线优化模型[J].地产,2023(23):55-57.
6王浩元,别朝红.考虑不确定性物理边界的灵活爬坡备用分布鲁棒经济调度[J].电力自动化设备,2023,43(10):59-68. 被引量：2
7唐剑兰,蔡茂国,徐翔.基于精英反向学习和对数螺旋的HHO算法[J].计算机仿真,2023,40(9):364-370.
8吴钧皓,戚远航,罗浩宇,柯炳明.带交叉策略的粒子群算法求解多无人机路径规划问题[J].工业控制计算机,2023,36(10):94-95. 被引量：3
9康守强,杨加伟,王玉静,王庆岩,谢金宝.基于联邦多表示域适应的不同工况下滚动轴承故障诊断方法[J].仪器仪表学报,2023,44(6):165-176. 被引量：10
10周中,张俊杰,鲁四平.基于改进YOLOv4的隧道衬砌裂缝检测算法[J].铁道学报,2023,45(10):162-170. 被引量：13

工业控制计算机

2023年第10期

浏览历史

内容加载中请稍等...

面向FPGA的卷积神经网络压缩平台

参考文献2

二级参考文献11

共引文献9

相关作者

相关机构

相关主题

浏览历史