基于FPGA的卷积神经网络加速系统被引量：6

Convolutional neural network acceleration system based on FPGA

下载PDF

导出

摘要以在现场可编程门阵列(FPGA)上部署卷积神经网络为背景,提出了卷积神经网络在硬件上进行并行加速的方案.主要是通过分析卷积神经网络的结构特点,对数据的存储、读取、搬移以流水式的方式进行,对卷积神经网络中的每一层内的卷积运算单元进行展开,加速乘加操作.基于FPGA特有的并行化结构和流水线的处理方式可以很好地提升运算效率,从对ciafr-10数据集的物体分类结果看,在不损失正确率的前提下,当时钟工作在800 MHz时,相较于中端的Intel处理器,可实现4倍左右的加速.卷积神经网络通过循环展开并行处理以及多级流水线的处理方式,可以加速卷积神经网络的前向传播,适合于实际工程任务中的需要. In this paper, the convolutional neural network is deployed on the Field Programmable Gate Array(FPGA). As a background, a convolutional neural network is proposed to accelerate hardware. The paper analyzes the structural characteristics of convolutional neural networks, stores, reads, and moves data in a stream-style manner. Next, the convolution unit in each layer of the convolutional neural network is expanded to speed up the multiplication and addition operations. Based on the(FPGA) unique parallel structure, pipeline processing method can effectively improve the efficiency of the operation. From object classification results for the ciafr-10 dataset, at 800 MHz operating frequency and without loss of accuracy, FPGA compared to General purpose processor can achieve 4 times speed up, Convolutional neural network through parallel process and multi-stage pipeline process can accelerate forward propagation of convolutional neural networks, being suitable for the demand of practical engineering tasks.

作者李小燕张欣闫小兵任德亮李彦青傅长娟 LI Xiaoyan;ZHANG Xin;YAN Xiaobing;REN Deliang;LI Yanqing;FU Changjuan(College of Telecommunications and Information Engineering,Hebei University,Baoding 071002,China;Baoding Yonghong Foundry Machinery Factory,Baoding 072150,China)

机构地区河北大学电信与信息工程系保定永红铸造机械厂

出处《河北大学学报（自然科学版）》 CAS 北大核心 2019年第1期99-105,共7页 Journal of Hebei University(Natural Science Edition)

基金国家自然科学基金资助项目(61674050)

关键词现场可编程门阵列(FPGA) 卷积神经网络并行化流水线分类加速 field programmable gate array (FPGA) convolutional neural network parallelization stream-style classification accelerate

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献34

1唐露,王从庆.基于Tree-CNN的飞机腐蚀铆钉分类[J].吉林大学学报（信息科学版）,2020,38(1):55-63. 被引量：1
2姜秋喜,潘继飞,毕大平.匹配模板法在雷达信号识别中的应用[J].电讯技术,2005,45(5):31-35. 被引量：5
3张毅民,白家瑞,刘红莎,汤桂兰,胡彪.基于近红外的Fisher判别法鉴别废塑料[J].工程塑料应用,2014,42(5):75-79. 被引量：13
4张榜,来金梅.一种基于FPGA的卷积神经网络加速器的设计与实现[J].复旦学报（自然科学版）,2018,57(2):236-242. 被引量：15
5卢冶,陈瑶,李涛,蔡瑞初,宫晓利.面向边缘计算的嵌入式FPGA卷积神经网络构建方法[J].计算机研究与发展,2018,55(3):551-562. 被引量：47
6郑文凯,杨济民.在FPGA上实现及优化加速卷积神经网络的方法[J].山东师范大学学报（自然科学版）,2019,34(2):186-192. 被引量：3
7曾成龙,刘强.面向嵌入式FPGA的高性能卷积神经网络加速器设计[J].计算机辅助设计与图形学学报,2019,31(9):1645-1652. 被引量：11
8呙鹏程,吴礼洋.融合卷积特征与判别字典学习的低截获概率雷达信号识别[J].兵工学报,2019,40(9):1881-1889. 被引量：7
9陈辰,柴志雷,夏珺.基于Zynq7000 FPGA异构平台的YOLOv2加速器设计与实现[J].计算机科学与探索,2019,13(10):1677-1693. 被引量：22
10窦阳,卿粼波,何小海,廖海鹏.基于FPGA的CNN加速器设计与实现[J].信息技术与网络安全,2019,38(11):96-101. 被引量：6

引证文献6

1阚保强.面向硬件加速的通用图像卷积实验平台[J].计算机系统应用,2021,30(2):77-82.
2梁洪卫,白鹏程,陈建玲,孙勤江,陈明虎,薛祥凯.基于FPGA的YOLOv2加速器设计[J].吉林大学学报（信息科学版）,2021,39(4):445-450. 被引量：1
3满涛,郭子豪,曲志坚.卷积神经网络的FPGA并行加速设计与实现[J].电讯技术,2021,61(11):1438-1445. 被引量：9
4龚豪杰,周海,冯水春.基于FPGA的卷积神经网络并行加速设计[J].计算机工程与设计,2022,43(7):1872-1878. 被引量：7
5肖帅,龚帅阁,李想,王昊,陶诗飞.FPGA平台轻量化卷积神经网络辐射源信号识别方法[J].计算技术与自动化,2023,42(4):140-146. 被引量：3
6陆川,黄志禹,梁凤霞,朱志国,罗林保.塑料分选方法设计及Zynq实现[J].智能计算机与应用,2025,15(1):187-193.

二级引证文献19

1吴宇航,何军.基于FPGA加速的行为识别算法研究[J].电子测量技术,2022,45(13):25-32. 被引量：5
2何家俊,苏成悦,罗荣芳,施振华,陈堆钰,罗俊丰.基于FPGA的量化推理CNN加速系统研究与设计[J].计算机测量与控制,2022,30(9):162-169. 被引量：2
3贾子龙,潘士杰,郭子昊,唐进,姚燕.基于FPGA的声纹识别系统设计[J].电子器件,2022,45(4):997-1003. 被引量：2
4谭会生,徐界铭,张驾祥.BP神经网络FPGA实现结构的优化设计[J].计算机工程与应用,2022,58(21):264-271. 被引量：6
5马向南,杨涛,王云龙,袁虎强,刘志坚,何蔚.基于轻量化神经网络及模型压缩的变压器油色谱故障诊断方法[J].供用电,2023,40(5):84-91. 被引量：11
6韦苏伦,陶青川.基于HLS的MobileNet加速器实现[J].现代计算机,2023,29(8):91-97. 被引量：1
7谢文鑫,史纪广,李宙童,黄启俊.心电信号监测轻量化残差神经网络硬件IP设计[J].电子设计工程,2023,31(19):15-19.
8孙琪茗,曹姗.面向FPGA的卷积神经网络压缩平台[J].工业控制计算机,2023,36(10):119-121.
9齐娜,傅巍,李金平,吕颖,刘海龙.基于水声传感器的高保真加密传输方法[J].传感器与微系统,2024,43(1):153-156. 被引量：1
10周扬维,尹震宇,王军,张飞青,徐光远,徐福龙.基于ZYNQ平台的图像分类加速器设计与实现[J].小型微型计算机系统,2024,45(1):224-229.

1邢飞.山西省资源型经济转型的困境分析及其对策[J].现代商业,2018(35):63-64.
2任鹏飞.党风廉政建设第三方评估的检视与优化——基于E市实践的分析[J].中共福建省委党校学报,2019,0(1):32-39. 被引量：5
3赵梦伟,陈永锋,刘凯,孙超群.基于MIC的Turbo码译码并行加速[J].电子测量技术,2019,42(1):126-131. 被引量：2
4杜剑英,韦卓,任清安.靶场弹道测量雷达开放系统架构设计[J].空军预警学院学报,2019,33(1):50-53. 被引量：1
5王亚茹,王鹏,王德志.基于MPI的多核并行模式的性能测试与分析[J].成都信息工程大学学报,2018,33(6):617-623. 被引量：4
6马宇,王亚辉,彭星杰,夏榜样.GPU加速的中子输运稳态格子Boltzmann方法[J].核动力工程,2018,39(S2):6-9.
7张云鹏,毕大平,周阳,张博,房明星.余弦调相散射波干扰对SAR双通道对消干扰抑制的影响[J].遥感学报,2019,23(1):99-107. 被引量：5

河北大学学报（自然科学版）

2019年第1期

浏览历史

内容加载中请稍等...

基于FPGA的卷积神经网络加速系统被引量：6

同被引文献34

引证文献6

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

基于FPGA的卷积神经网络加速系统 被引量：6

同被引文献34

引证文献6

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

基于FPGA的卷积神经网络加速系统被引量：6