神经网络训练处理器的浮点运算优化架构

Floating Point Optimization Architecture of Neural Network Training Processor

下载PDF

导出

摘要针对神经网络训练加速器中存在权重梯度计算效率低的问题,设计了一种高性能卷积神经网络(CNN)训练处理器的浮点运算优化架构;在分析CNN训练架构基本原理的基础上,提出了包括32 bit、24 bit、16 bit和混合精度的训练优化架构,从而找到适用于低能耗且更小尺寸边缘设备的最佳浮点格式;通过现场可编程门阵列(FPGA)验证了加速器引擎可用于MNIST手写数字数据集的推理和训练,利用24 bit自定义浮点格式与16 bit脑浮点格式相结合构成混合卷积24 bit浮点格式的准确率可达到93%以上;运用台积电55 nm芯片实现优化混合精度加速器,训练每幅图像的能耗为8.51μJ。 Aiming at the low efficiency of weight gradient calculation in a neural network training accelerator,a floating-point operation optimization architecture based on the high performance convolutional neural network(CNN)training processor is designed.On the basic principle of CNN training architecture,a training optimization architecture with 32 bit,24 bit,16 bit and mixed accuracy is proposed,the best floating-point format for edge devices with low energy consumption and smaller size is found.By field programmable gate array(FPGA),the accelerator engine is used to verify the reasoning and training of MNIST handwritten digital data sets.The data with 24 bit custom floating-point format and 16 bit brain floating-point format are used to constuct that of hybrid convolution 24 bit floating-point format,which realizes the accuracy of more than 93%.TSMC 55 nm chip is used to realize the optimized hybrid accuracy of the accelerator,and the energy consumption of each image is 8.51μJ.

作者张立博李昌伟齐伟王刚戚鲁凤 ZHANG Libo;LI Changwei;QI Wei;WANG Gang;QI Lufeng(China Green Development Investment Group Co.,Ltd.,Beijing 100010,China;Shandong Luruan Digital Technology Co.,Ltd.,Jinan 250001,China)

机构地区中国绿发投资集团有限公司山东鲁软数字科技有限公司

出处《计算机测量与控制》 2023年第6期176-182,共7页 Computer Measurement &Control

基金中国绿发投资集团有限公司科技项目(CGDG529000220008)。

关键词卷积神经网络浮点运算加速器权重梯度处理器 convolutional neural network floating point operation accelerator weight gradient processor

分类号 TP183 [自动化与计算机技术—控制理论与控制工程] TN791 [电子电信—电路与系统]

引文网络
相关文献

参考文献23

1安婷,郭辉.深度学习的人工智能应用处理系统设计研究[J].现代制造技术与装备,2022,58(4):191-193. 被引量：4
2王荣,杨璐.大数据时代人工智能在计算机网络技术中的应用[J].数字通信世界,2022(5):100-102. 被引量：10
3凤雷,王宾涛,刘冰,李喜鹏.基于FPGA的深度强化学习硬件加速技术研究[J].计算机测量与控制,2022,30(6):242-247. 被引量：4
4王永甲,王瑞博,赵一阳,江先阳.基于AgInSbTe忆阻器的高效MLP神经网络[J].信息技术,2022,46(1):1-5. 被引量：2
5邝祝芳,陈清林,李林峰,邓晓衡,陈志刚.基于深度强化学习的多用户边缘计算任务卸载调度与资源分配算法[J].计算机学报,2022,45(4):812-824. 被引量：43
6杨晶晶,薛明浩,王继禾.一种面向异构边缘架构的实时高能效图像分类任务划分策略[J].小型微型计算机系统,2021,42(9):1962-1966. 被引量：1
7吴恋,赵晨洁,韦萍萍,于国龙,徐勇.基于轻量级深度网络的计算机病毒检测方法[J].计算机工程与设计,2022,43(3):632-638. 被引量：5
8王恺,严迎建,郭朋飞,朱春生,蔡爵嵩.基于改进残差网络和数据增强技术的能量分析攻击研究[J].密码学报,2020,7(4):551-564. 被引量：8
9梅志伟,王维东.基于FPGA的卷积神经网络加速模块设计[J].南京大学学报（自然科学版）,2020,56(4):581-590. 被引量：3
10宗德才,王康康.TEC-XP16教学机浮点运算指令快速设计方法[J].计算机与现代化,2021(8):77-84. 被引量：1

二级参考文献123

1卿宗胜,高云鹏,吴聪,杨佳伟,王庆凯.基于自适应VMD和改进功率谱估计的球磨机负荷特征提取[J].仪器仪表学报,2020(5):234-241. 被引量：30
2张贤坤,任静,刘渊博,苏静.基于节点属性的社区发现博弈算法[J].计算机应用研究,2020,37(1):80-84. 被引量：2
3戚梅,张鹏,东野长磊.基于cpld组合逻辑控制器模型机的设计与实现[J].实验室研究与探索,2010,29(7):64-66. 被引量：7
4王荣,赵建功.教学机微程序控制器设计[J].天中学刊,2004,19(5):53-54. 被引量：2
5高建荣.基于微程序控制器的在线指令系统的设计[J].计算机工程与设计,2004,25(12):2366-2368. 被引量：5
6魏星原,宋斌,郑效忠.载荷识别的逆系统方法[J].振动．测试与诊断,1995,15(3):35-43. 被引量：15
7张方,朱德懋.基于广义正交域的一种动载荷识别方法研究[J].南京航空航天大学学报,1996,28(6):755-760. 被引量：17
8崔小乐,陈红英,崔小欣,张兴.一种软硬件协同设计工具原型及其设计描述方法[J].微电子学与计算机,2007,24(6):28-30. 被引量：4
9张方,朱德懋.基于神经网络模型的动载荷识别[J].振动工程学报,1997,10(2):156-162. 被引量：29
10王鹏.TH—union教学机微程序控制器部件实验的实现[J].赤峰学院学报（自然科学版）,2008,24(1):82-83. 被引量：4

共引文献114

1徐坤财,冯宝,陈业航,刘昱,周皓阳,陈相猛.结合深度学习与改进的极限学习机的集成学习胸腺瘤CT图像预测方法[J].计算机科学,2022,49(S02):455-460. 被引量：1
2葛佳伟,王娟,石磊,陈丁.计算机视觉对抗攻击与防御方法分析[J].智能安全,2023,2(2):48-56. 被引量：1
3郑士芹.基于MLP神经网络的分组密码算法能量分析研究[J].网络安全技术与应用,2021(4):27-28. 被引量：1
4翟肇裕,曹益飞,徐焕良,袁培森,王浩云.农作物病虫害识别关键技术研究综述[J].农业机械学报,2021,52(7):1-18. 被引量：125
5唐善成,张雪,张镤月,王瀚博,陈明.融合中文字形和字义的字向量表示方法[J].科学技术与工程,2021,21(32):13787-13792. 被引量：7
6陈文新.数字电视发射机的维护和检修分析[J].集成电路应用,2021,38(10):44-45. 被引量：1
7汪晶,王恺,严迎建.基于条件生成对抗网络的侧信道攻击技术研究[J].计算机工程与应用,2022,58(6):110-117. 被引量：3
8郑东,李亚宁,张美玲.基于CBAPD网络的侧信道攻击[J].密码学报,2022,9(2):308-321. 被引量：1
9马璐.基于DR-CNN方法的图像质量评价[J].宿州学院学报,2022,37(6):12-15. 被引量：1
10胡松涛.基于深度神经网络的模糊图像分割方法研究[J].信息记录材料,2022,23(6):203-206.

1李伟豪,詹炜,周婉,韩涛,王佩文,刘虎,熊梦园,孙泳.轻量型Yolov7-TSA网络在茶叶病害检测识别中的研究与应用[J].河南农业科学,2023,52(5):162-169. 被引量：14
2丁泽云.基于生成对抗网络的手写数字生成模型对比分析[J].现代工业经济和信息化,2023,13(4):263-265. 被引量：2
3张鹏程,余勇华,陈传武,郑文燕,李善军.基于改进MobileNetV2的柑橘害虫分类识别方法[J].华中农业大学学报,2023,42(3):161-168. 被引量：7
4何媛媛,胡素平,李春芬,孙燕国,何虎.基于LeNet-5卷积神经网络的物探野外手写数字识别方法与实现[J].物探装备,2023,33(1):52-55.
5王硕,张景璐,裴春梅.基于ZYNQ的随机森林分类器实现[J].今日制造与升级,2023(2):17-19.
6王超,查晓婧,夏银水.面向电压降的忆阻神经网络精度优化[J].计算机辅助设计与图形学学报,2023,35(4):633-639.

计算机测量与控制

2023年第6期

浏览历史

内容加载中请稍等...

神经网络训练处理器的浮点运算优化架构

参考文献23

二级参考文献123

共引文献114

相关作者

相关机构

相关主题

浏览历史