期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
面向深度学习训练的内存交换机制综述 被引量:1
1
作者 高赫然 吴恒 +3 位作者 许源佳 李修和 王焘 张文博 《软件学报》 EI CSCD 北大核心 2023年第12期5862-5886,共25页
随着深度学习技术的快速发展和深入应用,深度学习训练规模持续增大,内存不足已成为影响深度学习可用性的主要瓶颈之一.内存交换机制是应对深度学习训练内存问题的关键技术,该机制利用深度学习训练内存需求的“时变”特征,在专用计算加... 随着深度学习技术的快速发展和深入应用,深度学习训练规模持续增大,内存不足已成为影响深度学习可用性的主要瓶颈之一.内存交换机制是应对深度学习训练内存问题的关键技术,该机制利用深度学习训练内存需求的“时变”特征,在专用计算加速设备内存与外部存储之间按需移动数据,通过瞬时内存需求替代累积内存需求,保障深度学习训练任务的运行.对面向深度学习训练的内存交换机制进行综述,以深度学习训练内存需求的时变特征为研究视角,分别针对基于算子运行特征的内存换出机制、基于数据依赖关系的内存换入机制以及效能驱动的联合换出与换入决策等重要研究工作进行了总结分析,并针对该技术领域的发展方向进行了展望. 展开更多
关键词 深度学习训练 内存交换 内存需求特征
在线阅读 下载PDF
基于性能建模的深度学习训练任务调度综述
2
作者 杨紫超 吴恒 +1 位作者 吴悦文 张文博 《软件学报》 2025年第4期1570-1589,共20页
近年来,深度学习研究成果在全球范围内得到广泛应用.为了提高大规模深度学习模型的训练效率,业界通常采用建设GPU集群并配置高效的任务调度器的策略.然而,深度学习训练任务具有性能异构性和放置拓扑敏感性等复杂性能特性.对性能无感知... 近年来,深度学习研究成果在全球范围内得到广泛应用.为了提高大规模深度学习模型的训练效率,业界通常采用建设GPU集群并配置高效的任务调度器的策略.然而,深度学习训练任务具有性能异构性和放置拓扑敏感性等复杂性能特性.对性能无感知的调度容易导致资源利用率低下、训练效率差等问题.为了应对这一挑战,近期涌现出大量基于性能建模的深度学习训练任务调度器.这些调度器通过构建精确的性能模型,深入了解任务的复杂性能特性,并据此设计更优化的调度算法,从而形成更高效的调度方案.首先基于建模设计思路,对目前调度器使用的性能建模方法进行分类综述.随后,根据调度器利用性能建模的调度优化途径,对现有的任务调度工作进行系统性分析.最后,对性能建模与调度在未来的研究方向进行展望. 展开更多
关键词 深度学习训练 性能建模 任务调度
在线阅读 下载PDF
基于深度学习的仿生偏振视觉固/气热源识别技术研究
3
作者 原帅 欧阳名钊 +4 位作者 付跃刚 杨晨南 许俊伟 程庆庆 李亚红 《红外与激光工程》 CSCD 北大核心 2024年第12期198-207,共10页
基于仿生偏振视觉原理,开展了高温固/气热源目标长波红外偏振识别技术研究。以高温金属热源和丁烷气体燃烧热源为研究对象,提出将不同通道偏振距离图像进行融合,分析高温状态下固/气热源目标偏振特性及目标背景对比度特征。同时,结合深... 基于仿生偏振视觉原理,开展了高温固/气热源目标长波红外偏振识别技术研究。以高温金属热源和丁烷气体燃烧热源为研究对象,提出将不同通道偏振距离图像进行融合,分析高温状态下固/气热源目标偏振特性及目标背景对比度特征。同时,结合深度学习技术,构建三类偏振距离红外融合图像数据集,使用YOLOv8网络对其中固/气热源目标进行分类识别。结果表明,双通道偏振距离图像中高温固体热源表现出边缘偏振信息,三、四通道偏振距离中伪装热源目标体现出边缘和纹理特征,二者在噪声环境中对比度高。其中,三通道偏振距离对比度表现最优。相较于原偏振距离图像,融合图像目标背景对比度得到增强。三类数据集中固/气热源目标可被有效识别,mAP0.5达到99%以上,mAP0.5∶0.95值234组合达到73.7%,223组合达到75.2%,443组合达到67.3%。实现了多通道组合下的高温固/气目标物分类识别比较研究,验证了红外目标偏振技术在固/气热源目标识别方面的可行性。 展开更多
关键词 红外固/气热源目标 仿生偏振视觉 偏振特征识别 深度学习训练
在线阅读 下载PDF
基于深度学习训练平台的缓存联合部署策略研究
4
作者 鲍裕麟 郑烇 《电子技术(上海)》 2021年第7期61-67,共7页
阐述各类Internet服务与智能手机应用程序,每分钟都会产生大量数据,这大大刺激了包括深度学习在内的数据收集、存储、分析需求。但是,探讨如何优化深度学习训练平台的I/O表现,目前的研究成果还比较少。从"类脑智能开放平台"... 阐述各类Internet服务与智能手机应用程序,每分钟都会产生大量数据,这大大刺激了包括深度学习在内的数据收集、存储、分析需求。但是,探讨如何优化深度学习训练平台的I/O表现,目前的研究成果还比较少。从"类脑智能开放平台"真实数据出发,分析了深度学习训练平台I/O特性,并基于以上,兼顾缓存命中率与节点负载均衡,提出了缓存联合部署策略。仿真结果表明,相比于常用的LRU策略,提出的策略具有更高的缓存命中率,且各计算节点之间的负载较为均衡,从而较好地优化了深度学习应用的I/O表现。 展开更多
关键词 深度学习训练平台 I/O特性 缓存策略 部署策略
原文传递
基于国产软硬件的深度学习平台设计与验证
5
作者 吕昊 郭江宇 +2 位作者 郝志超 庄成 刘健 《火力与指挥控制》 CSCD 北大核心 2023年第7期134-139,共6页
随着国内外政治经济形势的日益变化,实现核心技术的自主可控显得尤为重要。深度学习被应用到生活以及军事领域中,实现深度学习模型训练及推理的国产化具有重要意义。设计了一种基于全国产软硬件的深度学习平台,实现目标识别领域模型的训... 随着国内外政治经济形势的日益变化,实现核心技术的自主可控显得尤为重要。深度学习被应用到生活以及军事领域中,实现深度学习模型训练及推理的国产化具有重要意义。设计了一种基于全国产软硬件的深度学习平台,实现目标识别领域模型的训练,并搭建目标跟踪系统,对深度学习训练平台的实用性进行验证。 展开更多
关键词 国产软硬件 深度学习训练平台 PP-YOLO 目标跟踪
在线阅读 下载PDF
基于迁移学习的商品图像检测方法 被引量:2
6
作者 胡正委 朱明 《计算机系统应用》 2018年第10期226-231,共6页
近年来,对象识别方法被应用到多个领域.如人脸检测,车辆检测.然而模型训练所需要的边框标定需要很大的工作量.本文通过基于迁移学习的方法,将物体检测任务迁移到商品检测,且不需要边框标定.本文在分类层和边框回归层之间建立关系层,来... 近年来,对象识别方法被应用到多个领域.如人脸检测,车辆检测.然而模型训练所需要的边框标定需要很大的工作量.本文通过基于迁移学习的方法,将物体检测任务迁移到商品检测,且不需要边框标定.本文在分类层和边框回归层之间建立关系层,来学习两种任务之间的关联.本文建立了一个商品数据集,并提出了一种深度学习训练方法,解决了可旋转物体的检测问题.基于Faster RCNN框架,本文提出一种候选选择方法,可以在无边框标定情况下训练商品分类.本文提出的商品检测方法不需要边框标定,而且很容易训练并应用到其它数据集. 展开更多
关键词 物体检测 迁移学习 关系层 深度学习训练方法 边框标定
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部