基于强化学习的多机协同传感器管理被引量：8

Multi-airborne cooperative sensor management based on reinforcement learning

下载PDF

导出

摘要网络化战争中,机载雷达在实现对目标信息持续获取的同时保证载机安全生存是亟待解决的问题。对此,以多机协同作战安全转场任务为背景,提出基于深度强化学习算法的智能传感器管理方法。首先,综合考虑信号辐射量与目标威胁因素,计算目标运动过程中的实时威胁隶属度。其次,在强化学习框架下对雷达-目标分派问题建模,利用神经网络逼近动作-值函数,并根据时序差分算法进行参数更新。仿真结果表明,相比于传统调度方法,所提算法有效提升了任务成功率,缩短了任务完成用时。 In the networked war,it is urgent that airborne radar can continuously acquire target information while ensuring the safe survival.Focusing on this problem,in the context of safe transition tasks of multi-airborne cooperative operations,this paper proposes a intelligent sensor management method based on deep reinforcement learning.First,the real-time threat membership is calculated considering the signal radiation and several threat factors.Then,the radar-target assignment problem is modeled in a reinforcement learning framework.The neural network is used to approximate the action-value function,and the parameters are updated according to the temporal-difference algorithm.It can be seen from the simulation that the proposed algorithm improves the task success rate and shortens the time of task completion compared with the traditional scheduling methods.

作者闫实贺静王跃东孙自强梁彦 YAN Shi;HE Jing;WANG Yuedong;SUN Ziqiang;LIANG Yan(School of Automation,Northwestern Polytechnical University,Xi’an 710072,China;Key Laboratory of Information Fusion,Ministry of Education,Xi’an 710072,China;Nanjing Institute of Electronic Technology,Nanjing 210039,China)

机构地区西北工业大学自动化学院信息融合教育部重点实验室南京电子技术研究所

出处《系统工程与电子技术》 EI CSCD 北大核心 2020年第8期1726-1733,共8页 Systems Engineering and Electronics

基金国家自然科学基金(61771399,61873205)资助课题。

关键词传感器管理强化学习威胁隶属度 sensor management reinforcement learning threat membership

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献7

1刘先省,申石磊,潘泉,张洪才.基于信息熵的一种传感器管理算法[J].电子学报,2000,28(9):39-41. 被引量：35
2李俊,郝成民,刘湘伟.改进PSO算法在雷达干扰任务分配中的应用[J].计算机仿真,2008,25(12):27-30. 被引量：8
3闫涛,韩崇昭,张光华.空中目标传感器管理方法综述[J].航空学报,2018,39(10):21-31. 被引量：19
4闫冲冲,郝永生.基于层次分析法(AHP)的空中目标威胁度估计[J].计算技术与自动化,2011,30(2):118-121. 被引量：27
5刘顺利,陈亚生,陈琳.基于Agent的空中目标威胁度评估模型[J].弹箭与制导学报,2010,30(6):212-215. 被引量：5
6徐瑞阳,冯新喜.基于矩阵遗传的传感器管理算法[J].现代雷达,2016,38(1):42-46. 被引量：4
7何友,关欣,王国宏.多传感器信息融合研究进展与展望[J].宇航学报,2005,26(4):524-530. 被引量：64

二级参考文献71

1潘泉,张洪才,戴冠中,刘先省.STUDY ON ALGORITHM OF SENSOR MANAGEMENT BASED ON FUNCTIONS OF EFFICIENCY AND WASTE[J].Chinese Journal of Aeronautics,2000,13(1):39-44. 被引量：23
2李爱国.多粒子群协同优化算法[J].复旦学报（自然科学版）,2004,43(5):923-925. 被引量：398
3何友,关欣,王国宏.多传感器信息融合研究进展与展望[J].宇航学报,2005,26(4):524-530. 被引量：64
4何友,彭应宁,陆大.多传感器数据融合模型综述[J].清华大学学报（自然科学版）,1996,36(9):14-20. 被引量：87
5李韪韬,王惠南,钱志余.遗传算法的一种新颖编码研究[J].信息与控制,2006,35(5):624-628. 被引量：7
6刘澎.遗传算法在目标跟踪中的传感器分配算法[J].火力与指挥控制,2007,32(1):51-53. 被引量：1
7J Kennedy, R C Eberhart. Particle Swarm Optimization [ C ]. In: IEEE Int'l Conf. on Neural Networks, Perth, Australia,1995. 1942 - 1948.
8王辉梅刚.基于蚁群算法的地对空雷达干扰任务分配模型.电子工程学院学报,2006,25(1):20-23.
9石纯一,张伟.基于Agent的计算[M].北京:清华大学出版社.2007:11-12,119-120.
10刘己斌.城市防空作战指挥自动化系统火力分配研究[D].郑州:防空兵指挥学院,2001.

共引文献153

1李川,陶波.多任务并行处理框架下的雷达信息处理设计[J].中国电子科学研究院学报,2023,18(5):438-443.
2韩晓明,杜长龙,张永忠,翟继涛.基于信息融合的机械故障诊断技术研究[J].煤炭科学技术,2007,35(3):86-89. 被引量：2
3周中良,于雷,潘泉,王琳.综合化多传感器空间管理模型与算法研究[J].传感技术学报,2007,20(11):2438-2441. 被引量：2
4凌六一,黄友锐.基于多传感器信息融合的矿井通风机故障诊断[J].煤炭科学技术,2008,36(6):72-74. 被引量：17
5胡文华,宋小全.干扰条件下防空情报雷达组网管控模型研究[J].飞行器测控学报,2010,29(2):91-94.
6周林,刘先省.基于新定义信息熵的目标检测算法[J].信息与控制,2005,34(1):119-122. 被引量：8
7余吉生.以改革为动力促进职业教育的机制创新[J].中国农村教育,2005(6):20-21.
8赵春阳,逄玉俊.基于信息熵的多传感器信息融合[J].计算机与数字工程,2005,33(8):77-79. 被引量：2
9刘先省,周林,杜晓玉.基于目标权重和信息增量的传感器管理方法[J].电子学报,2005,33(9):1683-1687. 被引量：32
10段晓君.试验鉴定中信息的量化评估模型[J].飞行器测控学报,2005,24(6):54-58.

同被引文献185

1王彤,李磊,蒋琪.“进攻性蜂群使能战术”项目推进无人蜂群能力发展分析[J].战术导弹技术,2020(1):33-38. 被引量：23
2张艳芹,许录平,李剑.一种具有低截获特性的组合调制雷达信号[J].弹道学报,2006,18(3):90-93. 被引量：7
3田菁,陈岩,沈林成.不确定环境中多无人机协同搜索算法[J].电子与信息学报,2007,29(10):2325-2328. 被引量：34
4侯蓉晖,史浩山,杨少军.一种无线传感器网络自适应协同通信路由协议[J].电子与信息学报,2007,29(10):2482-2486. 被引量：1
5胡梦中,宋铮,刘月平.一种新的低副瓣多波束形成方法[J].现代雷达,2007,29(10):71-74. 被引量：10
6陈国海.先进战机多功能相控阵系统综合射频隐身技术[J].现代雷达,2007,29(12):1-4. 被引量：25
7王建明,刘国朝.舰载雷达与ESM协同探测方法研究[J].舰船电子对抗,2007,30(6):11-15. 被引量：13
8林云,司锡才,张振.高距离分辨率的低截获概率雷达信号性能研究[J].航空电子技术,2008,39(3):29-33. 被引量：2
9赵海涛,习勇,魏急波,王丽洁.无线传感器网络中基于分簇的协同传输协议[J].系统工程与电子技术,2009,31(4):737-740. 被引量：3
10王国良,申绪涧,汪连栋,王国玉.基于秩K融合规则的组网雷达系统干扰效果评估[J].系统仿真学报,2009,21(23):7678-7680. 被引量：12

引证文献8

1时晨光,董璟,周建江,汪飞.飞行器射频隐身技术研究综述[J].系统工程与电子技术,2021,43(6):1452-1467. 被引量：30
2邹立岩,张明智,柏俊汝,武剑.无人机集群作战建模与仿真研究综述[J].战术导弹技术,2021(3):98-108. 被引量：30
3董晨,何舒,帅逸仙,张明恩,程仙垒.基于时段优化拼接的多传感器协同探测任务规划[J].火力与指挥控制,2022,47(4):43-49.
4郑少秋,梁汝鹏,吴浩,袁翔,张政伟.人机共生作战决策系统:发展愿景与关键技术[J].火力与指挥控制,2022,47(7):1-6. 被引量：5
5胡金锁,周国印,张迎,邵启红,冯晓容.联合战术通信网络中的无线协同传输技术[J].兵工学报,2022,43(10):2649-2656. 被引量：7
6董晨,帅逸仙,周金鹏,赖鹏,程仙垒.网络化多传感器-多武器协同防空任务规划[J].系统工程与电子技术,2022,44(12):3738-3746. 被引量：5
7韦道知,张曌宇,谢家豪,李宁.基于改进Actor-Critic算法的多传感器交叉提示技术[J].系统工程与电子技术,2023,45(6):1624-1632.
8王跃东,顾以静,梁彦,王增福,张会霞.伴随压制干扰与组网雷达功率分配的深度博弈研究[J].雷达学报（中英文）,2023,12(3):642-656. 被引量：4

二级引证文献80

1刘闯,鱼小军,张婷,朱豪坤.无人集群装备仿真试验关键技术现状及趋势[J].航空学报,2022,43(S01):21-33. 被引量：9
2张澎,张成,管洋阳,杨珂.关于电磁频谱作战的思考[J].航空学报,2021,42(8):87-98. 被引量：14
3张巍巍,时晨光,周建江,严俊坤.面向射频隐身的组网雷达多目标跟踪波形优化设计方法[J].无人系统技术,2021,4(5):53-60. 被引量：4
4唐志诚,时晨光,周建江.非理想检测环境下面向射频隐身的多雷达网络多目标跟踪驻留时间优化分配算法[J].战术导弹技术,2021(6):1-10. 被引量：1
5黄峰,李战武,潘紫微,张佳强.无人机群反舰作战动态目标弹药分配模型[J].安徽工业大学学报（自然科学版）,2022,39(2):196-201.
6丁琳涛,时晨光,周建江.机载雷达多目标跟踪路径与驻留时间联合优化[J].战术导弹技术,2022(1):87-96. 被引量：2
7贾金伟,刘利民,韩壮志,解辉.射频隐身雷达波形设计技术研究综述[J].电光与控制,2022,29(8):57-64. 被引量：6
8董璟,时晨光,周建江.频谱共存下面向多目标跟踪的组网雷达功率带宽联合优化分配算法[J].战术导弹技术,2022(3):73-82. 被引量：2
9曾子鸣,董超,朱小军,贾子晔.面向群体快速融合的仿生无人机集群架构[J].电信科学,2022,38(8):17-27. 被引量：4
10黄树彩,谢家豪,韦道知,张曌宇.无人机集群作战中连续时间Markov链模型的求解方法[J].国防科技大学学报,2022,44(4):43-51. 被引量：2

1程天启.浅谈新时期消防救援队伍如何加强作战训练安全工作[J].绿色环保建材,2020,0(4):220-221. 被引量：17
2AG600将进入水上试验试飞阶段[J].国际航空,2018,0(8):10-10.
3赵永柱,黎卫东,唐斌,梅峰,卢文达.面向期限感知分布式矩阵相乘的高效存储方案[J].计算机应用,2020,40(2):311-315. 被引量：1
4劳莘,廖洁璟.从全球机场服务趋势探索大兴国际机场服务创新[J].国际航空,2019,0(10):43-45.
5胡立.疫情时期初创企业安全生存指南[J].计算机与网络,2020,46(12):48-50.
6蔡志良.转载机红外闭锁装置在综采工作面的应用[J].内蒙古煤炭经济,2020(2):162-162.
7一周财讯[J].理财周刊,2019(48):6-7.
8欧丰林.多特征卷积融合的相关滤波视频跟踪算法[J].漳州职业技术学院学报,2020,22(2):67-74.
9樊智敏,哈振骞,薛福峰,王明凯.水下机械臂运动空间分析与轨迹跟踪算法优化[J].机械与电子,2020,38(6):67-73. 被引量：3
10孙赫勇,文勃,郑丹,周强.移动云计算任务交互图的能效映射与调度[J].计算机应用与软件,2020,37(1):8-14. 被引量：2

系统工程与电子技术

2020年第8期

浏览历史

内容加载中请稍等...

基于强化学习的多机协同传感器管理被引量：8

参考文献7

二级参考文献71

共引文献153

同被引文献185

引证文献8

二级引证文献80

相关作者

相关机构

相关主题

浏览历史

基于强化学习的多机协同传感器管理 被引量：8

参考文献7

二级参考文献71

共引文献153

同被引文献185

引证文献8

二级引证文献80

相关作者

相关机构

相关主题

浏览历史

基于强化学习的多机协同传感器管理被引量：8