基于DQN的异构测控资源联合调度方法被引量：4

DQN-based Joint Scheduling Method of Heterogeneous TT&C Resources

下载PDF

导出

摘要以异构测控网资源联合调度为研究对象,提出一种基于强化学习的深度Q网络(deep Q network, DQN)算法。在充分分析异构测控资源联合调度问题特点后,用数学语言对影响问题求解的约束条件进行描述,建立了资源联合调度模型;从应用强化学习解决问题的角度,对求解的问题进行马尔科夫决策过程描述后,分别设计了2个结构相同的神经网络和基于ε贪婪算法的动作选择策略,并建立了DQN求解框架。仿真结果表明:基于DQN的异构测控资源调度方法较遗传算法能够找到调度收益更优的测控调度方案。 Joint scheduling of heterogeneous TT&C resources as research object, a deep Q network(DQN) algorithm based on reinforcement learning is proposed. The characteristics of the joint scheduling problem of heterogeneous TT&C resources being fully analyzied and mathematical language being used to describe the constraints affecting the solution, a resource joint scheduling model is established. From the perspective of applying reinforcement learning, two neural networks with the same structure and the action selection strategies based on ε greedy algorithm are respectively designed after Markov decision process description, and DQN solution framework is established. The simulation results show that DQNbased heterogeneous TT&C resources scheduling method can identify a TT&C scheduling scheme with better scheduling revenue than the genetic algorithm.

作者薛乃阳丁丹贾玉童王志强刘渊 Xue Naiyang;Ding Dan;Jia Yutong;Wang Zhiqiang;Liu Yuan(Graduate School,Space Engineering University,Beijing 101416,China;Department of Electronic and Optical Engineering,Space Engineering University,Beijing 101416,China;PLA 61646 Troops,Beijing 100192,China)

机构地区航天工程大学研究生院航天工程大学电子与光学工程系中国人民解放军

出处《系统仿真学报》 CAS CSCD 北大核心 2023年第2期423-434,共12页 Journal of System Simulation

关键词航天测控异构测控资源联合调度深度Q网络调度收益强化学习 telemetry track and command(TT&C) joint scheduling of heterogeneous TT&C resources deep Q network scheduling revenue reinforcement learning

分类号 TP273.1 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献8

1于志坚.我国航天测控系统的现状与发展[J].中国工程科学,2006,8(10):42-46. 被引量：67
2宋永生,李铎,陈劭睿.商业航天测控管理[J].数字通信世界,2019,0(7):29-29. 被引量：2
3郭夏锐.商业卫星测控发展现状及趋势[J].国际太空,2019,0(10):44-48. 被引量：7
4薛乃阳,丁丹,王红敏,刘步花.基于改进遗传算法的多类测控资源调度方法[J].系统工程与电子技术,2021,43(9):2535-2543. 被引量：13
5张天骄,李济生,李晶,杨宜康,杜卫兵.基于混合蚁群优化的天地一体化调度方法[J].系统工程与电子技术,2016,38(7):1555-1562. 被引量：8
6李长德,徐伟,徐梁,王燕.基于深度神经网络的多星测控调度方法[J].中国空间科学技术,2022,42(1):65-72. 被引量：9
7薛乃阳,丁丹,王红敏,樊怡乐,刘仲谦.引入微元法思想的混合测控资源联合调度方法[J].系统仿真学报,2022,34(4):826-835. 被引量：2
8安元元,李伟超,王伟,杨旭海,韦沛,王霄.一种低轨卫星星座测控地面站调度策略研究[J].时间频率学报,2021,44(2):120-131. 被引量：6

二级参考文献68

1魏兴.一体化测控技术,商业航天测控的未来[J].卫星与网络,2020(8):42-47. 被引量：2
2张碧雄,巨兰.2030年前航天测控技术发展研究[J].飞行器测控学报,2010,29(5):11-15. 被引量：20
3鄢青青,沈怀荣,邵琼玲.航天测控资源调度问题建模与求解研究综述[J].系统仿真学报,2015,27(1):1-12. 被引量：9
4贺仁杰,谭跃进.基于约束满足的卫星地面站资源优化分配问题研究[J].计算机工程与应用,2004,40(18):229-232. 被引量：23
5金光,武小悦,高卫斌.卫星地面站资源调度优化模型及启发式算法[J].系统工程与电子技术,2004,26(12):1839-1841. 被引量：41
6赵齐乐,刘经南,葛茂荣.GPS导航星座及低轨卫星的精密定轨理论和软件研究[J].武汉大学学报（信息科学版）,2005,30(4):375-375. 被引量：6
7郭权,卢桂艳,王希诚.基于扩展神经网络的网格资源调度优化算法[J].辽宁工程技术大学学报（自然科学版）,2005,24(5):730-733. 被引量：2
8于志坚.我国航天测控系统的现状与发展[J].中国工程科学,2006,8(10):42-46. 被引量：67
9金光,武小悦,高卫斌.基于冲突的卫星地面站系统资源调度与能力分析[J].小型微型计算机系统,2007,28(2):310-312. 被引量：19
10王军民,谭跃进.多星联合动态调度问题的启发式算法研究[J].计算机工程与应用,2007,43(21):21-25. 被引量：4

共引文献96

1翟高伟,梁晨光,赵锦瑾,邓昊.基于天链卫星的箭载Ka频段中继用户终端设计与实现[J].宇航总体技术,2020(4):7-14. 被引量：12
2张碧雄,巨兰.CCSDS建议在深空通信导航中的应用研究[J].飞行器测控学报,2011,30(S1):26-31. 被引量：2
3易峰,苟先太,龙刚,吴潜,金炜东.满足网络测控的小卫星星座组网与路由方法研究[J].航天标准化,2010(2):36-43.
4张碧雄,巨兰.2030年前航天测控技术发展研究[J].飞行器测控学报,2010,29(5):11-15. 被引量：20
5Yang Yongan,Han Minzhang,Feng Zuren,Fan Henghai,Bai Jian.Design and realization of a novel multitask TT&C operation pattern[J].Journal of Systems Engineering and Electronics,2008,19(6):1243-1249.
6顾晓丹,肖玮,张帆.航天测控系统容灾策略研究[J].计算机工程,2009,35(24):150-152.
7张志强,张永健,王宇,卢昱.低轨卫星网络中基于轨道分簇的密钥更新算法[J].电子与信息学报,2010,32(3):687-692. 被引量：7
8李虎.基带调制技术的应用与发展[J].中国西部科技,2010,9(12):28-31. 被引量：1
9陈峰,武小悦.天地测控资源一体化调度模型[J].宇航学报,2010,31(5):1405-1412. 被引量：13
10曾辉,戴强.空间信息对抗综述[J].舰船电子对抗,2011,34(5):30-34. 被引量：5

同被引文献55

1李晶,洪武,张文亮,赖德荣,姜勇.基于YOLOv5算法的智能剥锌机预开口识别技术研究[J].中国矿业,2024,33(S01):258-262. 被引量：1
2王凯东,易克初,田斌.低轨道(LEO)宽带卫星网络最短路由优化算法[J].中国科学（E辑）,2005,35(8):850-874. 被引量：4
3陈统,徐世杰.非合作式自主交会对接的终端接近模糊控制[J].宇航学报,2006,27(3):416-421. 被引量：30
4金光,武小悦,高卫斌.基于冲突的卫星地面站系统资源调度与能力分析[J].小型微型计算机系统,2007,28(2):310-312. 被引量：19
5卢山,徐世杰.非合作目标的自主接近控制律研究[J].中国空间科学技术,2008,28(5):7-12. 被引量：9
6李玉庆,王日新,徐敏强,崔祜涛,王海波,徐瑞.基于改进遗传算法的一类多资源测控调度问题研究[J].宇航学报,2012,33(1):85-90. 被引量：21
7桂卫华,阳春华,陈晓方,王雅琳.有色冶金过程建模与优化的若干问题及挑战[J].自动化学报,2013,39(3):197-207. 被引量：48
8贺川,邱涤珊,朱晓敏,伍国华.基于滚动优化策略的成像侦察卫星应急调度方法[J].系统工程理论与实践,2013,33(10):2685-2694. 被引量：17
9赵琳,李玉玲,刘源,郝勇,王艺鹏.连续小推力拦截卫星攻击轨道的优化[J].光学精密工程,2016,24(1):178-186. 被引量：5
10李贺武,吴茜,徐恪,吴建平,杨增印,江卓,朱亮.天地一体化网络研究进展与趋势[J].科技导报,2016,34(14):95-106. 被引量：69

引证文献4

1张嘉然,杨雅婷,嵩天.卫星CDN中基于DQN的资源编排算法[J].天地一体化信息网络,2022,3(4):45-54.
2张虹,薛嘉,任勃,杜晓军,薛猛.未来航天测控网资源调度管理模式探析[J].天地一体化信息网络,2023,4(4):19-26. 被引量：1
3Rui Jiang,Dong Ye,Yan Xiao,Zhaowei Sun,Zeming Zhang.Orbital Interception Pursuit Strategy for Random Evasion Using Deep Reinforcement Learning[J].Space(Science & Technology),2023,3(1):606-619. 被引量：3
4赵秋锦.基于DDQN优化控制及ResNet异常检测的湿法冶金设备智能控制模型研究[J].湿法冶金,2024,43(6):710-716. 被引量：1

二级引证文献5

1郭延宁,李高健,于永彬.基于改进蜣螂优化的GEO轨道多脉冲追逃博弈[J].中国空间科学技术（中英文）,2024,44(4):1-10.
2高婉莹,吴健发,魏春岭.航天器威胁规避自主决策规划方法研究综述[J].中国空间科学技术（中英文）,2024,44(4):71-89. 被引量：1
3胡砚洋,何凡,白成超.高超声速飞行器末制导段协同避障决策方法[J].兵工学报,2024,45(9):3147-3160.
4尹胜刚,张新民,朱健源.SpaceX公司航天测控系统建设应用及启示[J].军民两用技术与产品,2024(5):6-10.
5肖豪,柯宗武.基于A2C算法的股票交易模型[J].人工智能与机器人研究,2025,14(1):237-245.

1李保全.冶金企业设备焊接出现的问题及对策[J].中文科技期刊数据库（引文版）工程技术,2022(4):276-279.
2邱银锋,李国香,田浩,魏澈,刘国锋,吴肇赟.基于ADMM的海上多平台-岸电供能系统能量-备用协同分布式优化调度[J].电力建设,2023,44(1):21-29. 被引量：12
3张李.连通约束下的经验增强多智能体路径规划算法[J].福建电脑,2023,39(3):1-8.
4熊国栋.基于贪婪算法的网络数据分级储存方法[J].信息记录材料,2023,24(1):229-231.
5窦海石,张幽彤,艾强,赵心琦.面向耦合分流动力构型的拖拉机犁耕工况控制策略[J].农业工程学报,2022,38(23):41-49. 被引量：9
6范若楠,张晓荣,王鑫,李斌,张俊.多Agent系统安全保护机制研究[J].信息对抗技术,2022,1(3):46-56.
7张耀玉,李彩虹,张国胜,李永迪,梁振英.基于改进Q-learning算法的移动机器人局部路径规划[J].山东理工大学学报（自然科学版）,2023,37(2):1-6. 被引量：4
8王孟雅,陈震,潘尔顺.基于马尔科夫决策的冷贮备串联系统状态维修与备件联合优化[J].工业工程与管理,2022,27(6):14-23. 被引量：4
9尹依伊,王晓芳,周健.基于Q学习的多无人机协同航迹规划方法[J].兵工学报,2023,44(2):484-495. 被引量：12
10闫泽文,谢嘉成,李素华,沈卫东,王怡荣,王学文.基于虚拟现实与数字孪生技术的综采工作面直线度求解[J].工矿自动化,2023,49(2):31-37. 被引量：8

系统仿真学报

2023年第2期

浏览历史

内容加载中请稍等...

基于DQN的异构测控资源联合调度方法被引量：4

参考文献8

二级参考文献68

共引文献96

同被引文献55

引证文献4

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于DQN的异构测控资源联合调度方法 被引量：4

参考文献8

二级参考文献68

共引文献96

同被引文献55

引证文献4

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于DQN的异构测控资源联合调度方法被引量：4