期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于改进的指针网络深度强化学习算法求解旅行商问题
1
作者 唐娇娇 左烔菲 陈逢林 《安庆师范大学学报(自然科学版)》 2024年第2期62-68,共7页
旅行商问题是组合优化问题中的经典问题,而深度强化学习的发展为该类问题的求解提供了新思路。在基于指针网络的深度强化学习算法求解旅行商问题中,策略网络和价值网络的编码器都采用了复杂的长短期记忆网络结构,这在求解大规模旅行商... 旅行商问题是组合优化问题中的经典问题,而深度强化学习的发展为该类问题的求解提供了新思路。在基于指针网络的深度强化学习算法求解旅行商问题中,策略网络和价值网络的编码器都采用了复杂的长短期记忆网络结构,这在求解大规模旅行商问题时会造成训练时间过长的现象。鉴于输入节点间位置顺序的无关性,本文对指针网络中编码器的循环神经网络进行了修改,将策略网络和价值网络编码器中的长短期记忆网络都替换为一维卷积神经网络,最终提出了一种改进的基于指针网络的深度强化学习算法,其在相同求解问题规模上所需要的训练时间比原模型减少12%~15%,实验结果充分验证了本文改进算法的有效性。 展开更多
关键词 旅行商问题 深度强化学习 指针网络 卷积神经网络 长短期记忆网络 策略梯度
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部