期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于每阶段平均费用最优的激励学习算法 被引量:3
1
作者 殷苌茗 陈焕文 谢丽娟 《计算机应用》 CSCD 北大核心 2002年第4期25-27,共3页
文中利用求解最优费用函数的方法给出了一种新的激励学习算法 ,即基于每阶段平均费用最优的激励学习算法。这种学习算法是求解信息不完全Markov决策问题的一种有效激励学习方法 ,它从求解分阶段最优平均费用函数的方法出发 ,分析了最优... 文中利用求解最优费用函数的方法给出了一种新的激励学习算法 ,即基于每阶段平均费用最优的激励学习算法。这种学习算法是求解信息不完全Markov决策问题的一种有效激励学习方法 ,它从求解分阶段最优平均费用函数的方法出发 ,分析了最优解的存在性、分阶段最优平均费用函数与初始状态的关系以及与之相关的Bellman方程。这种方法的建立 ,可以使得动态规划 (DP) 展开更多
关键词 Q学习 最优平均费用函数 Bellman方程 智能体 激励学习算法 人工智能
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部