期刊文献+

强化学习系统的结构及算法 被引量:3

The Architectures and Algorithm of Reinforcement Learning System
在线阅读 下载PDF
导出
摘要 1.引言学习是人类获取知识的主要形式,也是人类具有智能的显著标志,是人类提高智能水平的基本途径。建造具有类似人的智能机器(Agent)是智能控制、人工智能的研究目标。要使机器具有一定的智能,一种方式是靠人事先编程来建立知识库和推理机制,这具有明显的局限性。我们希望Agent具有向环境学习的能力,即自动获取知识、积累经验、不断更新和扩充知识, The word,reinforcement learning,comes from behavior psychology. This subject takes learning as trial and error process so as to map world state to the actions. The architecture of reinforcement learning system is discussed and implement method of each function and learning algorithm are presented in this paper.
出处 《计算机科学》 CSCD 北大核心 1999年第10期53-56,共4页 Computer Science
关键词 强化学习系统 知识获取 人工智能 算法 Reinforcement learning Intelligent control system Q-learning
  • 相关文献

参考文献1

二级参考文献6

  • 1Leslie Pack Kaelbling. Associative Reinforcement Learning: Functions in k-DNF[J] 1994,Machine Learning(3):279~298
  • 2Leslie Pack Kaelbling. Associative Reinforcement Learning: A Generate and Test Algorithm[J] 1994,Machine Learning(3):299~319
  • 3Leslie Pack Kaelbling. Associative reinforcement learning: Functions ink-DNF[J] 1994,Machine Learning(3):279~298
  • 4Ronald J. Williams. Simple Statistical Gradient-Following Algorithms for Connectionist Reinforcement Learning[J] 1992,Machine Learning(3-4):229~256
  • 5Christopher J.C.H. Watkins,Peter Dayan. Technical Note: Q-Learning[J] 1992,Machine Learning(3-4):279~292
  • 6Richard S. Sutton. Learning to predict by the methods of temporal differences[J] 1988,Machine Learning(1):9~44

共引文献29

同被引文献50

引证文献3

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部