摘要
1.引言学习是人类获取知识的主要形式,也是人类具有智能的显著标志,是人类提高智能水平的基本途径。建造具有类似人的智能机器(Agent)是智能控制、人工智能的研究目标。要使机器具有一定的智能,一种方式是靠人事先编程来建立知识库和推理机制,这具有明显的局限性。我们希望Agent具有向环境学习的能力,即自动获取知识、积累经验、不断更新和扩充知识,
The word,reinforcement learning,comes from behavior psychology. This subject takes learning as trial and error process so as to map world state to the actions. The architecture of reinforcement learning system is discussed and implement method of each function and learning algorithm are presented in this paper.
出处
《计算机科学》
CSCD
北大核心
1999年第10期53-56,共4页
Computer Science
关键词
强化学习系统
知识获取
人工智能
算法
Reinforcement learning
Intelligent control system
Q-learning