matlab代码做游戏-RLStudyGuide:如何学习强化学习：循序渐进指南下载

【文件属性】：

文件名称：matlab代码做游戏-RLStudyGuide:如何学习强化学习：循序渐进指南

文件大小：3KB

文件格式：ZIP

更新时间：2024-06-10 05:20:39

系统开源

matlab代码做游戏如何学习强化学习：循序渐进指南该存储库提供了博客文章中提到的RL学习路线图。有关解决方案的免费编码练习，请参见。 RL学习路线图强烈建议您按顺序完成路线图。在前四章之后，您应该有足够的基础来混合路线图。确保通过学习资料完全理解所需的概念在您喜欢的框架中实现该算法。当您自己实施和调试时，就会发生学习。用一些RL问题进行测试。我最喜欢的是杆子，倒立摆，步行机器人，乒乓球。章节算法必填概念学习资料 1个动态编程•政策评估•政策改进•价值迭代 •马尔可夫决策过程• 预期收益•折扣系数•状态，观察• 行动• 报酬•状态值函数V（s） •状态作用值函数Q（s，a） •第1部分：什么是RL？ •第2部分：了解环境和奖励•-第3 + 4章：有限的MDP +动态编程•–动态编程练习•1 + 2 2个时差（TD）学习•Q学习•SARSA •TD错误•政策内政策与政策外政策•Epsilon贪婪 •-第6章：时间差异学习•– SARSA，Q学习练习 3 函数逼近（用神经网络替换表） •深入的Q学习 RL •为什么表无法缩放•与监督学习的关系•重播内存•目标网

立即下载

【文件预览】：
RLStudyGuide-master
----README.md(7KB)

秒客网

matlab代码做游戏-RLStudyGuide:如何学习强化学习：循序渐进指南

网友评论

相关文章