Upside-Down-Reinforcement-Learning:PyTorch中的颠倒强化学习(⅂ꓤ)实施。 基于JürgenSchmidhuber发表的论文

时间:2024-04-01 18:08:42
【文件属性】:

文件名称:Upside-Down-Reinforcement-Learning:PyTorch中的颠倒强化学习(⅂ꓤ)实施。 基于JürgenSchmidhuber发表的论文

文件大小:1.83MB

文件格式:ZIP

更新时间:2024-04-01 18:08:42

python machine-learning reinforcement-learning machine-learning-algorithms pytorch

颠倒的强化学习 Pytorch中的颠倒强化学习(⅂ꓤ)实施。 基于JürgenSchmidhuber发表的论文: 该存储库包含一个离散动作空间以及一个针对OpenAI Gym CartPole环境(该环境的版本)的连续动作空间实现。 笔记本包括行为功能的培训以及评估部分,您可以在其中测试经过培训的行为功能。 用代理人在期望的时间范围内可以达到的期望的报酬来喂养它。 离散CartPole环境的图: 连续CartPole环境的图: LunarLander环境的图: 去做: 测试论文中提到的一些可能的改进(6.未来研究方向)。 作者 塞巴斯蒂安·迪特(Sebastian Dittert) 随意在您自己的项目或研究中使用此代码。 对于引用,请检查DOI或引用为: @misc{Upside-Down, author = {Dittert, Sebastian}, title


【文件预览】:
Upside-Down-Reinforcement-Learning-master
----paper()
--------Training_Agents_using_Upside-Down_Reinforcement_Learning.pdf(1.44MB)
--------Reinforcement_Learning_Upside_Down.pdf(253KB)
----Upside_Down_continuous.ipynb(101KB)
----LICENSE(1KB)
----imgs()
--------Graph1.png(97KB)
--------upside_down_lunarlander.png(61KB)
--------Graph.PNG(94KB)
--------Graph1.PNG(100KB)
--------Graph.png(69KB)
----Upside-Down.ipynb(98KB)
----README.md(2KB)

网友评论