【文件属性】:
文件名称:Tensorflow_Deep_RL:深度强化学习算法的Tensorflow实现
文件大小:4KB
文件格式:ZIP
更新时间:2021-04-28 02:06:41
reinforcement-learning deep-learning tensorflow parameter-space-noise-exploration Python
Tensorflow_Deep_RL
用于在体育馆环境中训练代理的多种算法的实现。 算法直接从研究论文中实现,并引用了参考文献。
探索的参数空间噪声
这项工作实现了OpenAi的“探索参数空间噪声”中的思想,并且在他们的工作中,对于某些环境(尤其是奖励稀少的环境),这种方法比动作空间探索训练得更快。 噪声的标准偏差在我的工作中是恒定的,但是可以随着训练的进行而对噪声进行退火,以寻求最佳解决方案。 必须对代理商进行多次培训,因为培训很可能陷入局部最优。
档名:param_noise_mlp.py
依存关系
需要Python 3.6和 , 和OpenAI 。
用法
python param_noise_mlp.py
图形
graph = tf . Graph ()
with graph . as_default ():
x = tf . placeholder ( tf . f
【文件预览】:
Tensorflow_Deep_RL-master
----README.rst(4KB)
----param_noise_mlp.py(7KB)