async_deep_reinforce:深度强化学习的异步方法

时间:2021-02-05 00:17:33
【文件属性】:
文件名称:async_deep_reinforce:深度强化学习的异步方法
文件大小:104KB
文件格式:ZIP
更新时间:2021-02-05 00:17:33
reinforcement-learning deep-learning tensorflow a3c DeeplearningPython async_deep_reinforce 异步深度强化学习 关于 试图改写Google Deep Mind的论文“深度强化学习的异步方法”。 使用TensorFlow实现了播放“ Atari Pong”的异步优势演员批评(A3C)方法。 A3C-FF和A3C-LSTM均已实现。 26小时后的学习结果移动(A3C-FF)就是这样。 在问题线程中强烈欢迎任何建议或建议。 如何建造 首先,我们需要构建Arcade Learning Enviroment的多线程就绪版本。 我对其进行了一些修改以在多线程环境中运行它。 $ git clone https://github.com/miyosu
【文件预览】:
async_deep_reinforce-master
----.gitignore(33B)
----a3c_training_thread.py(6KB)
----rmsprop_applier_test.py(1KB)
----a3c.py(4KB)
----game_state_test.py(2KB)
----game_ac_network.py(11KB)
----game_state.py(2KB)
----a3c_visualize.py(2KB)
----LICENSE.txt(11KB)
----constants.py(833B)
----README.md(2KB)
----a3c_display.py(2KB)
----rmsprop_applier.py(4KB)
----docs()
--------graph_t5.png(67KB)
--------graph_t20.png(50KB)
----pong.bin(2KB)

网友评论