RL_project_common

时间:2021-04-30 15:19:48
【文件属性】:
文件名称:RL_project_common
文件大小:7MB
文件格式:ZIP
更新时间:2021-04-30 15:19:48
Python 深度强化学习的方法 该存储库包含为Capita Selecta进行强化学习而编写的代码。 该报告(和代码)涵盖以下主题: 传统RL(蒙特卡罗,SARSA-λ) 线性值函数近似(线性函数近似SARSA-λ) (深度)基于神经网络的函数逼近(受DQN启发)(深度Q学习,深度SARSA-λ) Actor Critic算法(使用SASA-λ作为值函数逼近器的A2C) SAC-Q( ) 这些算法在多个实验中进行了评估。 除了位于sacx/experiments/mountaincar.py的SAC-Q实验之外,本文中使用的实验全部位于cluster_experiments文件夹中。 如果您想阅读并获得对这些算法的更深入的了解,我们邀请您阅读报告或仔细阅读相关的幻灯片: 一些闪亮的GIF 购物车杆数: 蛇: 依存关系 为了运行实验,需要使用许多不同的Python软件包,包括Ten
【文件预览】:
RL_project_common-master
----.gitignore(30B)
----results()
--------.gitkeep(0B)
----q_network_sarsa_lambda.py(9KB)
----requirements.txt(1KB)
----experiments()
--------easy21_sarsa.py(550B)
--------cartpole_deep_sarsa.py(1KB)
--------flappybird_deepq.py(1KB)
--------snake_deep_sarsa.py(1KB)
--------cartpole_ac.py(2KB)
--------snake_convq.py(1KB)
--------pixelcopter_deepq.py(1KB)
--------cartpole_sarsa.py(765B)
--------flappy_bird_a2c.py(2KB)
--------easy21_montecarlo.py(538B)
--------pixelcopter_convq.py(1KB)
--------cartpole_deepq.py(698B)
--------flappy_bird_deep_sarsa.py(2KB)
--------cartpole_deep_sarsa_new.py(2KB)
--------simple_env_sarsa.py(377B)
----sacx()
--------sacu.py(5KB)
--------multi_task_logger.py(2KB)
--------extcore.py(1KB)
--------__init__.py(0B)
--------experiments()
--------mock_tasked_q_network.py(668B)
--------sacq.py(2KB)
--------environments()
--------generic_tasked_q_network.py(528B)
--------tasked_p_network.py(5KB)
--------puckworld.py(11KB)
--------tasked_q_network.py(10KB)
--------tasked_dual_neural_net.py(2KB)
----LICENSE(1KB)
----agent.py(586B)
----README.md(3KB)
----environments()
--------cartpole.py(4KB)
--------snake.py(10KB)
--------easy21.py(8KB)
--------pixelcopter.py(5KB)
--------wrappers()
--------simple_env.py(1KB)
--------flappybird.py(3KB)
----cluster_experiments()
--------snake_deep_sarsa.py(2KB)
--------cartpole_deepsarsalambda.py(3KB)
--------cartpole_ac_comparison.py(5KB)
--------cartpole_sarsalambda.py(3KB)
--------cartpole_ac_param_sweep.py(5KB)
--------snake_conv_sarsa.py(2KB)
----sandbox()
--------growing_qs.py(491B)
--------__init__.py(139B)
--------keras_multi_models.py(1KB)
--------keras_models_in_tensorflow.py(943B)
----q_table.py(4KB)
----agents()
--------deep_q.py(3KB)
--------actor_critic.py(3KB)
--------linear_func_approx.py(5KB)
--------montecarlo.py(2KB)
--------sarsalambda.py(4KB)
--------deep_sarsa.py(4KB)
----plots()
--------.gitkeep(0B)
--------average_bin_plot_conv_vs_deep.py(2KB)
--------average_bin_plot_ac_vs_sl.py(2KB)
--------multi_plot_from_runs.py(835B)
--------average_bin_plot_sl.py(2KB)
--------test_plot_from_h5.py(502B)
----q_network.py(4KB)
----p_network.py(6KB)
----gifs()
--------cart_pole.gif(1.18MB)
--------snake.gif(592KB)
----experiment_util.py(7KB)
----core.py(3KB)
----q_estimator.py(2KB)
----policy.py(7KB)
----methods-deep-reinforcement.pdf(3.2MB)
----MethodsForDeepRL-Slides.pdf(3.52MB)

网友评论