RL_project_common下载

【文件属性】：

文件名称：RL_project_common

文件大小：7MB

文件格式：ZIP

更新时间：2024-05-20 09:06:28

Python

深度强化学习的方法该存储库包含为Capita Selecta进行强化学习而编写的代码。该报告（和代码）涵盖以下主题：传统RL（蒙特卡罗，SARSA-λ）线性值函数近似（线性函数近似SARSA-λ）（深度）基于神经网络的函数逼近（受DQN启发）（深度Q学习，深度SARSA-λ） Actor Critic算法（使用SASA-λ作为值函数逼近器的A2C） SAC-Q（）这些算法在多个实验中进行了评估。除了位于sacx/experiments/mountaincar.py的SAC-Q实验之外，本文中使用的实验全部位于cluster_experiments文件夹中。如果您想阅读并获得对这些算法的更深入的了解，我们邀请您阅读报告或仔细阅读相关的幻灯片：一些闪亮的GIF 购物车杆数：蛇：依存关系为了运行实验，需要使用许多不同的Python软件包，包括Ten

立即下载

【文件预览】：
RL_project_common-master
----.gitignore(30B)
----results()
--------.gitkeep(0B)
----q_network_sarsa_lambda.py(9KB)
----requirements.txt(1KB)
----experiments()
--------easy21_sarsa.py(550B)
--------cartpole_deep_sarsa.py(1KB)
--------flappybird_deepq.py(1KB)
--------snake_deep_sarsa.py(1KB)
--------cartpole_ac.py(2KB)
--------snake_convq.py(1KB)
--------pixelcopter_deepq.py(1KB)
--------cartpole_sarsa.py(765B)
--------flappy_bird_a2c.py(2KB)
--------easy21_montecarlo.py(538B)
--------pixelcopter_convq.py(1KB)
--------cartpole_deepq.py(698B)
--------flappy_bird_deep_sarsa.py(2KB)
--------cartpole_deep_sarsa_new.py(2KB)
--------simple_env_sarsa.py(377B)
----sacx()
--------sacu.py(5KB)
--------multi_task_logger.py(2KB)
--------extcore.py(1KB)
--------__init__.py(0B)
--------experiments()
--------mock_tasked_q_network.py(668B)
--------sacq.py(2KB)
--------environments()
--------generic_tasked_q_network.py(528B)
--------tasked_p_network.py(5KB)
--------puckworld.py(11KB)
--------tasked_q_network.py(10KB)
--------tasked_dual_neural_net.py(2KB)
----LICENSE(1KB)
----agent.py(586B)
----README.md(3KB)
----environments()
--------cartpole.py(4KB)
--------snake.py(10KB)
--------easy21.py(8KB)
--------pixelcopter.py(5KB)
--------wrappers()
--------simple_env.py(1KB)
--------flappybird.py(3KB)
----cluster_experiments()
--------snake_deep_sarsa.py(2KB)
--------cartpole_deepsarsalambda.py(3KB)
--------cartpole_ac_comparison.py(5KB)
--------cartpole_sarsalambda.py(3KB)
--------cartpole_ac_param_sweep.py(5KB)
--------snake_conv_sarsa.py(2KB)
----sandbox()
--------growing_qs.py(491B)
--------__init__.py(139B)
--------keras_multi_models.py(1KB)
--------keras_models_in_tensorflow.py(943B)
----q_table.py(4KB)
----agents()
--------deep_q.py(3KB)
--------actor_critic.py(3KB)
--------linear_func_approx.py(5KB)
--------montecarlo.py(2KB)
--------sarsalambda.py(4KB)
--------deep_sarsa.py(4KB)
----plots()
--------.gitkeep(0B)
--------average_bin_plot_conv_vs_deep.py(2KB)
--------average_bin_plot_ac_vs_sl.py(2KB)
--------multi_plot_from_runs.py(835B)
--------average_bin_plot_sl.py(2KB)
--------test_plot_from_h5.py(502B)
----q_network.py(4KB)
----p_network.py(6KB)
----gifs()
--------cart_pole.gif(1.18MB)
--------snake.gif(592KB)
----experiment_util.py(7KB)
----core.py(3KB)
----q_estimator.py(2KB)
----policy.py(7KB)
----methods-deep-reinforcement.pdf(3.2MB)
----MethodsForDeepRL-Slides.pdf(3.52MB)

秒客网

RL_project_common

网友评论