PILCO:Tensorflow中的贝叶斯强化学习下载

【文件属性】：
文件名称：PILCO:Tensorflow中的贝叶斯强化学习
文件大小：163KB
文件格式：ZIP
更新时间：2021-05-10 23:29:54
machine-learning reinforcement-learning tensorflow gaussian-processes model-based-rl 学习控制的概率推理（PILCO） TensorFlow v2 算法的现代化实现。与PILCO以独立的MATLAB包编写的方式不同，该存储库旨在通过大量使用现代机器学习库来提供干净的实现。特别是，我们使用TensorFlow v2避免了对硬编码渐变的需求，并可以扩展到GPU架构。此外，我们将用于高斯过程回归。核心功能已针对原始MATLAB实现进行了测试。使用例在使用PILCO之前，您必须通过运行以下命令进行安装： git clone https://github.com/nrontsis/PILCO && cd PILCO python setup.py develop 建议使用python>=3.7在全新的conda环境中安装所有内容此回购中包含的示例使用和。这些依赖关系应手动安装。然后，您可以运行以下示例之一 python examples/inverted

立即下载

【文件预览】：
PILCO-master
----setup.py(1KB)
----.gitignore(100B)
----requirements.txt(76B)
----.travis.yml(225B)
----LICENSE(1KB)
----pilco()
--------__init__.py(69B)
--------controllers.py(5KB)
--------models()
--------rewards.py(3KB)
----examples()
--------linear_cars_env.py(1KB)
--------inv_double_pendulum.py(3KB)
--------swimmer.py(4KB)
--------utils.py(2KB)
--------inverted_pendulum.py(1KB)
--------pendulum_swing_up.py(3KB)
--------Hyperparameter setting and troubleshooting tips.ipynb(171KB)
--------safe_swimmer_run.py(5KB)
--------mountain_car.py(3KB)
--------safe_cars_run.py(5KB)
----safe_pilco_extension()
--------__init__.py(0B)
--------README.md(377B)
--------safe_pilco.py(2KB)
--------rewards_safe.py(3KB)
----README.md(2KB)
----tests()
--------test_sparse_predictions.py(2KB)
--------test_cascade.py(3KB)
--------__init__.py(0B)
--------test_rewards.py(786B)
--------Matlab Code()
--------test_controllers.py(3KB)
--------test_predictions.py(2KB)
----.coveragerc(203B)

秒客网

PILCO:Tensorflow中的贝叶斯强化学习

网友评论

相关文章