Replicating-DeepMind:复现 DeepMind 的“Playing Atari with Deep Reinforcement Learning”的结果

时间:2021-06-25 20:59:25
【文件属性】:
文件名称:Replicating-DeepMind:复现 DeepMind 的“Playing Atari with Deep Reinforcement Learning”的结果
文件大小:28.11MB
文件格式:ZIP
更新时间:2021-06-25 20:59:25
C++ 复制-DeepMind 复现 DeepMind 的“Playing Atari with Deep Reinforcement Learning”的结果。 所有信息都在我们的。 进度:系统已启动并在带有 cuda-convnet2 的 GPU 集群上运行。 它可以学习比随机播放更好,但还没有好多少:) 它相当快,但仍然比 DeepMind 的原始系统慢 2 倍。 目前它没有实现 RMSprop,这是我们的下一个目标。 注1:您也可以查看我们写的一篇科普文章到 。 注 2:Nathan Sprague 有一个基于 Theano 的实现。 它可以做得相当好。 有关更多详细信息,请参阅 。

网友评论