强化学习教程来啦!贡献者来自中科院、清华、北大3位男神!

网友投稿 1965 2022-10-25

强化学习教程来啦!贡献者来自中科院、清华、北大3位男神!

强化学习教程来啦!贡献者来自中科院、清华、北大3位男神!

Datawhale开源

核心贡献者:王琦、杨毅远、江季

导读

半年前,Datawhale开源项目《Easy-RL》(原《李宏毅深度强化学习笔记》)发布,受到全网转发,半年后,《Easy-RL》在原有的基础上进行了迭代优化,帮助读者轻松入门强化学习。

关于本书

《Easy-RL》由​开源组织 Datawhale 发起,由中科院王琦、清华大学杨毅远、北京大学江季三位组织成员主要负责。本书结合了李宏毅老师的《深度强化学习》、周博磊老师的《强化学习纲要》、李科浇老师的《百度强化学习》等多个强化学习的经典资料,并配有相关的习题、面经以及完全版的代码实战,适合想入门强化学习的小伙伴。

项目开源地址:

年 11 月 22 日,《Easy-RL》(原《李宏毅深度强化学习笔记》)在github中正式发布,截至今日,已收获1.7k个Star,并受到了广大学习者的一致好评,学习者纷纷表示通过这个教程收获颇多。编写者们也通过读者反馈的建议,对教程进行了实时地更新与补充。

本书细节

时隔半年,《Easy-RL》 在原有的基础上进行了充分地迭代和优化,不仅对发布时已有章节进行了完善和纠错,同时还补充了常见的面试题,当然,项目作者还给出了完全版的强化学习实战代码,方便大家深入学习。

1.教程案例

案例1: 对 Policy 概念的解析

案例2: 利用简单的例子解释强化学习基本概念

案例3: AlphaStar 论文解读

2.教程习题

案例: RL的面试真题

3.实践优化

首先是增加了一些更为高级且研究工程上常用的算法,比如TD3,Soft-Actor-Critic等等,新版所有算法实现如下表:

此外在每个算法目录下会有相关的算法实现说明:

并且代码将更加简洁,结构清晰,具体可以去github上细看,此外为了更好地呈现结果,增加了jupyter notebook来训练,可以在网页直接查看结果,同时也说明outputs文件夹下生成的结果是童叟无欺的,如下:

以上就是代码相关的主要优化,不止如此,今后除了修缮代码结构注释等等,还会增加各种各样的DQN比如rainbow-dqn等代码,以及各种算法对于同一环境的实现对比,敬请期待。

Easy-RL目录

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:kubernetes监控体系
下一篇:联邦学习技术应运而生!
相关文章

 发表评论

暂时没有评论,来抢沙发吧~