+ [UCB CS294-112 深度强化学习中文笔记](README.md) + [(1) 简介](1.md) + [(2) 模仿学习](2.md) + [(3) 增强学习简介](3.md) + [(4) 策略梯度法](4.md) + [(5) 演员-评论家算法](5.md) + [(6) 基于值函数的方法](6.md) + [(7) 深度增强学习中的 Q 学习方法](7.md) + [(8) 最优控制与规划](8.md) + [(9) 用数据拟合模型](9.md) + [(10) 基于模型的增强学习的策略训练](10.md) + [(11) 概率图模型与软化增强学习](11.md) + [(12) 逆增强学习](12.md)