提交 2c61f3ee 编写于 作者: W wizardforcel

2021-01-07 23:51:04

上级 f8674a05
......@@ -362,3 +362,16 @@
+ [六、AIY 项目和 TensorFlow Lite](docs/whats-new-tf2/6.md)
+ [第 4 部分:TensorFlow 2.0 - 迁移,总结](docs/whats-new-tf2/pt4.md)
+ [七、从 TensorFlow 1.x 迁移到 2.0](docs/whats-new-tf2/7.md)
+ [UCB CS294-112 深度强化学习中文笔记](docs/ucb-cs294-112-notes-zh/README.md)
+ [(1) 简介](docs/ucb-cs294-112-notes-zh/1.md)
+ [(2) 模仿学习](docs/ucb-cs294-112-notes-zh/2.md)
+ [(3) 增强学习简介](docs/ucb-cs294-112-notes-zh/3.md)
+ [(4) 策略梯度法](docs/ucb-cs294-112-notes-zh/4.md)
+ [(5) 演员-评论家算法](docs/ucb-cs294-112-notes-zh/5.md)
+ [(6) 基于值函数的方法](docs/ucb-cs294-112-notes-zh/6.md)
+ [(7) 深度增强学习中的 Q 学习方法](docs/ucb-cs294-112-notes-zh/7.md)
+ [(8) 最优控制与规划](docs/ucb-cs294-112-notes-zh/8.md)
+ [(9) 用数据拟合模型](docs/ucb-cs294-112-notes-zh/9.md)
+ [(10) 基于模型的增强学习的策略训练](docs/ucb-cs294-112-notes-zh/10.md)
+ [(11) 概率图模型与软化增强学习](docs/ucb-cs294-112-notes-zh/11.md)
+ [(12) 逆增强学习](docs/ucb-cs294-112-notes-zh/12.md)
此差异已折叠。
此差异已折叠。
此差异已折叠。
此差异已折叠。
此差异已折叠。
此差异已折叠。
此差异已折叠。
此差异已折叠。
此差异已折叠。
此差异已折叠。
此差异已折叠。
此差异已折叠。
# UCB CS294-112 深度强化学习中文笔记
> 作者:[谢天](https://www.zhihu.com/people/xie-tian-55-77)
>
> 来源:[POST 馆](https://zhuanlan.zhihu.com/c_150977189)
>
> 工作进度上越早落后,你就会有越充足的时间赶上。
* [在线阅读](https://apachecn.github.io/ucb-cs294-112-notes-zh)
* [在线阅读(Gitee)](https://apachecn.gitee.io/ucb-cs294-112-notes-zh/)
* [ApacheCN 机器学习交流群 629470233](http://shang.qq.com/wpa/qunwpa?idkey=30e5f1123a79867570f665aa3a483ca404b1c3f77737bc01ec520ed5f078ddef)
* [ApacheCN 学习资源](http://www.apachecn.org/)
## 下载
### Docker
```
docker pull apachecn0/ucb-cs294-112-notes-zh
docker run -tid -p <port>:80 apachecn0/ucb-cs294-112-notes-zh
# 访问 http://localhost:{port} 查看文档
```
### PYPI
```
pip install ucb-cs294-112-notes-zh
ucb-cs294-112-notes-zh <port>
# 访问 http://localhost:{port} 查看文档
```
### NPM
```
npm install -g ucb-cserjiusi-yiyier-notes-zh
ucb-cserjiusi-yiyier-notes-zh <port>
# 访问 http://localhost:{port} 查看文档
```
+ [UCB CS294-112 深度强化学习中文笔记](README.md)
+ [(1) 简介](1.md)
+ [(2) 模仿学习](2.md)
+ [(3) 增强学习简介](3.md)
+ [(4) 策略梯度法](4.md)
+ [(5) 演员-评论家算法](5.md)
+ [(6) 基于值函数的方法](6.md)
+ [(7) 深度增强学习中的 Q 学习方法](7.md)
+ [(8) 最优控制与规划](8.md)
+ [(9) 用数据拟合模型](9.md)
+ [(10) 基于模型的增强学习的策略训练](10.md)
+ [(11) 概率图模型与软化增强学习](11.md)
+ [(12) 逆增强学习](12.md)
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册