Overview.md 4.9 KB
Newer Older
T
TomorrowIsAnOtherDay 已提交
1
<p align="center">
T
TomorrowIsAnOtherDay 已提交
2 3
<img src="../../.github/PARL-logo.png" width="500"/>
<img src="../images/bar.png"/>
T
TomorrowIsAnOtherDay 已提交
4 5
</p>

T
TomorrowIsAnOtherDay 已提交
6
<br>**PARL**是一个主打高性能、稳定复现、轻量级的强化学习框架。<br>
T
TomorrowIsAnOtherDay 已提交
7

T
TomorrowIsAnOtherDay 已提交
8 9

## 使用场景
T
TomorrowIsAnOtherDay 已提交
10
- 想要在**实际任务中**尝试使用强化学习解决问题
T
TomorrowIsAnOtherDay 已提交
11 12 13 14 15
- 想快速调研下**不同强化学习算法**在同一个问题上的效果
- 强化学习算法训练速度太慢,想搭建**分布式**强化学习训练平台
- python的GIL全局锁限制了多线程加速,想**加速python代码**


T
TomorrowIsAnOtherDay 已提交
16
## PARL文档全览
T
TomorrowIsAnOtherDay 已提交
17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
<table>
  <tbody>
    <tr align="center" valign="bottom">
    <td>
      </td>
      <td>
        <b>构建智能体(基础)</b>
        <img src="../images/bar.png"/>
      </td>
      <td>
        <b>开源算法库</b>
        <img src="../images/bar.png"/>
      </td>
      <td>
        <b>并行训练(进阶)</b>
        <img src="../images/bar.png"/>
      </td>
    </tr>
    </tr>
    <tr valign="top">
    <td align="center" valign="middle">
      </td>
      <td>
T
TomorrowIsAnOtherDay 已提交
40
        <ul>
T
TomorrowIsAnOtherDay 已提交
41
        <li><b>教程</b></li>
T
TomorrowIsAnOtherDay 已提交
42
           <ul>
T
TomorrowIsAnOtherDay 已提交
43 44 45 46
          <li><a href="tutorial/quick_start.md">入门:解决cartpole问题</a></li>
          <li><a href="tutorial/module.md">子模块说明</a></li>
          <li><a href="tutorial/param.md">模型参数管理</a></li>
          <li><a href="tutorial/summary.md">绘制训练曲线</a></li>
T
TomorrowIsAnOtherDay 已提交
47
           </ul>
T
TomorrowIsAnOtherDay 已提交
48 49 50 51 52 53
        </ul>
      </td>
      <td align="left" >
        <ul>
          <li><b>前沿算法</b></li>
            <ul>
T
TomorrowIsAnOtherDay 已提交
54 55 56 57
              <li><a href="https://github.com/PaddlePaddle/PARL/tree/CN_docs/examples/MADDPG">MADDPG</a></li>
              <li><a href="https://github.com/PaddlePaddle/PARL/blob/CN_docs/examples/ES">ES</a></li>
              <li><a href="https://github.com/PaddlePaddle/PARL/blob/CN_docs/examples/SAC">SAC</a></li>
              <li><a href="https://github.com/PaddlePaddle/PARL/blob/CN_docs/examples/TD3">TD3</a></li>
T
TomorrowIsAnOtherDay 已提交
58 59 60
            </ul>
          <li><b>经典算法</b></li>
            <ul>
T
TomorrowIsAnOtherDay 已提交
61 62 63 64
              <li><a href="https://github.com/PaddlePaddle/PARL/blob/CN_docs/examples/QuickStart">PolicyGradient</a></li>
              <li><a href="https://github.com/PaddlePaddle/PARL/blob/CN_docs/examples/DQN">DQN</a></li>
            <li><a href="https://github.com/PaddlePaddle/PARL/blob/CN_docs/examples/DDPG">DDPG</a></li>
            <li><a href="https://github.com/PaddlePaddle/PARL/blob/CN_docs/examples/PPO">PPO</a></li>
T
TomorrowIsAnOtherDay 已提交
65 66 67
            </ul>
          <li><b>并行算法</b></li>
            <ul>
T
TomorrowIsAnOtherDay 已提交
68 69
              <li><a href="https://github.com/PaddlePaddle/PARL/blob/CN_docs/examples/A2C">A2C</a></li>
            <li><a href="https://github.com/PaddlePaddle/PARL/tree/CN_docs/examples/IMPALA">IMPALA</a></li>
T
TomorrowIsAnOtherDay 已提交
70 71 72 73 74 75 76 77
            </ul>
        </ul>
      </td>
      <td>
      <ul>
        <li><b>教程</b></li>
            <ul><li><a href="docs/zh_CN/TrainingService/PaiMode.md">部署集群</a></li>
            <li><a href="docs/zh_CN/TrainingService/KubeflowMode.md">入门教程</a></li>
T
TomorrowIsAnOtherDay 已提交
78 79 80
            <li><a href="docs/zh_CN/TrainingService/.md">加速案例</a></li>
            <li><a href="docs/zh_CN/TrainingService/.md">集群信息监控</a></li>
            <li><a href="docs/zh_CN/TrainingService/.md">如何debug</a></li>
T
TomorrowIsAnOtherDay 已提交
81 82 83 84
            </ul>
      </td>
    </tr>
  </tbody>
T
TomorrowIsAnOtherDay 已提交
85
  
T
TomorrowIsAnOtherDay 已提交
86
</table>
T
TomorrowIsAnOtherDay 已提交
87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106

## **安装**

### **安装**
PARL 支持并在 Ubuntu >= 16.04, macOS >= 10.14.1, 和 Windows 10通过了测试。 目前在Windows上**仅支持**python3.5+以上的版本,要求是64位的python。

```shell
pip install parl --upgrade
```
如果遇到网络问题导致的下载较慢,建议使用清华源解决:
```shell
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple parl --upgrade
```

如果想试试最新代码,可从源代码安装 NNI。
```shell
git clone https://github.com/PaddlePaddle/PARL
cd PARL
pip install .
```
T
TomorrowIsAnOtherDay 已提交
107 108
如果遇到网络问题导致的下载较慢,建议使用清华源解决(参考上面的命令)。<br>
遇到git clone如果较慢的问题,建议使用我们托管在国内码云平台的仓库。
T
TomorrowIsAnOtherDay 已提交
109 110 111 112 113 114
```shell
git clone https://gitee.com/paddlepaddle/PARL.git
```

### **关于并行**

T
TomorrowIsAnOtherDay 已提交
115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132
如果只是想使用PARL的并行功能的话,是无需安装任何深度学习框架的。


## 贡献
本项目欢迎任何贡献和建议。 大多数贡献都需要你同意参与者许可协议(CLA),来声明你有权,并实际上授予我们有权使用你的贡献。
### 代码贡献规范
- 代码风格规范<br>
PARL使用yapf工具进行代码风格的统一,使用方法如下:
```shell
pip install yapf==0.24.0
yapf -i modified_file.py
```
- 持续继承测试<br>
当增加代码时候,需要增加测试代码覆盖所添加的代码,测试代码得放在相关代码文件的`tests`文件夹下,以`_test.py`结尾(这样持续集成测试会自动拉取代码跑)。附:[测试代码示例](../../parl/tests/import_test.py)


## 反馈
- 在 GitHub 上[提交问题](https://github.com/PaddlePaddle/PARL/issues)