add pipeline strategy (#2656)

* update doc

add pipeline strategy (#2656)
* update doc
e3d81ece · lilong12 · GitHub · 0ac3ca62 · e3d81ece
隐藏空白更改
内联并排

Showing with 29 addition and 0 deletion

doc/paddle/api/paddle/distributed/fleet/DistributedStrategy_cn.rst ...e/api/paddle/distributed/fleet/DistributedStrategy_cn.rst +29 -0

未找到文件。
--- a/doc/paddle/api/paddle/distributed/fleet/DistributedStrategy_cn.rst
+++ b/doc/paddle/api/paddle/distributed/fleet/DistributedStrategy_cn.rst
@@ -30,6 +30,35 @@ DistributedStrategy

 **checkpoints(int):** Recompute策略的检查点，默认为空列表，也即不启用Recompute。

+.. py:attribute:: pipeline
+
+是否启用Pipeline并行。目前，主要实现单机多GPU间的Pipeline并行和多机间的数据并行。Pipeline信息由用户定义程序中的device_guard确定。
+
+**示例代码**
+
+.. code-block:: python
+
+  import paddle.distributed.fleet as fleet
+  strategy = fleet.DistributedStrategy()
+  strategy.pipeline = True
+
+
+.. py:attribute:: pipeline_configs
+
+设置Pipeline策略的配置。Pipeline策略下，神经网络的不同层在不同的GPU设备。相邻的GPU设备间有用于同步隐层Tensor的队列。Pipeline并行包含多种生产者-消费者形式的硬件对，如GPU-CPU、CPU-GPU、GPU-XPU。加速PIpeline并行的最佳方式是减少Tensor队列中的Tensor大小，这样生产者可以更快的为下游消费者提供数据。
+
+**micro_batch (int):** 每个用户定义的mini-batch中包含的更小的micro-batch的数量。
+
+**示例代码**
+
+.. code-block:: python
+
+  import paddle.distributed.fleet as fleet
+  strategy = fleet.DistributedStrategy()
+  strategy.pipeline = True
+  strategy.pipeline_configs = {"micro_batch": 12}
+
+
 .. py:attribute:: gradient_merge

 梯度累加，是一种大Batch训练的策略。添加这一策略后，模型的参数每过 **k_steps** 步更新一次，