Update 88.md

ff101cc7 · heloowird · GitHub · a7d324c6 · ff101cc7
隐藏空白更改
内联并排

Showing with 1 addition and 1 deletion

docs/1.4/88.md docs/1.4/88.md +1 -1

未找到文件。
--- a/docs/1.4/88.md
+++ b/docs/1.4/88.md
@@ -6,7 +6,7 @@

 量化是一种以低于浮点精度执行运算和存储张量的技术。 量化后的模型使用整数而不是浮点值执行部分或全部张量运算。 这允许更紧凑的模型表示，并在许多硬件平台上使用高性能矢量化操作。 与典型的 FP32 模型相比，PyTorch 支持 INT8 量化，从而可将模型大小减少为原来的 1/4，并将内存占用减少了 3 倍。 与 FP32 计算相比，在支持 INT8的硬件上计算通常快 2 到 4 倍。 量化主要是一种加速推理的技术，并且量化算子仅支持前向传递。

-PyTorch 支持多种方法来量化深度学习模型。 在大多数情况下，模型通常以 FP32 进行训练，然后被转换为 INT8。 此外，PyTorch 还支持量化感知训练，该训练使用伪量化模块对前向和后向传递中的量化误差进行建模。 注意，整个计算是以浮点数进行的。 在量化感知训练结束时，PyTorch 提供转换功能，将训练后的模型转换为较低的精度。
+PyTorch 支持多种方法来量化深度学习模型。 在大多数情况下，模型以 FP32 精度进行训练，然后被转换为 INT8 精度。 此外，PyTorch 还支持量化感知训练，该训练使用伪量化模块对前向和后向传递中的量化误差进行建模。 注意，整个计算是以浮点数进行的。 在量化感知训练结束时，PyTorch 提供转换功能，将训练后的模型转换为较低的精度。

 在底层，PyTorch 提供了一种量化张量表示及运算的方法。 它们可用于直接构建以较低的精度执行全部或部分计算的模型。 更高级别的 API 提供了以最低精度损失地将 FP32 模型转换为较低精度的典型工作流程。