1.5.0 · 标签 · PaddlePaddle / Paddle-Lite

1.5.0

ARM CPU： - 增加 64 位 gemm_int8 量化实现 - 增加 conv_relu、nearestinterp、leakyrelu、density_prior_box 等 op

Android GPU： - 实现 Winograd 卷积实现，3 x 3 卷积在计算量较大时，性能提升2倍—30倍不等 - 增加 conv_relu、scale、reshape2、transpose2、split、relu6 等 GPU op - cl_kernel文件编译，不同op动态添加宏控制

Metal： - 支持WinoGrad算法。 - 添加内存复用算法，材质占用的内存体积可减少一半。 - 支持MPS及非MPS混排。 - 增强框架安全性（添加通用异常处理逻辑、添加多线程保护）。 - 新增OP，支持ShuffleNet。

Web 网页版： - 建立Web版Paddle框架，支持MobileNet、Yolo等网络。 - 基于WebGL提供完整的GPGPU功能。

发布 Lite 新架构，整体加强 Paddle 预测库底层硬件的多硬件混合调度，硬件开发扩展能力，设计要点如下

引入 Type system，强化多硬件、量化方法、data layout 的混合调度能力
硬件细节隔离，通过不同编译开关，对支持的任何硬件可以自由插拔
引入 MIR(Machine IR) 的概念，强化带执行环境下的优化支持
优化期和执行期严格隔离，保证预测时轻量和高效率

本次发布支持如下硬件：

android ARM v7, v8; 内部测试包括 mobilenet-v1, movilenet-v2, resnet50, inception-v4 等模型
armlinux 支持 ARM V8，支持如上4个模型
opencl; 测试 mobilenetv1
ARM v7, v8; Int8 量化预测; 测试 mobilenet-v1

用户文档参考 lite 文档

开发者文档参考：开发者文档

性能参数参考：Benchmark

代码 tag 位于：lite-v0.1

预编译的预测库：