New Features

  • 支持 ARM 交叉编译
  • 添加多线程 CompNode
  • 支持 从 CPU 到 CUDA设备的 DeviceTensorND copy
  • 动态图 profilng 功能
  • 暴露 sublinear 参数 API
  • 新增 objects365 数据集
  • voc 数据集支持 detection
  • 添加 arange, conv_transpose2d, isnan, isinf, normalize 算子
  • axis 参数支持负值
  • 均匀采样支持上界下届
  • LeakyReLU 支持 negative slope 参数
  • 支持根据用户定义 key 进行参数打包
  • 增加量化训练接口
  • ARM添加NCHW44的layout,并优化对应算子性能, 性能相比NCHW有加速

Bug Fix

  • 修复 im2col 线程安全问题
  • 修复 gcc5 -O0 编译错误
  • create_mm_server 失败时返回 -1
  • 修复 reduce mean 的求导函数
  • 修复 F.clamp 的边界问题
  • 修复 coco 数据集中的 NaN 问题
  • 修复 batch_norm2d, linspace 的文档问题
  • 释放老参数的显存
  • F.where 支持 x 或 y 参数是空值的情况
  • one_hot 移除 num_classes 参数默认值
  • 修复voc中错误的类名
  • 修复batchnorm docstring的momentum更新公式

致谢开源社区贡献者

截至目前,也收到了很多的宝贵的反馈和建议,感谢: clhne、cydiachen、daa233、DaHaiHuha、junjie18、KaiyuYue、mgno32、xiaoguai0992。部分反馈和建议在本次发版中解决,其余的反馈和建议将陆续在接下来的发版中解决 衷心感谢每一个提问的开发者

New Features

  • Add cmake cross build ci
  • Add inference cross build support
  • Add compnode multithread in python
  • Support copy DeviceTensorND from cpu to cuda
  • Add profiler for dynamic graph
  • Expose sublinear related parameters at mge api level
  • Add objects365 dataset
  • Voc dataset supports detection
  • Add arange, conv_transpose2d, isnan, isinf, normalize opr
  • Support negative axis in math.py
  • Add lower bound and higher bound for uniform sampling
  • Add negative slope attribute for LeakyReLU module
  • Add user-defined key to pack params
  • Add quantization interface
  • Support NCHW44 layout for ARM

Bug Fix

  • Fix cublas matmul on sm60
  • Fix im2col thread safe problem
  • Fix gcc5 -O0 compiler error
  • Return -1 when create_mm_server failed
  • Fix grad function of reduce mean
  • Fix F.clamp
  • Fix an nan bug in coco dataset
  • Fix batch_norm2d, linspace doc
  • Add the more warnings in load_state_dict
  • Release old parameters
  • F.where support x or y is empty
  • Fix one_hot: no default value for num_classes
  • Fix wrong class name in voc
  • Fix momentum equation in batch norm doc

Thanks to our Contributors

many feedbacks from developers : clhne、cydiachen、daa233、DaHaiHuha、junjie18、KaiyuYue、mgno32、xiaoguai0992 We would also like to thank everyone who reported questions

项目简介

MegEngine 是一个快速、可拓展、易于使用且支持自动求导的深度学习框架

发行版本 15

MegEngine v1.4.0

全部发行版

贡献者 13

全部贡献者

开发语言

  • C++ 79.8 %
  • Cuda 13.8 %
  • Python 4.9 %
  • C 0.9 %
  • CMake 0.5 %