# cfg.SOLVER SOLVER Group定义所有和训练优化相关的配置 ## `LR` 初始学习率 ### 默认值 0.1

## `LR_WARMUP` 学习率是否经过warmup过程,如果设置为True,则学习率会从0开始,经过`LR_WARMUP_STEPS`步后线性增长到指定的初始学习率 ### 默认值 False

## `LR_WARMUP_STEPS` 学习率warmup步数 ### 默认值 2000

## `LR_POLICY` 学习率的衰减策略,支持`poly` `piecewise` `cosine`三种策略 ### 默认值 `poly` ### 示例 * 当使用`poly`衰减时,假设初始学习率为0.1,训练总步数为10000,则在power分别为`0.4` `0.8` `1` `1.2` `1.6`时,衰减曲线如下图: * power = 1 衰减曲线为直线 * power > 1 衰减曲线内凹 * power < 1 衰减曲线外凸


* 当使用`poly`衰减时,假设初始学习率为0.1,训练总步数为10000,power为`1`,开启了LR_WARMUP,且LR_WARMUP_STEP为2000时,衰减曲线如下图:


* 当使用`piecewise`衰减时,假设初始学习率为0.1,GAMMA为0.9,总EPOCH数量为100,DECAY_EPOCH为[10, 20],衰减曲线如下图:


* 当使用`cosine`衰减时,假设初始学习率为0.1,总EPOCH数量为100,衰减曲线如下图:




## `POWER` 学习率Poly下降指数,仅当策略为[`LR_POLICY`](#LR_POLICY)为`poly`时有效 ### 默认值 0.9

## `GAMMA` 学习率piecewise下降指数,仅当策略为[`LR_POLICY`](#LR_POLICY)为`piecewise`时有效 ### 默认值 0.1

## `DECAY_EPOCH` 学习率piecewise下降间隔,仅当策略为[`LR_POLICY`](#LR_POLICY)为`piecewise`时有效 ### 默认值 [10, 20]

## `WEIGHT_DECAY` L2正则化系数 ### 默认值 0.00004

## `BEGIN_EPOCH` 起始EPOCH值 ### 默认值 0

## `NUM_EPOCHS` 训练EPOCH数 ### 默认值 30(需要根据实际需求进行调整)

## `SNAPSHOT` 训练时,保存模型的间隔(单位为EPOCH) ### 默认值 10(意味着每训练10个EPOCH保存一次模型)

## `loss` 训练时选择的损失函数, 支持`softmax_loss(sotfmax with cross entroy loss)`, `dice_loss(dice coefficient loss)`, `bce_loss(binary cross entroy loss)`三种损失函数。 其中`dice_loss`和`bce_loss`仅在两类分割问题中适用,`softmax_loss`不能与`dice_loss` 或`bce_loss`组合,`dice_loss`可以和`bce_loss`组合使用。使用示例如下: `['softmax_loss']`或`['dice_loss','bce_loss']` ### 默认值 ['softmax_loss']