README.md 9.3 KB
Newer Older
B
Bubbliiiing 已提交
1 2 3
## Efficientdet:Scalable and Efficient Object目标检测模型在Pytorch当中的实现
---

B
Bubbliiiing 已提交
4 5 6
**2021年10月12日更新:**   
**进行了大幅度的更新,对代码的模块进行修改,加了大量注释。**  

B
Bubbliiiing 已提交
7
### 目录
B
Bubbliiiing 已提交
8 9 10 11 12 13
1. [性能情况 Performance](#性能情况)
2. [所需环境 Environment](#所需环境)
3. [文件下载 Download](#文件下载)
4. [注意事项 Attention](#注意事项)
5. [预测步骤 How2predict](#预测步骤)
6. [训练步骤 How2train](#训练步骤)
B
Bubbliiiing 已提交
14 15
7. [评估步骤 How2eval](#评估步骤)
8. [参考资料 Reference](#Reference)
B
Bubbliiiing 已提交
16 17 18 19

### 性能情况
| 训练数据集 | 权值文件名称 | 测试数据集 | 输入图片大小 | mAP 0.5:0.95 |
| :-----: | :-----: | :------: | :------: | :------: |
B
Bubbliiiing 已提交
20 21 22 23 24 25 26 27
| COCO-Train2017 | [efficientdet-d0.pth](https://github.com/bubbliiiing/efficientdet-pytorch/releases/download/v1.0/efficientdet-d0.pth) | COCO-Val2017 | 512x512 | 33.1 
| COCO-Train2017 | [efficientdet-d1.pth](https://github.com/bubbliiiing/efficientdet-pytorch/releases/download/v1.0/efficientdet-d1.pth) | COCO-Val2017 | 640x640 | 38.8  
| COCO-Train2017 | [efficientdet-d2.pth](https://github.com/bubbliiiing/efficientdet-pytorch/releases/download/v1.0/efficientdet-d2.pth) | COCO-Val2017 | 768x768 | 42.1
| COCO-Train2017 | [efficientdet-d3.pth](https://github.com/bubbliiiing/efficientdet-pytorch/releases/download/v1.0/efficientdet-d3.pth) | COCO-Val2017 | 896x896 | 45.6
| COCO-Train2017 | [efficientdet-d4.pth](https://github.com/bubbliiiing/efficientdet-pytorch/releases/download/v1.0/efficientdet-d4.pth) | COCO-Val2017 | 1024x1024 | 48.8
| COCO-Train2017 | [efficientdet-d5.pth](https://github.com/bubbliiiing/efficientdet-pytorch/releases/download/v1.0/efficientdet-d5.pth) | COCO-Val2017 | 1280x1280 | 50.2
| COCO-Train2017 | [efficientdet-d6.pth](https://github.com/bubbliiiing/efficientdet-pytorch/releases/download/v1.0/efficientdet-d6.pth) | COCO-Val2017 | 1408x1408 | 50.7 
| COCO-Train2017 | [efficientdet-d7.pth](https://github.com/bubbliiiing/efficientdet-pytorch/releases/download/v1.0/efficientdet-d7.pth) | COCO-Val2017 | 1536x1536 | 51.2  
B
Bubbliiiing 已提交
28 29 30 31 32 33

### 所需环境
torch==1.2.0

### 文件下载  
训练所需的pth可以在百度网盘下载。       
B
Bubbliiiing 已提交
34
包括Efficientdet-d0到d7所有权重。    
B
Bubbliiiing 已提交
35 36
链接: https://pan.baidu.com/s/1Kvv526YYSDJEf9BzWfIb3Q     
提取码: f9g3  
B
Bubbliiiing 已提交
37

B
Bubbliiiing 已提交
38 39 40
VOC数据集下载地址如下,里面已经包括了训练集、测试集、验证集(与测试集一样),无需再次划分:  
链接: https://pan.baidu.com/s/1YuBbBKxm2FGgTU5OfaeC5A    
提取码: uack   
B
Bubbliiiing 已提交
41

B
Bubbliiiing 已提交
42 43 44 45
## 训练步骤
### a、训练VOC07+12数据集
1. 数据集的准备   
**本文使用VOC格式进行训练,训练前需要下载好VOC07+12的数据集,解压后放在根目录**  
B
Bubbliiiing 已提交
46

B
Bubbliiiing 已提交
47 48
2. 数据集的处理   
修改voc_annotation.py里面的annotation_mode=2,运行voc_annotation.py生成根目录下的2007_train.txt和2007_val.txt。   
B
Bubbliiiing 已提交
49

B
Bubbliiiing 已提交
50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90
3. 开始网络训练   
train.py的默认参数用于训练VOC数据集,直接运行train.py即可开始训练。   

4. 训练结果预测   
训练结果预测需要用到两个文件,分别是efficientdet.py和predict.py。我们首先需要去efficientdet.py里面修改model_path以及classes_path,这两个参数必须要修改。   
**model_path指向训练好的权值文件,在logs文件夹里。   
classes_path指向检测类别所对应的txt。**   
完成修改后就可以运行predict.py进行检测了。运行后输入图片路径即可检测。   

### b、训练自己的数据集
1. 数据集的准备  
**本文使用VOC格式进行训练,训练前需要自己制作好数据集,**    
训练前将标签文件放在VOCdevkit文件夹下的VOC2007文件夹下的Annotation中。   
训练前将图片文件放在VOCdevkit文件夹下的VOC2007文件夹下的JPEGImages中。   

2. 数据集的处理  
在完成数据集的摆放之后,我们需要利用voc_annotation.py获得训练用的2007_train.txt和2007_val.txt。   
修改voc_annotation.py里面的参数。第一次训练可以仅修改classes_path,classes_path用于指向检测类别所对应的txt。   
训练自己的数据集时,可以自己建立一个cls_classes.txt,里面写自己所需要区分的类别。   
model_data/cls_classes.txt文件内容为:      
```python
cat
dog
...
```
修改voc_annotation.py中的classes_path,使其对应cls_classes.txt,并运行voc_annotation.py。  

3. 开始网络训练  
**训练的参数较多,均在train.py中,大家可以在下载库后仔细看注释,其中最重要的部分依然是train.py里的classes_path。**  
**classes_path用于指向检测类别所对应的txt,这个txt和voc_annotation.py里面的txt一样!训练自己的数据集必须要修改!**  
修改完classes_path后就可以运行train.py开始训练了,在训练多个epoch后,权值会生成在logs文件夹中。  

4. 训练结果预测  
训练结果预测需要用到两个文件,分别是efficientdet.py和predict.py。在efficientdet.py里面修改model_path以及classes_path。  
**model_path指向训练好的权值文件,在logs文件夹里。  
classes_path指向检测类别所对应的txt。**  
完成修改后就可以运行predict.py进行检测了。运行后输入图片路径即可检测。  

## 预测步骤
### a、使用预训练权重
1. 下载完库后解压,在百度网盘下载权值,放入model_data,运行predict.py,输入  
B
Bubbliiiing 已提交
91 92 93
```python
img/street.jpg
```
B
Bubbliiiing 已提交
94 95 96 97
2. 在predict.py里面进行设置可以进行fps测试和video视频检测。  
### b、使用自己训练的权重
1. 按照训练步骤训练。  
2. 在efficientdet.py文件里面,在如下部分修改model_path和classes_path使其对应训练好的文件;**model_path对应logs文件夹下面的权值文件,classes_path是model_path对应分的类**
B
Bubbliiiing 已提交
98 99
```python
_defaults = {
B
Bubbliiiing 已提交
100 101 102 103 104
    #--------------------------------------------------------------------------#
    #   使用自己训练好的模型进行预测一定要修改model_path和classes_path!
    #   model_path指向logs文件夹下的权值文件,classes_path指向model_data下的txt
    #   如果出现shape不匹配,同时要注意训练时的model_path和classes_path参数的修改
    #--------------------------------------------------------------------------#
B
Bubbliiiing 已提交
105 106
    "model_path"        : 'model_data/efficientdet-d0.pth',
    "classes_path"      : 'model_data/coco_classes.txt',
B
Bubbliiiing 已提交
107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123
    #---------------------------------------------------------------------#
    #   用于选择所使用的模型的版本,0-7
    #---------------------------------------------------------------------#
    "phi"               : 0,
    #---------------------------------------------------------------------#
    #   只有得分大于置信度的预测框会被保留下来
    #---------------------------------------------------------------------#
    "confidence"        : 0.3,
    #---------------------------------------------------------------------#
    #   非极大抑制所用到的nms_iou大小
    #---------------------------------------------------------------------#
    "nms_iou"           : 0.3,
    #---------------------------------------------------------------------#
    #   该变量用于控制是否使用letterbox_image对输入图像进行不失真的resize,
    #   在多次测试后,发现关闭letterbox_image直接resize的效果更好
    #---------------------------------------------------------------------#
    "letterbox_image"   : False,
B
Bubbliiiing 已提交
124 125 126 127 128
    #---------------------------------------------------------------------#
    #   是否使用Cuda
    #   没有GPU可以设置成False
    #---------------------------------------------------------------------#
    "cuda"              : True
B
Bubbliiiing 已提交
129 130
}
```
B
Bubbliiiing 已提交
131
3. 运行predict.py,输入  
B
Bubbliiiing 已提交
132 133 134
```python
img/street.jpg
```
B
Bubbliiiing 已提交
135 136 137 138 139 140 141
4. 在predict.py里面进行设置可以进行fps测试和video视频检测。  

## 评估步骤 
### a、评估VOC07+12的测试集
1. 本文使用VOC格式进行评估。VOC07+12已经划分好了测试集,无需利用voc_annotation.py生成ImageSets文件夹下的txt。
2. 在efficientdet.py里面修改model_path以及classes_path。**model_path指向训练好的权值文件,在logs文件夹里。classes_path指向检测类别所对应的txt。**  
3. 运行get_map.py即可获得评估结果,评估结果会保存在map_out文件夹中。
B
Bubbliiiing 已提交
142

B
Bubbliiiing 已提交
143
### b、评估自己的数据集
B
Bubbliiiing 已提交
144
1. 本文使用VOC格式进行评估。  
B
Bubbliiiing 已提交
145 146 147 148
2. 如果在训练前已经运行过voc_annotation.py文件,代码会自动将数据集划分成训练集、验证集和测试集。如果想要修改测试集的比例,可以修改voc_annotation.py文件下的trainval_percent。trainval_percent用于指定(训练集+验证集)与测试集的比例,默认情况下 (训练集+验证集):测试集 = 9:1。train_percent用于指定(训练集+验证集)中训练集与验证集的比例,默认情况下 训练集:验证集 = 9:1。
3. 利用voc_annotation.py划分测试集后,前往get_map.py文件修改classes_path,classes_path用于指向检测类别所对应的txt,这个txt和训练时的txt一样。评估自己的数据集必须要修改。
4. 在efficientdet.py里面修改model_path以及classes_path。**model_path指向训练好的权值文件,在logs文件夹里。classes_path指向检测类别所对应的txt。**  
5. 运行get_map.py即可获得评估结果,评估结果会保存在map_out文件夹中。
B
Bubbliiiing 已提交
149 150 151 152

### Reference
https://github.com/zylo117/Yet-Another-EfficientDet-Pytorch   
https://github.com/Cartucho/mAP