Add files via upload

891957bb · Bubbliiiing · GitHub · 9c4d2d4e · 891957bb
隐藏空白更改
内联并排

Showing with 116 addition and 44 deletion

常见问题汇总.md 常见问题汇总.md +116 -44

未找到文件。
--- a/常见问题汇总.md
+++ b/常见问题汇总.md
-## 常见的问题汇总：
-
-问：up主，可以给我发一份代码吗，代码在哪里下载啊？ 
-答：Github上的地址就在视频简介里。复制一下就能进去下载了。
-
-问：为什么我安装了tensorflow-gpu但是却没用利用GPU进行训练呢？
-答：有没有用到GPU应该看终端里的提示，不要看任务管理器。
-
-问：up主，为什么我下载的代码里面，model_data下面没有.pth或者.h5文件？ 
-答：我一般会把权值上传到百度网盘，在GITHUB的README里面就能找到。
-
-问：up主，为什么运行train.py会提示shape不匹配啊？
-答：因为你训练的种类和原始的种类不同，网络结构会变化，所以最尾部的shape会有少量不匹配。
-
-问：为什么提示说no module name utils.utils（no module name nets.yolo、no module name nets.ssd等一系列问题）啊？
-答：根目录不对，查查相对目录的概念。查了基本上就明白了。
-
-问：为什么提示说no module name matplotlib（no module name PIL）？
-答：打开命令行安装就好。pip install matplotlib
-
-问：为什么我运行predict.py会提示我说shape不匹配呀。（为什么我训练完了不能预测啊）
-答：原因主要有仨：
+# 问题汇总
+
+## 1、下载问题
+**问：up主，可以给我发一份代码吗，代码在哪里下载啊？ 
+答：Github上的地址就在视频简介里。复制一下就能进去下载了。**
+
+**问：up主，为什么我下载的代码里面，model_data下面没有.pth或者.h5文件？ 
+答：我一般会把权值上传到百度网盘，在GITHUB的README里面就能找到**
+
+**问：up主，为什么我下载的代码提示压缩包损坏？
+答：重新去Github下载。**
+
+## 2、环境配置问题
+**问：为什么我安装了tensorflow-gpu但是却没用利用GPU进行训练呢？
+答：有没有用到GPU应该看终端里的提示，不要看任务管理器。**
+
+**问：你的代码某某某版本的tensorflow和pytorch能用嘛？
+答：最好按照我推荐的配置，配置教程也有！其它版本的我没有试过**
+
+**问：up主，为什么我按照你的环境配置后还是不能使用？
+答：请把你的GPU、CUDA、CUDNN、TF版本以及PYTORCH版本私聊告诉我。**
+
+**问：出现如下错误**
+```python
+Traceback (most recent call last):
+  File "C:\Users\focus\Anaconda3\ana\envs\tensorflow-gpu\lib\site-packages\tensorflow\python\pywrap_tensorflow.py", line 58, in <module>
+ from tensorflow.python.pywrap_tensorflow_internal import *
+File "C:\Users\focus\Anaconda3\ana\envs\tensorflow-gpu\lib\site-packages\tensorflow\python\pywrap_tensorflow_internal.py", line 28, in <module>
+pywrap_tensorflow_internal = swig_import_helper()
+  File "C:\Users\focus\Anaconda3\ana\envs\tensorflow-gpu\lib\site-packages\tensorflow\python\pywrap_tensorflow_internal.py", line 24, in swig_import_helper
+    _mod = imp.load_module('_pywrap_tensorflow_internal', fp, pathname, description)
+File "C:\Users\focus\Anaconda3\ana\envs\tensorflow-gpu\lib\imp.py", line 243, in load_modulereturn load_dynamic(name, filename, file)
+File "C:\Users\focus\Anaconda3\ana\envs\tensorflow-gpu\lib\imp.py", line 343, in load_dynamic
+    return _load(spec)
+ImportError: DLL load failed: 找不到指定的模块。
+```
+**答：如果没重启过就重启一下，否则重新按照步骤安装，还无法解决则把你的GPU、CUDA、CUDNN、TF版本以及PYTORCH版本私聊告诉我。**
+
+## 3、shape不匹配问题
+### a、训练时shape不匹配问题
+**问：up主，为什么运行train.py会提示shape不匹配啊？
+答：因为你训练的种类和原始的种类不同，网络结构会变化，所以最尾部的shape会有少量不匹配。**
+### b、预测时shape不匹配问题
+**问：为什么我运行predict.py会提示我说shape不匹配呀。**
+**答：原因主要有仨：
 1、在ssd、FasterRCNN里面，可能是train.py里面的num_classes没改。
 2、model_path没改。
 3、classes_path没改。
-请检查清楚了！确定自己所用的model_path和classes_path是对应的！训练的时候用到的num_classes或者classes_path也需要检查！因为都是这个问题，如果来询问我，我也是同样的回答（问的太多了，但出错原因都是一样的，我在视频里也会强调需要修改model_path和classes_path，请一定注意修改。）。
+请检查清楚了！确定自己所用的model_path和classes_path是对应的！训练的时候用到的num_classes或者classes_path也需要检查！**
+
+## 4、no module问题
+**问：为什么提示说no module name utils.utils（no module name nets.yolo、no module name nets.ssd等一系列问题）啊？
+答：根目录不对，查查相对目录的概念。查了基本上就明白了。**
+
+**问：为什么提示说no module name matplotlib（no module name PIL）？
+答：打开命令行安装就好。pip install matplotlib**

-问：为什么我运行train.py下面的命令行闪的贼快，还提示OOM啥的？ 
+## 5、显存问题
+**问：为什么我运行train.py下面的命令行闪的贼快，还提示OOM啥的？ 
 答：爆显存了，可以改小batch_size，如果batch_size=1才能运行的话，那么直接换网络吧，SSD的显存占用率是最小的，建议用SSD；
 2G显存：SSD
 4G显存：YOLOV3 Faster RCNN
 6G显存：YOLOV4 Retinanet M2det Efficientdet等
-8G+显存：随便选吧
+8G+显存：随便选吧**

-问：为什么要冻结训练和解冻训练呀？
-答：这是迁移学习的思想，因为神经网络主干特征提取部分所提取到的特征是通用的，我们冻结起来训练可以加快训练效率，也可以防止权值被破坏。
+## 6、训练问题
+**问：为什么要冻结训练和解冻训练呀？
+答：这是迁移学习的思想，因为神经网络主干特征提取部分所提取到的特征是通用的，我们冻结起来训练可以加快训练效率，也可以防止权值被破坏。**

-问：为什么我的LOSS一直不下降呀？
+**问：为什么我的LOSS一直不下降呀？
 答：主要有五：
 1、	数据集过少，小于500的自行考虑增加数据集。
 2、	是否解冻训练。
 3、	如果是yoloV4可以考虑关闭mosaic，mosaic不适用所有的情况。
 4、	网络不适应，比如SSD不适合小目标，因为先验框固定了。
-5、	不同网络的LOSS不同，LOSS只是一个参考指标，用于查看网络是否收敛，而非评价网络好坏，我的yolo代码都没有归一化，所以LOSS值看起来比较高，LOSS的值不重要，重要的是是否收敛！
+5、	不同网络的LOSS不同，LOSS只是一个参考指标，用于查看网络是否收敛，而非评价网络好坏，我的yolo代码都没有归一化，所以LOSS值看起来比较高，LOSS的值不重要，重要的是是否收敛！**
+
+**问：能不能训练灰度图啊？
+答：可以尝试一下在get_random_data里面将Image.open后的结果转换成RGB，预测的时候也这样试试。（仅供参考）**
+
+**问：我已经训练过几个世代了，能不能从这个基础上继续开始训练
+答：可以，你在训练前，和载入预训练权重一样载入训练过的权重就行了。**
+
+**问：我怎么出现了这样的错误呀：**
+```python
+FileNotFoundError: 【Errno 2】 No such file or directory
+……………………………………
+……………………………………
+```
+**答：去检查一下文件夹路径，查看是否有对应文件；并且检查一下2007_train.txt，其中文件路径是否有错。**
+关于路径有几个重要的点：
+**文件夹名称中一定不要有空格。
+注意相对路径和绝对路径。
+多百度路径相关的知识。**
+
+**问：我怎么出现了这样的错误呀：**
+```python
+UnicodeDecodeError: 'gbk' codec can't decode byte 0xa6 in position 446: illegal multibyte sequence
+```
+**答：标签和路径不要使用中文。**
+
+**问：我的图片是xxx*xxx的分辨率的，可以用吗！**
+**答：可以用，代码里面会自动进行resize或者数据增强。**
+
+**问：为什么我yolo的loss降到了0.0几了什么都预测不出来？**
+**答：yolo系列的loss是降不到这么多的。查看2007_train.txt文件是否有目标信息。**
+
+
+## 7、乱七八糟的问题
+**问：能不能说说怎么绘制PR曲线啥的呀。
+答：可以看mAP视频，结果里面有PR曲线。**
+
+**问：怎么用摄像头检测呀？
+答：基本上所有目标检测库都有video.py可以进行摄像头检测，也有视频详细解释了摄像头检测的思路。**

-问：能不能说说怎么绘制PR曲线啥的呀。
-答：可以看mAP视频，结果里面有PR曲线。
+**问：ubuntu下可以用吗？
+答：可以。**

-问：我已经训练过几个世代了，能不能从这个基础上继续开始训练
-答：可以，你在训练前，和载入预训练权重一样载入训练过的权重就行了。
+**问：怎么进行多GPU训练？
+答：这个直接百度就好了，实现并不复杂。**

-问：能不能训练灰度图啊？
-答：可以尝试一下在get_random_data里面将Image.open后的结果转换成RGB，预测的时候也这样试试。（仅供参考）
+**问：为什么提示TypeError: cat() got an unexpected keyword argument 'axis'，Traceback (most recent call last)，AttributeError: 'Tensor' object has no attribute 'bool'？
+答：这是版本问题，建议使用torch1.2以上版本**

-问：怎么用摄像头检测呀？
-答：基本上所有目标检测库都有video.py可以进行摄像头检测，也有视频详细解释了摄像头检测的思路。
+**其它有很多稀奇古怪的问题，很多是版本问题，建议按照我的视频教程安装Keras和tensorflow。比如装的是tensorflow2，就不用问我说为什么我没法运行Keras-yolo啥的。那是必然不行的。**

-问：ubuntu下可以用吗？
-答：可以。

-问：怎么进行多GPU训练？
-答：这个直接百度就好了，实现并不复杂。
+## 8、和原版比较问题
+**问：你这个代码和原版比怎么样，可以达到原版的效果么？
+答：基本上可以达到，我都用voc数据测过，我没有好显卡，没有能力在coco上测试与训练。**

-问：为什么提示TypeError: cat() got an unexpected keyword argument 'axis'，Traceback (most recent call last)，AttributeError: 'Tensor' object has no attribute 'bool'？
-答：这是版本问题，建议使用torch1.2以上版本
+## 9、FPS问题
+**问：你这个FPS可以到达多少，可以到 XX FPS么？
+答：FPS和机子的配置有关，配置高就快，配置低就慢。**

-其它有很多稀奇古怪的问题，很多是版本问题，建议按照我的视频教程安装Keras和tensorflow。比如装的是tensorflow2，就不用问我说为什么我没法运行Keras-yolo啥的。那是必然不行的。
+**问：为什么我用服务器去测试yolov4（or others）的FPS只有十几？
+答：检查是否正确安装了tensorflow-gpu或者pytorch的gpu版本，如果已经正确安装，可以去利用time.time()的方法查看detect_image里面，哪一段代码耗时更长（不仅只有网络耗时长，其它处理部分也会耗时，如绘图等）。**

+**问：为什么论文中说速度可以达到XX，但是这里却没有？
+答：检查是否正确安装了tensorflow-gpu或者pytorch的gpu版本，如果已经正确安装，可以去利用time.time()的方法查看detect_image里面，哪一段代码耗时更长（不仅只有网络耗时长，其它处理部分也会耗时，如绘图等）。有些论文还会使用多batch进行预测，我并没有去实现这个部分。**