yolov7: 从搭配环境到训练自己的数据集

Yolo v7从搭配环境到训练自己的数据集

与君初相识

41540人浏览 · 2022-07-11 11:36:51

与君初相识 · 2022-07-11 11:36:51 发布

一.下载源码

在github中下载Yolov7源码并解压缩
YOLOv7 源码

数据标注可以参考这篇文章
https://blog.csdn.net/qq_39779449/article/details/110172948?spm=1001.2014.3001.5502
标签格式
在这里插入图片描述

在这里插入图片描述

二.配置环境

整体配置树结构

安装Yolo v7 gpu 环境

在Anconda中创造Yolov7环境在这里插入图片描述

安装所需各种包

激活Yolov7环境并安装Yolov7所需各种包，采用清华镜像源安装所需包（都试了一下，还是清华镜像更快）

activate yolov7

pip install -r F:\objectdet\yolov7-main/requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

在这里插入图片描述
检查刚刚环境安装是否成功

如果完全按照requirements.txt来安装的话，你会发现安装的torch版本并不是gpu版本，所以得重新安装gpu版本的才能用你的gpu来训练Yolov7

pip install torch==1.8.2+cu111 torchvision==0.9.2+cu111 torchaudio===0.8.2 -f https://download.pytorch.org/whl/lts/1.8/torch_lts.html -i  https://pypi.tuna.tsinghua.edu.cn/simple

安装好后，通过pip list查看你所安装的包，如下图所示，恭喜，安装成功
在这里插入图片描述

三.使Yolo v7 训练并测试自己的数据集

修改Yolo v7配置

在pycharm中选择刚刚安装好的Yolov7所需环境在这里插入图片描述
修改配置环境

新建自己数据集的yaml文件

train: 修改为自己的训练集路径
val: 修改为自己的验证集路径
test: 修改为自己的测试集路径
nc: 修改为自己的数据集类别数量
names: 修改为自己的数据集类别标签。

训练自己的数据集

通过pycharm训练，修改train.py文件如下，然后run 在这里插入图片描述
也可以通过下面方法直接在终端进行训练

python train.py --workers 1 --device 0 --batch-size 8 --data data/data.yaml --img 640 640 --cfg cfg/training/yolov7.yaml --weights '' --name yolov7 --hyp data/hyp.scratch.p5.yaml

如果出现以下界面，恭喜你，训练成功，慢慢的等你的模型训练完成吧
在这里插入图片描述

测试自己的数据集

在这里我们使用test.py文件中默认的参数

data：更改为自己的数据集配置文件路径
img：输入数据尺寸
batch：批处理数据数量
conf：置信度
iou：阈值
weights: 更改为自己的训练权重路径
name：更改为自己的路径

python test.py --data data/data.yaml --img 640 --batch 8 --conf 0.001 --iou 0.65 --device 0 --weights yolov7.pt --name yolov7_val

对单张数据集进行预测

对单张图片进行预测
`
python detect.py --weights yolov7.pt --conf 0.25 --img-size 640 --source images/benign.jpg

四.遇到得问题及解决方案

不能跑yolov7-e6e.yaml文件
看官方论文，yolov7-e6e.yaml效果最好，于是打算试试yolov7-e6e.yaml，emmm,在对yolov7-e6e.yaml进行训练时，就报以下错误了。yolov7.yaml都可以正常运行，换成yolov7e6e.yaml就报错，nc已经改为我的数据集的类别了，做迁移学习是能用的。在网上查了一堆资料也没找到相关的解决方案。
在这里插入图片描述
最开始以为是显存不够，batch-size改为1，img-size改为128，可还是不行，查了一下作者的最新代码，发现yolov7-e6e.yaml与yolov7.yaml训练文件不一样。前者是通过train_aux.py进行训练,后者是通过train.py进行训练。
开始用train_aux.py开始进行训练，没错，又又报错了。。。解决了一个bug又出现另一个bug.
在这里插入图片描述
查看yolov7原作者的github issues部分，发现loss.py进行了修复，又将loss.py文件复制替换掉我的原loss文件，终于成功了。
总结：经验所得，以后跑大佬的代码。尽量还是用大佬的最新代码。可以少走很多弯路。