一.下载源码

在github中下载Yolov7源码并解压缩
YOLOv7 源码

数据标注可以参考这篇文章
https://blog.csdn.net/qq_39779449/article/details/110172948?spm=1001.2014.3001.5502
标签格式
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

二.配置环境

整体配置树结构

安装Yolo v7 gpu 环境

在Anconda中创造Yolov7环境在这里插入图片描述

安装所需各种包

激活Yolov7环境 并安装Yolov7所需各种包,采用清华镜像源安装所需包(都试了一下,还是清华镜像更快)

activate yolov7
pip install -r F:\objectdet\yolov7-main/requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

在这里插入图片描述
检查刚刚环境安装是否成功
在这里插入图片描述
在这里插入图片描述
如果完全按照requirements.txt来安装的话,你会发现安装的torch版本并不是gpu版本,所以得重新安装gpu版本的才能用你的gpu来训练Yolov7

pip install torch==1.8.2+cu111 torchvision==0.9.2+cu111 torchaudio===0.8.2 -f https://download.pytorch.org/whl/lts/1.8/torch_lts.html -i  https://pypi.tuna.tsinghua.edu.cn/simple

安装好后,通过pip list查看你所安装的包,如下图所示,恭喜,安装成功
在这里插入图片描述

三.使Yolo v7 训练并测试自己的数据集

修改Yolo v7配置

在pycharm中选择刚刚安装好的Yolov7所需环境在这里插入图片描述
修改配置环境
在这里插入图片描述
新建自己数据集的yaml文件

  • train: 修改为自己的训练集路径
  • val: 修改为自己的验证集路径
  • test: 修改为自己的测试集路径
  • nc: 修改为自己的数据集类别数量
  • names: 修改为自己的数据集类别标签。
    在这里插入图片描述

训练自己的数据集

通过pycharm训练,修改train.py文件如下,然后run在这里插入图片描述
也可以通过下面方法直接在终端进行训练

python train.py --workers 1 --device 0 --batch-size 8 --data data/data.yaml --img 640 640 --cfg cfg/training/yolov7.yaml --weights '' --name yolov7 --hyp data/hyp.scratch.p5.yaml

如果出现以下界面,恭喜你,训练成功,慢慢的等你的模型训练完成吧
在这里插入图片描述在这里插入图片描述

测试自己的数据集

在这里我们使用test.py文件中默认的参数

  • data:更改为自己的数据集配置文件路径
  • img:输入数据尺寸
  • batch:批处理数据数量
  • conf:置信度
  • iou:阈值
  • weights: 更改为自己的训练权重路径
  • name:更改为自己的路径
python test.py --data data/data.yaml --img 640 --batch 8 --conf 0.001 --iou 0.65 --device 0 --weights yolov7.pt --name yolov7_val

对单张数据集进行预测

对单张图片进行预测
`
python detect.py --weights yolov7.pt --conf 0.25 --img-size 640 --source images/benign.jpg

四.遇到得问题及解决方案

不能跑yolov7-e6e.yaml文件
看官方论文,yolov7-e6e.yaml效果最好,于是打算试试yolov7-e6e.yaml,emmm,在对yolov7-e6e.yaml进行训练时,就报以下错误了。yolov7.yaml都可以正常运行,换成yolov7e6e.yaml就报错,nc已经改为我的数据集的类别了,做迁移学习是能用的。在网上查了一堆资料也没找到相关的解决方案。
在这里插入图片描述
最开始以为是显存不够,batch-size改为1,img-size改为128,可还是不行,查了一下作者的最新代码,发现yolov7-e6e.yaml与yolov7.yaml训练文件不一样。前者是通过train_aux.py进行训练,后者是通过train.py进行训练。
开始用train_aux.py开始进行训练,没错,又又报错了。。。解决了一个bug又出现另一个bug.
在这里插入图片描述
查看yolov7原作者的github issues部分,发现loss.py进行了修复,又将loss.py文件复制替换掉我的原loss文件,终于成功了。在这里插入图片描述
总结:经验所得,以后跑大佬的代码。尽量还是用大佬的最新代码。可以少走很多弯路。

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐