YOLOv7训练数据集

总共有两个文件需要配置，一个是，这个文件是有关模型的配置文件；一个是，这个是数据集的配置文件。训练用到之前提到的三个文件：预训练模型、和然后运行界面如下，图中红色部分表示开始扫描数据，然后会在下生成两个缓存文件，这两个文件是方便模型进行数据读取生成的，训练过程中不要删除。扫描完后模型会开始训练，如下图。模型训练中下面简单介绍一下相关的参数。--weights weights/yolov7.pt #

whaosoft143

7942人浏览 · 2022-09-03 16:09:47

whaosoft143 · 2022-09-03 16:09:47 发布

今天又来说v7了不过具了解及问了几个高手...v7并没这么... 嘿嘿不好意思学习的态度讨论而已

在Ubuntu 18.04系统，python 3.7.xx 下运行

1. 代码克隆

代码的克隆和环境的安装在官网上也有指导，可以直接跳转到官网 (https://github.com/WongKinYiu/yolov7) 查看。下面是具体的操作，跟官网的一样。首先，直接把项目从官网上克隆下来，在终端输入如下命令

代码的克隆过程看服务器的网速，有的需要两三分钟，有的几十秒即可。克隆好了之后，打开yolov7，可以看到如下的文件。

不上图-- whaosoft aiot http://143ai.com

2. 环境安装

然后进入到项目文件夹中，进行环境的安装，分别输入一下两行代码即可。同样地，速度受服务器网速影响，但是都不会太久。

cd yolov7
pip install -r requirements.txt

下面是环境安装好之后的结果截图。

不上图--

环境安装好之后

3. 权重下载

这次我们使用的预训练模型是yolov7_training.pt，这个模型是在MS COCO数据集上进行训练的，我们把这个模型下载到/yolov7/weights/下。注意，我们需要创建一个/weights/文件夹，用来统一存放我们的预训练模型。输入如下命令进行文件夹的创建，并进入到该文件夹下

mkdir weights   # 创建文件夹
cd weights      # 进入到该文件夹下

这些预训练的模型官网都有提供，掌握如何训练自己的数据集后可根据需求进行预训练模型的更改。官网的截图如下：

官网提供的预训练模型

在终端输入如下命令，即可下载预训练模型

wget https://github.com/WongKinYiu/yolov7/releases/download/v0.1/yolov7_training.pt

下图是下载过程的截图，同样是受服务器的网速影响。可以看到，我只有十几KB/s，而整个文件大小为75.6MB，所以这个速度是不够的。这里建议手动下载，然后手动传到服务器上，这样速度更快。

不上图--

下载完后（或者上传好后，我是手动下载再上传的），会在/weights/得到一个如下图的文件

不用上图--

然后我们回到上一级工作路径下，也就是/yolov7/下，输入如下命令

cd ..

到这里，我们的预训练权重也就下载好了。

4. 测试一下

这一步的重要目的，是测试环境是否都安装好了，如果能够顺利跑下来并得到相应的结果，就说明环境是安装好的了；如果没安装好，则再安装一次环境即可，也就是第2步。

首先，我们下载已经训练好的权重文件（这里的权重文件和Transfer Learning的预训练文件并不是同一个文件），同样地，下载到/weights/下面。

cd weights
wget https://github.com/WongKinYiu/yolov7/releases/download/v0.1/yolov7.pt
cd ..

下载好了之后，得到两个权重文件。接下来，就是直接进行测试了。现在我们在/yolov7/这个工作路径下，输入如下命令

python detect.py --weights weights/yolov7.pt --source inference/images

参数说明

--weights weight/yolov7.pt   # 这个参数是把已经训练好的模型路径传进去，就是刚刚下载的文件
--source inference/images   # 传进去要预测的图片

如果得到如下的运行结果，则说明运行成功，预测的图片被保存在了/runs/detect/exp/文件夹下

无需图--

查看其中一张图片，如下

推理前，在source里

推理后

到此，就说明环境安装好了，可以进行下面的数据准备工作。

#数据准备

1. 准备工作

我们生成/datasets/文件夹，把数据都放进这个文件夹里进行统一管理。训练数据用的是yolo数据格式，不过多了两个.txt文件，这两个文件存放的，是每个图片的路径，后面会具体介绍。

2. 准备yolo格式的数据

2.1. 创建文件夹

mkdir datasets

得到如下的结果

无需图--

2.2. 准备yolo格式数据集

如果不懂yolo格式数据集是什么样子的，建议先学习一下。大部分CVer都会推荐用labelImg进行数据的标注，我也不例外，推荐大家用labelImg进行数据标注。不过这里我不再详细介绍如何使用labelImg，网上有很多的教程。同时，标注数据需要用到图形交互界面，远程服务器就不太方便了，因此建议在本地电脑上标注好后再上传到服务器上。

这里假设我们已经得到标注好的yolo格式数据集，那么这个数据集将会按照如下的格式进行存放。

不过在这里面，train_list.txt和val_list.txt是后来我们要自己生成的，而不是labelImg生成的；其他的则是labelImg生成的。

接下来，就是生成 train_list.txt和val_list.txt。train_list.txt存放了所有训练图片的路径，val_list.txt则是存放了所有验证图片的路径，如下图所示，一行代表一个图片的路径。这两个文件的生成写个循环就可以了，不算难。

到此，数据集就已经准备好了。

#配置训练的相关文件

1. 前言

总共有两个文件需要配置，一个是/yolov7/cfg/training/yolov7.yaml，这个文件是有关模型的配置文件；一个是/yolov7/data/coco.yaml，这个是数据集的配置文件。

2. 配置模型文件

第一步，复制yolov7.yaml文件到相同的路径下，然后重命名，我们重命名为yolov7-Helmet.yaml。

第二步，打开yolov7-Helmet.yaml文件，进行如下图所示的修改，这里修改的地方只有一处，就是把nc修改为我们数据集的目标总数即可。然后保存。

3. 配置数据集文件

第一步，复制coco.yaml文件到相同的路径下，然后重命名，我们命名为Helmet.yaml。

第二步，打开Helmet.yaml文件，进行如下所示的修改，需要修改的地方为5处。第一处：把代码自动下载COCO数据集的命令注释掉，以防代码自动下载数据集占用内存；第二处：修改train的位置为train_list.txt的路径；第三处：修改val的位置为val_list.txt的路径；第四处：修改nc为数据集目标总数；第五处：修改names为数据集所有目标的名称。然后保存。

至此，相关的文件已经配置完成。

#开始训练

1. 前言

训练用到之前提到的三个文件：预训练模型yolov7_training.pt、yolov7-Helmet.yaml和Helmet.yaml，当然还有一些其他的超参数，具体的命令如下：

python train.py --weights weights/yolov7.pt --cfg cfg/training/yolov7-Helmet.yaml --data data/Helmet.yaml --device 0,1 --batch-size 64 --epoch 10

然后运行界面如下，图中红色部分表示开始扫描数据，然后会在yolov7/datasets/Helmet/下生成两个缓存文件，这两个文件是方便模型进行数据读取生成的，训练过程中不要删除。扫描完后模型会开始训练，如下图。

模型训练中

下面简单介绍一下相关的参数。

--weights weights/yolov7.pt             # 接收预训练模型路径的参数
--cfg cfg/training/yolov7-Helmet.yaml   # 接收模型配置文件的参数
--data data/Helmet.yaml                 # 接收数据配置文件的参数
--device 0,1                            # GPU/CPU训练，我有2块，因此为0,1；若1块，则0；若CPU，则cpu
--batch-size 64                         # 按照自己GPU内存大小大致确定
--epoch 10                              # 不用多说；我仅展示，因此不训练那么多次了

更多的参数可以从train.py文件中找到，如下图

#训练结果与推理

1. 训练结果

训练结束后，终端会打印出最好的模型和最后一个epoch的模型结果保存在哪里，如下图所示，

无需图---

训练结束

在/runs/train/exp/下，也存了其他的训练结果文件，比如每个epoch的结果到保存到了.txt文件夹里，如下图所示；有兴趣的可以自行探索。

2. 推理

推理其实就是跟二-4. 测试一下里的差不多，无非就是把相关的权重文件和测试图片换一下即可。

python detect.py --weights runs/train/exp3/weights/best.pt --source datasets/testImages

推理的结果如下所示

无需图--

最后完成了...

华为开发者空间

华为开发者空间，是为全球开发者打造的专属开发空间，汇聚了华为优质开发资源及工具，致力于让每一位开发者拥有一台云主机，基于华为根生态开发、创新。

更多推荐

一文解读GaussDB(DWS)监控运维诊断优化能力

华为开发者空间

GaussDB技术解读——GaussDB架构介绍（四）

华为开发者空间

华为云数据仓库专业级开发者认证重磅发布

华为开发者空间

所有评论(0)

查看更多评论

whaosoft143

@qq_29788741

已为社区贡献3条内容