下载yolov7源码
源码地址:
https://github.com/WongKinYiu/yolov7
data:image/s3,"s3://crabby-images/13830/13830c5e6ad6dfdc19d0031d8ae8088ac78847b3" alt=""
可以上github网站直接下载,也可以使用git命令进行下载,本次教程下载源码的时间是2022.10.13,项目在不断更新,因此不同时间下载,源代码稍有不同(目前只有一个版本,后续应该会出现新版本)。
下载得到的源码压缩包:
data:image/s3,"s3://crabby-images/7312d/7312de2cc06b1c102ce1c4ae83f4af538225e6c9" alt=""
本地解压后,使用PyCharm打开,项目结构如下:
data:image/s3,"s3://crabby-images/45073/45073d7b5a039872cb588d303265ec5fb09ab5ee" alt=""
配置环境
2.1创建虚拟环境
为本项目新建一个虚拟环境,当然,也可以使用现有的环境;新建环境的好处是避免破坏之前项目的环境:
conda create --name yolov7 python=3.7.13
data:image/s3,"s3://crabby-images/aa16a/aa16a3f8bf51e84d39edc01fe14a05cd04101d8b" alt=""
yolov7虚拟环境新建好之后,激活它:
conda activate yolov7
这样,我们就可以在yolov7虚拟环境下安装一系列的库。
根据requirements.txt中的内容,安装依赖库。
data:image/s3,"s3://crabby-images/7b38b/7b38b03fc44386539ef63a4929ad416177ad9a1f" alt=""
2.2安装依赖库
例如安装torch、torchvision:
data:image/s3,"s3://crabby-images/aa2e6/aa2e61ec84b998e46cb65cdc70b1cf80a31e5c60" alt=""
查看pytorch是否安装成功:
data:image/s3,"s3://crabby-images/00042/00042a7b9cf9b0eab0fa9da307d46d0fe7ca86ec" alt=""
可以导入,说明安装成功;显示False,说明安装的是CPU版本,无法使用GPU资源。
先查看以下,Windows系统上的显卡是否正常,打开终端输入命令:
nvidia-smi
data:image/s3,"s3://crabby-images/88028/880288f44e6fba4b91150336c42946e823c464e0" alt=""
CUDA版本:11.6驱动版本:512.77显卡型号:
Windows系统机器上有GPU资源,因此我们安装可以使用GPU资源的pytorch。
先卸载刚才安装的torch、torchvision:
pip uninstall torch
pip uninstall torchvision
登录pytorch官网https://pytorch.org/:
data:image/s3,"s3://crabby-images/2ca09/2ca097c5dc40f5b343ab76e2f4de20aa6d4276d5" alt=""
根据需要选择对应的CUDA版本、安装方式、系统等,生成安装命令:
data:image/s3,"s3://crabby-images/c398f/c398f5918de0bd47b9f0b77239f76afa66b3caaf" alt=""
安装结束后,查看GPU版本的pytorch是否可用:
data:image/s3,"s3://crabby-images/c1575/c1575601dd80ccb350a7b5cf24f5e1bcd3c30dda" alt=""
显示True,说明GPU版本的pytorch安装成功。剩余依赖库的安装不再赘述。
2.3下载权重
yolov7有不同的模型结构,因此提供了不同的预训练权重文件:
data:image/s3,"s3://crabby-images/06302/06302b4f461a869033b2d4ece4652cb91d477720" alt=""
本教程使用yolov7x_training.pt预训练权重,下载权重文件后放入新建的weights文件夹下:
data:image/s3,"s3://crabby-images/cec95/cec95600d9419d595a4a8919a463918fbbd599c7" alt=""
2.4测试环境
打开终端输入命令,测试配置环境是否可用:
python detect.py --weights weights/yolov7x_training.pt --source inference/images
如果看到以下运行结果,说明环境配置成功:
data:image/s3,"s3://crabby-images/5b476/5b4763f533d2c90c980b548d07c38002d4953cc1" alt=""
如果出现如下提示信息,说明缺少依赖库:
ModuleNotFoundError: No module named xxx
请根据提示信息,使用pip命令安装依赖库:
pip install xxx
测试图片的检测结果保存在runs/detect/exp/文件夹下:
data:image/s3,"s3://crabby-images/bf77a/bf77a773c948c110b96dca5e054d40062ee396c7" alt=""
准备数据集
3.1数据集介绍
本教程使用的是东北大学带钢表面缺陷检测数据集,该数据集收集了夹杂、划痕、压入氧化皮、裂纹、麻点、斑块6种缺陷,每种缺陷300张图片,图片的尺寸为200×200。
data:image/s3,"s3://crabby-images/1c0b3/1c0b3d94a87c72c94b283d6db8ae533bb4daf8be" alt=""
每张图片对应一个xml文件:
data:image/s3,"s3://crabby-images/dd6b2/dd6b2646414c0731d60c9264a9a37498a1f52c8d" alt=""
使用labelimg标注工具查看数据:
data:image/s3,"s3://crabby-images/f9e36/f9e36350b6b0b3d5c40b177db32b3b6fde43224a" alt=""
注:没有labelimg工具的朋友,可以打开本地的Anaconda Prompt窗口进行安装
安装命令为:
pip install labelimg
使用命令:
data:image/s3,"s3://crabby-images/85342/8534234b08860e45787d9f8aa6b3f7adf74bd456" alt=""
本数据集在之前的文章中介绍过,想获取数据集的朋友可以查看公众号之前发布的文章:【表面缺陷检测】表面缺陷检测数据集汇总。
将数据集放在项目目录下:
data:image/s3,"s3://crabby-images/1472c/1472c56d3a6b0da2c6351d9dbdfdce032a5c4659" alt=""
3.2数据集转换
编写一个prepare_train_val.py脚本,实现xml文件格式转为yolo文件格式,并实现数据集的划分:
data:image/s3,"s3://crabby-images/79732/79732e12960ab26ce4bd38b72db335172a89ecf1" alt=""
将数据集划分为训练集和验证集,总体结构如下:VOCdevkit --images --train --xxx_1.jpg --xxx_2.jpg --val --xxx_3.jpg --xxx_4.jpg --labels --train --xxx_1.txt --xxx_2.txt --val --xxx_3.txt --xxx_4.txt
prepare_train_val.py代码获取:https://blog.csdn.net/AugustMe/article/details/127320880
配置文件
在data文件夹下新建一个voc_neu.yaml文件(可以自定义命名):
data:image/s3,"s3://crabby-images/311d1/311d16df4225e988f34d1b4f13ac2ffc41f20d00" alt=""
写入内容如下:
# 注意路径,否则会报错
train: C:\Users\Z\Desktop\yolov7_neu\yolov7-main\VOCdevkit\images\train
val: C:\Users\Z\Desktop\yolov7_neu\yolov7-main\VOCdevkit\images\val
nc: 6
names: ['crazing', 'inclusion', 'patches', 'pitted_surface', 'rolled-in_scale', 'scratches']
由于yolov7提供了好几个模型:
data:image/s3,"s3://crabby-images/3cf88/3cf88ffe64d96673b5ef4d0552f49f685197954b" alt=""
我们每一次训练只能使用一个,因此需要在cfg/training/(和cfg/deploy/文件夹下的并不是一样的,后面慢慢介绍)文件夹下选一个模型:
data:image/s3,"s3://crabby-images/998f3/998f34a55994c61e64770c10df04823ec5742f2f" alt=""
我们选用yolov7x模型,将yolov7x.yaml的内容复制到新建的yolov7x_neu.yaml,并修改类别数量:
data:image/s3,"s3://crabby-images/d2e62/d2e62e088eabca50c0ec09393df6003ce8f1ce9e" alt=""
data:image/s3,"s3://crabby-images/dbe87/dbe87c5cc96e3884b89c2432be263471c9c0605e" alt=""
训练
切换到项目所在目录,执行命令:
# 指定预训练权重、模型结构、图片路径、训练轮数、批次大小、图片大小
python train.py --weights weights/yolov7x_training.pt --cfg cfg/training/yolov7x_neu.yaml --data data/voc_neu.yaml --epochs 100 --batch-size 8 --img-size 640 --project runs/train
不出所料,报错了:
data:image/s3,"s3://crabby-images/5663c/5663c98ff010f327311536ed9f3b88972f4df5a9" alt=""
解决方法,执行命令时workers设为0(Windows系统下,num_workers设为0可以直接解决报错问题,如果不设为0,需要修改内部代码):
# 指定预训练权重、模型结构、图片路径、训练轮数、批次大小、图片大小
python train.py --weights weights/yolov7x_training.pt --cfg cfg/training/yolov7x_neu.yaml --data data/voc_neu.yaml --epochs 100 --batch-size 8 --img-size 640 --workers 0 --project runs/train
上面的问题解决了,新的问题出现了:
data:image/s3,"s3://crabby-images/7b6cf/7b6cf91e2b8aa2fd6cd42e9c5e51e9ace011e27d" alt=""
batch-size、img-size的大小不宜过大,否则出现内存溢出的错误;将batch-size设为4,img-size设为320,执行下面的训练命令:
# 指定预训练权重、模型结构、图片路径、训练轮数、批次大小、图片大小
python train.py --weights weights/yolov7x_training.pt --cfg cfg/training/yolov7x_neu.yaml --data data/voc_neu.yaml --epochs 100 --batch-size 4 --img-size 320 --workers 0 --project runs/train
开始训练:
data:image/s3,"s3://crabby-images/edfab/edfaba2fd3f675855c2c848693280d21c80f3d15" alt=""
查看GPU使用情况:
data:image/s3,"s3://crabby-images/6266b/6266b76bb6b1961740e77e12d26c39796f13a621" alt=""
Windosw系统上只有一块NVIDIA GeForce RTX 2060显卡,显存为6GB,因此batch-size、img-size不能设太大,否则会出现上面提到的内存溢出问题。如果有两张Tesla V100或Tesla P100,可以将batch-size设为64,img-size设为640。
训练结束后,验证集上各个缺陷指标数据:
data:image/s3,"s3://crabby-images/d29d6/d29d634f15c95e345e004f51ce5bf5bab3eca926" alt=""
验证集上PR曲线:
data:image/s3,"s3://crabby-images/f125c/f125c2ae26552c28898d0d31bb47692a9e9405e8" alt=""
训练好的模型保存在runs/train/exp/weights/目录下:
data:image/s3,"s3://crabby-images/b0737/b07377cdc54a18f3447317d154f6abf468a2d920" alt=""
测试
将待测试的图片放入testpics文件夹:
data:image/s3,"s3://crabby-images/a096b/a096b3fc56d08d61d792296688e6f19abf00f01c" alt=""
执行测试命令:
# 指定训练好的模型、测试图片路径、图片大小
# 检测多张
python detect.py --weights runs/train/exp/weights/best.pt --source testpics --img-size 320 --project runs/detect
# 检测单张
python detect.py --weights runs/train/exp/weights/best.pt --source testpics/patches_166.jpg --img-size 320 --project runs/detect
data:image/s3,"s3://crabby-images/0f52c/0f52c27ce197a8e1a418d21a9b69fa72127c9575" alt=""
在runs/detect/文件夹下查看检测结果:
data:image/s3,"s3://crabby-images/e420a/e420a45a5a1de5029c42b9f272d58254888f9224" alt=""
结论
在Windows系统下,我们使用一张NVIDIA GeForce RTX 2060显卡,训练基于yolov7钢板表面缺陷检测模型,花费了近2个小时,验证集上六个缺陷类别的mAP@0.5为0.765,总体上可以实现缺陷的检测。其实,这个数据集的质量也不是很高,才导致各项指标不是特别高。永远记住:数据决定上限,模型决定下限。
看到这里了,用你那发财的小手,给我点一个赞再走呗。
参考资料
[1]https://github.com/WongKinYiu/yolov7[2]https://zhuanlan.zhihu.com/p/547878330