YOLOv4的cfg参数及训练_yolov4参数设置-程序员宅基地

cfg参数

Parameters in the [net] section
Parameters in the different layers
net层

[net]
batch=96 # 每次iteration训练的时候，输入的图片数量
subdivisions=48	# 将每一次的batch数量，分成subdivision对应数字的份数，一份一份的跑完后，在一起打包算作完成一次iteration
width=512 # 大小为32的倍数
momentum=0.9 # 动量，影响梯度下降到最优的速度，一般默认0.9
decay=0.0005 # 权重衰减正则系数，防止过拟合
angle=0 # 旋转角度，生成更多训练样本
saturation=1.5 # 调整饱和度
exposure=1.5 # 调整曝光度
hue=.1 # 调整色调
learning_rate=0.001
burn_in=1000 # 学习率控制的参数，在迭代次数大于burn_in时，采用policy的更新方式：0.001 * pow(iterations/1000, 4)
max_batches=500200 # 最大迭代次数
policy=steps
steps=400000,450000 # 学习率变动步长，Steps和scales相互对应, 这两个参数设置学习率的变化, 根据batch_num调整学习率
scales=.1,.1 # 学习率变动因子，迭代到400000次时，学习率x0.1; 450000次迭代时，学习率又会在前一个学习率的基础上x0.1

shortcut层

[shortcut] # shortcut部分是卷积的跨层连接，就像Resnet中使用的一样
from=-2 # 参数from是−2，意思是shortcut的输出是通过与先前的倒数第二层网络相加而得到, 跨越连接
activation=linear
idx=6

route层

[route]
layers=-1, -3 # 在当前层引出之前卷积所得到的特征层，这里的-1，-3代表
			  # 将前一层输出的feature和前第3层输出的feature concat
			  # 以后再作为当前层的输出，也就是作为下一个卷积的输入。所
			  # 以route输出的通道数要和下一个conv输入的通道一致

yolo层前的conv层

[convolutional]
batch_normalize=0 # BN，是否做BN操作
pad=1 # 如果pad为0,padding由padding参数指定
      # 如果pad为1，padding大小为size/2，padding应该是对输入图像左边缘拓展的像素数量
filters=42  # =num(yolo层个数)*(classes+5)，5是5个坐标，<x_center> <y_center> <width> <height><object-class>

yolo层

[yolo]
mask=6,7,8 # anchors的索引值，如果mask的值是0,1,2，这意味着使用第一，第二和第三个anchor
anchors = 7, 10, 14, 24, 27, 43, 32, 97, 57, 64, 92, 109, 73, 175, 141, 178, 144, 291
classes=9 # 类别数目
focal_loss=1 # 使用focal loss
num=9 # 每个grid cell预测几个box,和anchors的数量一致
jitter=.3 # 通过抖动来防止过拟合
ignore_thresh=.7 # 当预测的检测框与ground true的IOU大于ignore_thresh的时候，参与loss的计算，否则，检测框的不参与损失计算
truth_thresh=1
random=1 # 多尺度训练：如果显存小，设置random=0，关闭多尺度训练。
         # random设置成1，可以增加检测精度precision，每次迭代图片大小随机从原尺寸的/1.4到*1.4，步长为32，如果为0，每次训练大小与输入大小一致
         # 当打开随机多尺度训练时，前面设置的网络输入尺寸width和height其实就不起作用了，尺寸会从原尺寸的0.77到1.46之间随机取值
         # 每10轮随机改变一次，一般建议可以根据自己需要修改随机尺度训练的范围，这样可以增大batch，可以自行尝试！

训练自己的数据集

创建obj.names文件，将自己的类别按行输入
创建obj.data文件，替换自己的训练集路径，测试集路径

classes= 2
train  = data/train.txt
valid  = data/test.txt
names = data/obj.names
backup = backup/

将imgs和annos在同一个文件夹下，且名字相同，后缀不同（.jpg，.txt）
修改anchor，使用yolov4自带的K-Means聚类算法，得到9个anchor

./darknet detector calc_anchors data/obj.data -num_of_clusters 9 -width 416 -height 416

训练命令

./darknet detector train data/obj.data data/v4.cfg -gpus 0,1,2,3,4,5,6,7 -dont_show -mjpeg_port 8092 -map

查看模型的训练曲线

ssh -L 127.0.0.1:8093:127.0.0.1:8093 user@IP -p (端口号)

评估模型

---mAP50
./darknet detector map cfg/v4/carp9cls.data cfg/v4/new_sppv2car.cfg cfg/new_sppv2car_best.weights

---mAP75
./darknet detector map cfg/v4/carp9cls.data cfg/v4/new_sppv2car.cfg cfg/new_sppv2car_best.weights -iou_thresh 0.75

检测图片并输出

./darknet detector test cfg/v4/carp9cls.data cfg/v4/new_sppv2car.cfg cfg/new_sppv2car_best.weights -ext_output -dont_show < data/test.txt > result.txt -gpus 0,1,2,3

检测视频并输出

./darknet detector demo cfg/v4/carp9cls.data cfg/v4/new_sppv2car.cfg cfg/new_sppv2car_best.weights test.avi -out_filename res.avi

查看模型结构：

使用Netron，将cfg文件加载后，即可看到网络的结构。

参考博客：
yolo—参数解释之cfg文件参数
 YOLOV4在linux下训练自己数据集
 如何部署yolov4

本文链接：https://blog.csdn.net/weixin_44347020/article/details/107691522

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

linux devkmem 源码,linux dev/mem dev/kmem实现访问物理/虚拟内存-程序员宅基地

文章浏览阅读451次。dev/mem: 物理内存的全镜像。可以用来访问物理内存。/dev/kmem: kernel看到的虚拟内存的全镜像。可以用来访问kernel的内容。调试嵌入式Linux内核时，可能需要查看某个内核变量的值。/dev/kmem正好提供了访问内核虚拟内存的途径。现在的内核大都默认禁用了/dev/kmem，打开的方法是在 make menuconfig中选中 device drivers --> ..._dev/mem 源码实现

vxe-table 小众但功能齐全的vue表格组件-程序员宅基地

文章浏览阅读7.1k次，点赞2次，收藏19次。vxe-table，一个小众但功能齐全并支持excel操作的vue表格组件_vxe-table

（开发）bable - es6转码-程序员宅基地

文章浏览阅读62次。参考：http://www.ruanyifeng.com/blog/2016/01/babel.htmlBabelBabel是一个广泛使用的转码器，可以将ES6代码转为ES5代码，从而在现有环境执行// 转码前input.map(item => item + 1);// 转码后input.map(function (item) { return item..._让开发环境支持bable

FPGA 视频处理 FIFO 的典型应用_fpga 频分复用视频-程序员宅基地

文章浏览阅读2.8k次，点赞6次，收藏29次。摘要：FPGA视频处理FIFO的典型应用，视频输入FIFO的作用，视频输出FIFO的作用，视频数据跨时钟域FIFO，视频缩放FIFO的作用_fpga 频分复用视频

R语言：设置工作路径为当前文件存储路径_r语言设置工作目录到目标文件夹-程序员宅基地

文章浏览阅读575次。【代码】R语言：设置工作路径为当前文件存储路径。_r语言设置工作目录到目标文件夹

background 线性渐变-程序员宅基地

文章浏览阅读452次。格式：background: linear-gradient(direction, color-stop1, color-stop2, ...);<linear-gradient> = linear-gradient([ [ <angle> | to <side-or-corner>] ,]? &l..._background线性渐变

随便推点

【蓝桥杯省赛真题39】python输出最大的数中小学青少年组蓝桥杯比赛算法思维python编程省赛真题解析-程序员宅基地

文章浏览阅读1k次，点赞26次，收藏8次。第十三届蓝桥杯青少年组python编程省赛真题一、题目要求（注：input（）输入函数的括号中不允许添加任何信息）1、编程实现给定一个正整数N，输出正整数N中各数位最大的那个数字。例如:N=132，则输出3。2、输入输出输入描述：只有一行，输入一个正整数N输出描述：只有一行，输出正整数N中各数位最大的那个数字输入样例：

网络协议的三要素-程序员宅基地

文章浏览阅读2.2k次。一个网络协议主要由以下三个要素组成：1.语法数据与控制信息的结构或格式，包括数据的组织方式、编码方式、信号电平的表示方式等。2.语义即需要发出何种控制信息，完成何种动作，以及做出何种应答，以实现数据交换的协调和差错处理。3.时序即事件实现顺序的详细说明，以实现速率匹配和排序。不完整理解：语法表示长什么样，语义表示能干什么，时序表示排序。转载于:https://blog.51cto.com/98..._网络协议三要素csdn

The Log: What every software engineer should know about real-time data's unifying abstraction-程序员宅基地

文章浏览阅读153次。主要的思想，将所有的系统都可以看作两部分，真正的数据log系统和各种各样的query engine所有的一致性由log系统来保证，其他各种query engine不需要考虑一致性，安全性，只需要不停的从log系统来同步数据，如果数据丢失或crash可以从log系统replay来恢复可以看出kafka系统在linkedin中的重要地位，不光是d..._the log: what every software engineer should know about real-time data's uni