1.Structure

f062ec9e841e910ea510e743786c4b40.jpg

2.Mosaic增强

3. Anchor box

4.自适应图片缩放

5. SiLu active function

image.png

1.平滑性:SiLU有平滑的曲线特性,不同于ReLu 2.非线性特征:不会忽略负值输入,更好捕捉输入的细微变化

image.png

6. Focus 模块

image.png

类似Yolo v2 passthrough 减少层数,参数量,计算量,cuda内存 提升速度

7. SPTF 模块

image.png

快速池化:高效的池化减少计算量

多尺度特征融合:通过池化生成多个特征图,拼接后保留更多上下文信息

8.Anchor box 预测

image.png

预测框更平滑,避免anchor接近网格单元边界时出现大幅度跳动 通过扩大预测范围,更稳定的输出边界框,中心点定位更准确

9.正负样本匹配

image.png

10.Loss fuction

image.png

image.png