YOLO v2 是 YOLO(You Only Look Once)目标检测算法的改进版本,在保持速度优势的同时提升了检测精度。

1. 与 v1 的对比

image.png

YOLO v2 相比 v1 在多个方面进行了优化,包括使用批归一化、高分辨率分类器、引入锚框机制等改进。

2. 高分辨率分类器(Hi-res Classifier)

image.png

YOLO v2 使用 448×448 分辨率对分类网络进行微调,使网络能够适应更高分辨率的输入,从而提升检测精度。

3. 卷积层 + 锚框(Convolutional + Anchor Boxes)

image.png

image.png

image.png

YOLO v2 移除了全连接层,使用anchor box来预测边界框。这种方法提高了模型的召回率和定位精度。

3.1 DarkNet 网络架构

image.png

分类模型:没有全连接层,最终通过全局平均池化层输出 1×1000 的特征向量。

image.png

使用 5 个anchor boxes 进行预测。

检测模型:通过减少全连接层来降低计算量,加快检测速度。

4. 维度先验(Dimension Priors)

image.png

image.png

通过 K-means 聚类算法在训练数据集上自动找到最优的锚框尺寸,而不是手动设定。

4.1 YOLO v2 聚类方法

image.png

image.png