引言

小目标检测（通常指像素面积小于32×32的对象）是计算机视觉领域的核心挑战之一，在无人机巡检、医学影像分析、交通监控等场景中具有重要应用价值。YOLOv5作为经典的单阶段检测器，其默认配置在小目标场景下存在特征丢失、锚框不匹配等问题。本文将从数据、模型、训练、部署四个维度，系统阐述提升YOLOv5小目标检测精度的技术方案。

一、数据层优化：构建高质量小目标数据集

1.1 数据增强策略

小目标检测对数据多样性要求极高，需通过增强提升模型泛化能力：

Mosaic-9增强：在标准Mosaic（4图拼接）基础上扩展为9图拼接，增加小目标在图像中的分布密度。示例代码：

from albumentations import Compose, Mosaic9
aug = Compose([
  Mosaic9(p=1.0, min_aspect_ratio=0.5, max_aspect_ratio=2.0),
  RandomRotate90(p=0.5)
])

Copy-Paste增强：将小目标实例从一张图像复制到另一张图像的合适位置，需注意光照一致性。实验表明该技术可使mAP@0.5提升3-5%。

1.2 标注质量优化

多尺度标注验证：使用LabelImg等工具对同一目标在不同尺度下进行标注，确保32×32以下目标的边界框精度。
困难样本挖掘：通过IOU阈值（如0.3）筛选低质量标注样本，进行二次人工校验。

二、模型结构优化：增强小目标特征提取能力

2.1 特征金字塔改进

YOLOv5默认的FPN结构对小目标特征传递存在衰减，建议：

BiFPN融合：引入加权双向特征金字塔，为不同尺度特征分配可学习权重。实现示例：

# 在models/yolo.py中修改C3模块
class BiFPN(nn.Module):
  def __init__(self, channels):
      super().__init__()
      self.conv1 = Conv(channels, channels, 3)
      self.weight = nn.Parameter(torch.ones(2))  # 可学习权重
  def forward(self, x):
      # 上采样路径与下采样路径的加权融合
      return self.weight[0] * upsample(x[0]) + self.weight[1] * downsample(x[1])

浅层特征复用：在backbone的C1层后增加检测头，专门处理16×16以下的小目标。

2.2 锚框优化策略

K-means++聚类：对训练集中的小目标边界框进行重新聚类，生成更适配的锚框尺寸。示例命令：
```
python utils/autoanchor.py --data data/custom.yaml --img-size 640 --weights yolov5s.pt
```
动态锚框分配：修改models/yolo.py中的assign_one_stage函数，增加小目标优先分配逻辑。

三、训练策略优化：提升模型收敛质量

3.1 损失函数改进

Focal Loss升级：对小目标类别增加γ=2.5的调节因子，缓解类别不平衡问题。修改utils/loss.py：

def focal_loss(pred, target, gamma=2.5):
  pt = torch.exp(-pred)
  loss = (1 - pt) ** gamma * pred
  return loss.mean()

CIoU损失应用：替换标准IoU损失为CIoU，考虑重叠面积、中心点距离和长宽比一致性。

3.2 学习率调度

余弦退火+热重启：采用torch.optim.lr_scheduler.CosineAnnealingWarmRestarts，初始学习率0.01，重启周期10epoch。
```
scheduler = CosineAnnealingWarmRestarts(optimizer, T_0=10, T_mult=1)
```

四、部署优化：提升实际检测效果

4.1 模型轻量化

通道剪枝：使用torch.nn.utils.prune对C3模块的中间层进行L1范数剪枝，压缩率可达40%。
```
prune.ln_structured(model.model[-1].cv2, name='weight', amount=0.4, n=1)
```
TensorRT加速：将PT模型转换为TensorRT引擎，在NVIDIA Jetson系列设备上实现3倍加速。

4.2 后处理优化

多尺度NMS：对不同检测头的输出结果分别进行NMS，小目标检测头使用更低的IOU阈值（如0.3）。
TTA测试增强：在推理阶段应用多尺度测试（0.5x, 1.0x, 1.5x缩放），通过WBF（Weighted Boxes Fusion）融合结果。

五、工程实践建议

渐进式优化：先验证数据增强效果，再调整模型结构，最后优化训练策略。
可视化监控：使用wandb或tensorboard记录小目标类别的AP变化。
硬件适配：在边缘设备上部署时，优先选择yolov5s-tiny.pt作为基础模型。

结论

通过数据增强、模型结构改进、训练策略优化和部署加速的联合优化，YOLOv5在小目标检测场景下的mAP@0.5可提升12-18个百分点。实际工程中需根据具体场景（如无人机高度、医学影像分辨率）调整参数，建议采用AB测试方法验证各优化模块的有效性。未来工作可探索Transformer架构与YOLOv5的融合，进一步提升小目标特征表达能力。

YOLOv5小目标检测优化策略：从模型到部署的全链路提升

引言