YOLO-Drive:细粒度分心行为检测的YOLO新架构
前言
驾驶员分心检测是DMS的核心功能。传统方法将分心行为粗分为几类(如”使用手机”、”吃东西”),但实际场景中,驾驶员可能同时进行多种行为,且行为之间存在细微差异。
2026年发表于《Computers, Materials & Continua》的YOLO-Drive论文,提出了一种支持细粒度和重叠行为识别的鲁棒分心检测方法。
一、问题定义
1.1 细粒度分心行为
传统分心检测:
1 | |
细粒度分心检测:
1 | |
1.2 重叠行为
现实场景中,驾驶员可能同时进行多种行为:
| 组合 | 示例 |
|---|---|
| 手机+吃东西 | 一只手拿手机,一只手吃东西 |
| 手机+调整 | 用手机导航同时调整空调 |
| 多任务 | 开车时看手机、吃东西、调整设备 |
传统单标签分类无法处理这种情况。
二、YOLO-Drive架构
2.1 基于YOLO的设计
YOLO-Drive基于YOLO架构进行改进,利用其实时性能优势:
1 | |
2.2 关键创新
| 创新 | 描述 |
|---|---|
| 多标签分类头 | 支持重叠行为检测 |
| 细粒度类别设计 | 细化分心行为类别 |
| 注意力机制增强 | 提升小目标检测能力 |
| 时序一致性约束 | 减少帧间抖动 |
2.3 与YOLOv11对比
| 特性 | YOLOv11 | YOLO-Drive |
|---|---|---|
| 任务 | 通用目标检测 | 分心行为检测 |
| 分类头 | 单标签 | 多标签 |
| 类别设计 | 通用80类 | 细粒度分心行为 |
| 时序处理 | 单帧 | 时序一致性 |
三、实验结果
3.1 数据集
论文使用了多个分心驾驶数据集:
| 数据集 | 描述 |
|---|---|
| State Farm Distracted Driver | 10类分心行为 |
| AUC Distracted Driver | 多视角分心行为 |
| 自建数据集 | 细粒度+重叠行为标注 |
3.2 性能对比
| 方法 | mAP | FPS |
|---|---|---|
| YOLOv8n | 82.3% | 142 |
| YOLOv10m | 85.7% | 98 |
| YOLOv11 | 87.2% | 112 |
| YOLO-Drive | 91.5% | 105 |
3.3 重叠行为检测
| 行为组合 | 准确率 |
|---|---|
| 单一行为 | 94.2% |
| 两行为重叠 | 89.7% |
| 三行为重叠 | 82.3% |
四、对IMS开发的启示
4.1 算法选择
| 场景 | 推荐方案 |
|---|---|
| 基础分心检测 | YOLOv11(成熟稳定) |
| 细粒度分心检测 | YOLO-Drive架构 |
| 实时部署(边缘) | YOLOv8n/YOLOv11n + 知识蒸馏 |
4.2 类别设计
建议采用分层类别设计:
1 | |
4.3 部署优化
| 优化方向 | 方法 |
|---|---|
| 模型压缩 | 量化、剪枝、知识蒸馏 |
| 推理加速 | TensorRT、ONNX Runtime |
| 多任务学习 | 分心检测+疲劳检测联合训练 |
五、相关研究
5.1 YOLOv11疲劳检测
同期研究”Real-Time Drowsiness Detection Using YOLOv11 in Driver Monitoring Systems”:
- 使用YOLOv11进行疲劳检测
- 检测眼睑闭合、打哈欠
- 极端照明和人脸遮挡影响性能
5.2 RT-DETR-DA
“RT-DETR-DA for Complex Scenes: Distracted Driving Detection”:
- 基于DETR的实时检测
- 动态感知增强
- 复杂场景优化
六、技术趋势
6.1 从单标签到多标签
| 发展阶段 | 特点 |
|---|---|
| 阶段1 | 单标签分类(10类) |
| 阶段2 | 细粒度分类(30+类) |
| 阶段3 | 多标签检测(重叠行为) |
| 阶段4 | 时序行为理解 |
6.2 边缘部署需求
| 平台 | 算力 | 适用模型 |
|---|---|---|
| 高通8255 | 30 TOPS | YOLO-Drive完整版 |
| 高通8295 | 30 TOPS | YOLO-Drive + 多任务 |
| TI TDA4 | 8 TOPS | YOLOv8n/YOLOv11n |
| EyeQ6L | 5 TOPS | 轻量化版本 |
总结
YOLO-Drive为细粒度分心行为检测提供了新思路:
- 多标签分类:支持重叠行为检测
- 细粒度类别:精细识别分心行为
- 实时性能:保持YOLO系列高效优势
- 时序一致性:减少帧间抖动
开发启示:在IMS中引入细粒度分心检测,支持多标签输出,提升复杂场景下的检测准确率。
参考资料:
YOLO-Drive:细粒度分心行为检测的YOLO新架构
https://dapalm.com/2026/04/06/2026-04-06-YOLO-Drive-Fine-Grained-Distraction-Detection/