YOLO-Drive:细粒度分心行为检测的YOLO新架构

前言

驾驶员分心检测是DMS的核心功能。传统方法将分心行为粗分为几类(如”使用手机”、”吃东西”),但实际场景中,驾驶员可能同时进行多种行为,且行为之间存在细微差异。

2026年发表于《Computers, Materials & Continua》的YOLO-Drive论文,提出了一种支持细粒度和重叠行为识别的鲁棒分心检测方法。

一、问题定义

1.1 细粒度分心行为

传统分心检测:

1
分类:使用手机 / 吃东西 / 调整收音机 / 其他

细粒度分心检测:

1
2
3
4
5
6
7
8
9
10
11
12
使用手机
├── 左手持手机打电话
├── 右手持手机打电话
├── 双手持手机打字
├── 左手持手机浏览
└── 右手持手机浏览

吃东西
├── 单手喝水
├── 单手吃东西
├── 双手吃东西
└── 喝饮料(瓶装/杯装)

1.2 重叠行为

现实场景中,驾驶员可能同时进行多种行为:

组合 示例
手机+吃东西 一只手拿手机,一只手吃东西
手机+调整 用手机导航同时调整空调
多任务 开车时看手机、吃东西、调整设备

传统单标签分类无法处理这种情况。

二、YOLO-Drive架构

2.1 基于YOLO的设计

YOLO-Drive基于YOLO架构进行改进,利用其实时性能优势:

1
2
3
4
5
6
7
8
9
输入图像

Backbone(特征提取)

Neck(多尺度特征融合)

Head(检测+分类)

输出:行为标签 + 边界框

2.2 关键创新

创新 描述
多标签分类头 支持重叠行为检测
细粒度类别设计 细化分心行为类别
注意力机制增强 提升小目标检测能力
时序一致性约束 减少帧间抖动

2.3 与YOLOv11对比

特性 YOLOv11 YOLO-Drive
任务 通用目标检测 分心行为检测
分类头 单标签 多标签
类别设计 通用80类 细粒度分心行为
时序处理 单帧 时序一致性

三、实验结果

3.1 数据集

论文使用了多个分心驾驶数据集:

数据集 描述
State Farm Distracted Driver 10类分心行为
AUC Distracted Driver 多视角分心行为
自建数据集 细粒度+重叠行为标注

3.2 性能对比

方法 mAP FPS
YOLOv8n 82.3% 142
YOLOv10m 85.7% 98
YOLOv11 87.2% 112
YOLO-Drive 91.5% 105

3.3 重叠行为检测

行为组合 准确率
单一行为 94.2%
两行为重叠 89.7%
三行为重叠 82.3%

四、对IMS开发的启示

4.1 算法选择

场景 推荐方案
基础分心检测 YOLOv11(成熟稳定)
细粒度分心检测 YOLO-Drive架构
实时部署(边缘) YOLOv8n/YOLOv11n + 知识蒸馏

4.2 类别设计

建议采用分层类别设计:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
Level 1: 大类
├── 手机使用
├── 饮食行为
├── 设备调整
├── 外部交互
└── 其他

Level 2: 细分
├── 手机使用
│ ├── 左手打电话
│ ├── 右手打电话
│ ├── 双手打字
│ └── ...

Level 3: 重叠组合
├── 手机+饮食
├── 手机+设备
└── ...

4.3 部署优化

优化方向 方法
模型压缩 量化、剪枝、知识蒸馏
推理加速 TensorRT、ONNX Runtime
多任务学习 分心检测+疲劳检测联合训练

五、相关研究

5.1 YOLOv11疲劳检测

同期研究”Real-Time Drowsiness Detection Using YOLOv11 in Driver Monitoring Systems”:

  • 使用YOLOv11进行疲劳检测
  • 检测眼睑闭合、打哈欠
  • 极端照明和人脸遮挡影响性能

5.2 RT-DETR-DA

“RT-DETR-DA for Complex Scenes: Distracted Driving Detection”:

  • 基于DETR的实时检测
  • 动态感知增强
  • 复杂场景优化

六、技术趋势

6.1 从单标签到多标签

发展阶段 特点
阶段1 单标签分类(10类)
阶段2 细粒度分类(30+类)
阶段3 多标签检测(重叠行为)
阶段4 时序行为理解

6.2 边缘部署需求

平台 算力 适用模型
高通8255 30 TOPS YOLO-Drive完整版
高通8295 30 TOPS YOLO-Drive + 多任务
TI TDA4 8 TOPS YOLOv8n/YOLOv11n
EyeQ6L 5 TOPS 轻量化版本

总结

YOLO-Drive为细粒度分心行为检测提供了新思路:

  1. 多标签分类:支持重叠行为检测
  2. 细粒度类别:精细识别分心行为
  3. 实时性能:保持YOLO系列高效优势
  4. 时序一致性:减少帧间抖动

开发启示:在IMS中引入细粒度分心检测,支持多标签输出,提升复杂场景下的检测准确率。


参考资料


YOLO-Drive:细粒度分心行为检测的YOLO新架构
https://dapalm.com/2026/04/06/2026-04-06-YOLO-Drive-Fine-Grained-Distraction-Detection/
作者
Mars
发布于
2026年4月6日
许可协议