DCDD 模型:基于眼动行为的驾驶员认知分心检测

前言

认知分心(Cognitive Distraction)是 DMS 检测的难点。与视觉分心(看手机)和手动分心(操作按钮)不同,认知分心是”心不在焉”,驾驶员眼睛可能看着道路,但注意力已经转移。

Springer 2025 发表的研究提出了 DCDD(Driver Cognitive Distraction Detection)模型,通过眼动行为分析检测认知分心。


一、认知分心的挑战

1.1 分心类型对比

类型 定义 可检测性
视觉分心 眼睛离开道路 ⭐⭐⭐⭐⭐ 容易检测
手动分心 手离开方向盘 ⭐⭐⭐⭐ 较容易检测
认知分心 思想离开驾驶任务 ⭐⭐ 困难

1.2 认知分心的表现

行为指标 认知分心表现
视觉扫描 更刚性的扫描模式
后视镜检查 次数减少
视线偏移 更长时间的固定注视
反应时间 延长

1.3 传统方法的局限

方法 局限性
PERCLOS 对认知分心不敏感
视线追踪 眼睛看着路 ≠ 注意力在路上
驾驶行为 反应滞后,非实时
EEG 需要可穿戴设备,不实用

二、DCDD 模型架构

2.1 核心思想

1
眼动数据 → 空间特征 + 时间特征 → 多视角融合 → 认知分心分类

2.2 模型流程

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
┌────────────────────────────────────────────────────┐
│ 输入层 │
- 眼动注视点(Gaze Points) │
- 驾驶场景信息(DCI) │
└──────────────────────┬─────────────────────────────┘

┌────────────────────────────────────────────────────┐
│ 空间特征提取 │
- CNN 提取空间模式 │
- 注意力机制聚焦关键区域 │
└──────────────────────┬─────────────────────────────┘

┌────────────────────────────────────────────────────┐
│ 时间特征提取 │
- Transformer 编码器 │
- LSTM/GRU 捕捉时序依赖 │
└──────────────────────┬─────────────────────────────┘

┌────────────────────────────────────────────────────┐
│ 多视角空间-通道特征融合 │
- 空间维度融合 │
- 通道维度融合 │
└──────────────────────┬─────────────────────────────┘

┌────────────────────────────────────────────────────┐
│ 分类输出 │
- 正常 / 认知分心 │
- 分心程度等级 │
└────────────────────────────────────────────────────┘

2.3 关键技术

1. 空间特征提取

使用 CNN 提取眼动模式的空间特征:

  • 注视点分布图
  • 扫视轨迹模式
  • 注视区域热度图

2. 时间特征提取

使用 Transformer / LSTM 捕捉时序依赖:

  • 眼动行为的时间演化
  • 注视持续时间的动态变化
  • 扫视频率的周期性

3. 多视角融合

空间-通道特征融合:

$$F_{fused} = \alpha F_{spatial} + \beta F_{channel}$$


三、眼动特征设计

3.1 驾驶认知指标(DCI)

指标 定义 认知分心变化
注视离散度 注视点分布的标准差 ↓ 减小
扫描范围 视线覆盖的区域面积 ↓ 减小
注视持续时间 单次注视的平均时长 ↑ 增加
扫视频率 单位时间内扫视次数 ↓ 减小
后视镜检查率 检查后视镜的频率 ↓ 显著减小

3.2 注视点特征

特征 说明
位置特征 (x, y) 坐标
时间特征 注视开始/结束时间
持续时间 单次注视时长
扫视幅度 相邻注视点间距离

四、实验设置

4.1 数据采集

条件 设置
环境 驾驶模拟器
眼动追踪 高精度眼动仪
场景 高速公路 + 城市道路
分心任务 认知负载任务(n-back)

4.2 对照条件

条件 说明
正常驾驶 无分心任务
低认知负载 简单认知任务
高认知负载 复杂认知任务

五、结果与讨论

5.1 认知分心表现

研究发现认知分心时:

  1. 视觉扫描变窄

    • 注视点集中在较小区域
    • 扫视幅度减小
  2. 注视持续时间增加

    • 单次注视时间延长
    • 反映注意力下降
  3. 后视镜检查减少

    • 周边注意力下降
    • 情境意识受损

5.2 与传统方法对比

方法 视觉分心 认知分心
PERCLOS ⭐⭐⭐⭐
视线追踪(简单) ⭐⭐⭐⭐⭐ ⭐⭐
DCDD 模型 ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐

六、对 IMS 开发的启示

6.1 技术路线

阶段 功能 技术方案
P0 视觉分心检测 视线追踪 + 视线落点
P1 疲劳检测 PERCLOS + 眼睑检测
P2 认知分心检测 眼动行为模式 + DCI 指标

6.2 算法实现

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
# 认知分心检测伪代码
def detect_cognitive_distraction(gaze_data, duration_window=30):
# 计算注视离散度
fixation_dispersion = calculate_dispersion(gaze_data)

# 计算扫描范围
scan_range = calculate_scan_range(gaze_data)

# 计算后视镜检查率
mirror_check_rate = calculate_mirror_checks(gaze_data)

# 综合评分
dci_score = (
w1 * (1 - normalize(fixation_dispersion)) +
w2 * (1 - normalize(scan_range)) +
w3 * (1 - normalize(mirror_check_rate))
)

return dci_score > threshold

6.3 实时性考虑

指标 要求
时间窗口 30-60 秒滑动窗口
更新频率 1 Hz
延迟 < 5 秒

6.4 局限性

局限性 说明
个体差异 不同驾驶员眼动习惯不同
场景依赖 复杂场景本身需要更多注意力
数据需求 需要大量标注数据训练
实时性 需要一定时间窗口累积

七、未来方向

7.1 多模态融合

模态 信息 优势
眼动追踪 视觉注意力 直接反映注意力
驾驶行为 方向盘/踏板 非侵入式
车辆状态 车道保持 客观指标
EEG(可选) 脑电信号 直接测量认知负载

7.2 Transformer 应用

  • 使用 Vision Transformer 提取眼动模式
  • 时序 Transformer 捕捉动态变化
  • 注意力机制融合多源信息

总结

DCDD 模型是认知分心检测的重要进展:

  1. 核心创新:眼动行为 + 时空信息融合
  2. 关键指标:注视离散度、扫描范围、后视镜检查率
  3. 技术路线:CNN + Transformer/LSTM
  4. 实用价值:无需 EEG,仅用眼动追踪

对于 IMS 开发,认知分心检测是 长期研究目标,应在视觉分心和疲劳检测基础上逐步实现。


参考来源:

发布日期: 2026-04-09


DCDD 模型:基于眼动行为的驾驶员认知分心检测
https://dapalm.com/2026/04/09/2026-04-09-DCDD-Cognitive-Distraction-Detection/
作者
Mars
发布于
2026年4月9日
许可协议