DCDD 模型：基于眼动行为的驾驶员认知分心检测

前言

认知分心（Cognitive Distraction）是 DMS 检测的难点。与视觉分心（看手机）和手动分心（操作按钮）不同，认知分心是”心不在焉”，驾驶员眼睛可能看着道路，但注意力已经转移。

Springer 2025 发表的研究提出了 DCDD（Driver Cognitive Distraction Detection）模型，通过眼动行为分析检测认知分心。

一、认知分心的挑战

1.1 分心类型对比

类型	定义	可检测性
视觉分心	眼睛离开道路	⭐⭐⭐⭐⭐ 容易检测
手动分心	手离开方向盘	⭐⭐⭐⭐ 较容易检测
认知分心	思想离开驾驶任务	⭐⭐ 困难

1.2 认知分心的表现

行为指标	认知分心表现
视觉扫描	更刚性的扫描模式
后视镜检查	次数减少
视线偏移	更长时间的固定注视
反应时间	延长

1.3 传统方法的局限

方法	局限性
PERCLOS	对认知分心不敏感
视线追踪	眼睛看着路 ≠ 注意力在路上
驾驶行为	反应滞后，非实时
EEG	需要可穿戴设备，不实用

二、DCDD 模型架构

2.1 核心思想

1	`眼动数据 → 空间特征 + 时间特征 → 多视角融合 → 认知分心分类`

2.2 模型流程

┌────────────────────────────────────────────────────┐
│                   输入层                            │
│  - 眼动注视点（Gaze Points）                        │
│  - 驾驶场景信息（DCI）                              │
└──────────────────────┬─────────────────────────────┘
                       ↓
┌────────────────────────────────────────────────────┐
│              空间特征提取                           │
│  - CNN 提取空间模式                                 │
│  - 注意力机制聚焦关键区域                           │
└──────────────────────┬─────────────────────────────┘
                       ↓
┌────────────────────────────────────────────────────┐
│              时间特征提取                           │
│  - Transformer 编码器                              │
│  - LSTM/GRU 捕捉时序依赖                           │
└──────────────────────┬─────────────────────────────┘
                       ↓
┌────────────────────────────────────────────────────┐
│           多视角空间-通道特征融合                   │
│  - 空间维度融合                                     │
│  - 通道维度融合                                     │
└──────────────────────┬─────────────────────────────┘
                       ↓
┌────────────────────────────────────────────────────┐
│              分类输出                               │
│  - 正常 / 认知分心                                  │
│  - 分心程度等级                                     │
└────────────────────────────────────────────────────┘

2.3 关键技术

1. 空间特征提取

使用 CNN 提取眼动模式的空间特征：

注视点分布图
扫视轨迹模式
注视区域热度图

2. 时间特征提取

使用 Transformer / LSTM 捕捉时序依赖：

眼动行为的时间演化
注视持续时间的动态变化
扫视频率的周期性

3. 多视角融合

空间-通道特征融合：

$$F_{fused} = \alpha F_{spatial} + \beta F_{channel}$$

三、眼动特征设计

3.1 驾驶认知指标（DCI）

指标	定义	认知分心变化
注视离散度	注视点分布的标准差	↓ 减小
扫描范围	视线覆盖的区域面积	↓ 减小
注视持续时间	单次注视的平均时长	↑ 增加
扫视频率	单位时间内扫视次数	↓ 减小
后视镜检查率	检查后视镜的频率	↓ 显著减小

3.2 注视点特征

特征	说明
位置特征	(x, y) 坐标
时间特征	注视开始/结束时间
持续时间	单次注视时长
扫视幅度	相邻注视点间距离

四、实验设置

4.1 数据采集

条件	设置
环境	驾驶模拟器
眼动追踪	高精度眼动仪
场景	高速公路 + 城市道路
分心任务	认知负载任务（n-back）

4.2 对照条件

条件	说明
正常驾驶	无分心任务
低认知负载	简单认知任务
高认知负载	复杂认知任务

五、结果与讨论

5.1 认知分心表现

研究发现认知分心时：

视觉扫描变窄
- 注视点集中在较小区域
- 扫视幅度减小
注视持续时间增加
- 单次注视时间延长
- 反映注意力下降
后视镜检查减少
- 周边注意力下降
- 情境意识受损

5.2 与传统方法对比

方法	视觉分心	认知分心
PERCLOS	⭐⭐⭐⭐	⭐
视线追踪（简单）	⭐⭐⭐⭐⭐	⭐⭐
DCDD 模型	⭐⭐⭐⭐⭐	⭐⭐⭐⭐

六、对 IMS 开发的启示

6.1 技术路线

阶段	功能	技术方案
P0	视觉分心检测	视线追踪 + 视线落点
P1	疲劳检测	PERCLOS + 眼睑检测
P2	认知分心检测	眼动行为模式 + DCI 指标

6.2 算法实现

# 认知分心检测伪代码
def detect_cognitive_distraction(gaze_data, duration_window=30):
    # 计算注视离散度
    fixation_dispersion = calculate_dispersion(gaze_data)
    
    # 计算扫描范围
    scan_range = calculate_scan_range(gaze_data)
    
    # 计算后视镜检查率
    mirror_check_rate = calculate_mirror_checks(gaze_data)
    
    # 综合评分
    dci_score = (
        w1 * (1 - normalize(fixation_dispersion)) +
        w2 * (1 - normalize(scan_range)) +
        w3 * (1 - normalize(mirror_check_rate))
    )
    
    return dci_score > threshold

6.3 实时性考虑

指标	要求
时间窗口	30-60 秒滑动窗口
更新频率	1 Hz
延迟	< 5 秒

6.4 局限性

局限性	说明
个体差异	不同驾驶员眼动习惯不同
场景依赖	复杂场景本身需要更多注意力
数据需求	需要大量标注数据训练
实时性	需要一定时间窗口累积

七、未来方向

7.1 多模态融合

模态	信息	优势
眼动追踪	视觉注意力	直接反映注意力
驾驶行为	方向盘/踏板	非侵入式
车辆状态	车道保持	客观指标
EEG（可选）	脑电信号	直接测量认知负载

7.2 Transformer 应用

使用 Vision Transformer 提取眼动模式
时序 Transformer 捕捉动态变化
注意力机制融合多源信息

总结

DCDD 模型是认知分心检测的重要进展：

核心创新：眼动行为 + 时空信息融合
关键指标：注视离散度、扫描范围、后视镜检查率
技术路线：CNN + Transformer/LSTM
实用价值：无需 EEG，仅用眼动追踪

对于 IMS 开发，认知分心检测是 长期研究目标，应在视觉分心和疲劳检测基础上逐步实现。

参考来源：

Driver Cognitive Distraction Detection (Springer)

发布日期： 2026-04-09

论文解析 > DMS

#眼动追踪 #认知分心 #深度学习 #Transformer #DCDD

DCDD 模型：基于眼动行为的驾驶员认知分心检测

https://dapalm.com/2026/04/09/2026-04-09-DCDD-Cognitive-Distraction-Detection/

作者

Mars

发布于

2026年4月9日

许可协议

OMNIVISION OX05C：全球首款全局快门 HDR DMS/OMS 传感器下一篇