驾驶员认知分心检测:眼动行为与时空信息融合模型

核心要点

要点 说明
论文来源 Springer Neural Information Processing 2026
核心方法 眼动行为 + 时空信息融合
模型架构 CNN + GRU
检测目标 认知分心(非视觉分心)
关键技术 多视图空间-通道特征融合

一、研究背景

1.1 认知分心 vs 视觉分心

类型 特点 检测难度
视觉分心 眼睛离开道路 低(眼动直接检测)
认知分心 心智偏离,眼睛可能在路 高(无外部行为)

1.2 挑战

挑战 说明
无外部行为 眼睛可能在路,但心智不在
眼动模式变化 扫描模式异常
时间依赖 需要时序分析

二、方法设计

2.1 眼动行为特征

特征 说明
注视点位置 视线落点
注视时长 单次注视时间
扫视幅度 眼球运动距离
扫视频率 扫视次数
扫描模式 注视点分布

2.2 模型架构

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
CNN + GRU 时空融合架构

┌─────────────────────────────────────────────────────────┐
│ 时空融合模型 │
├─────────────────────────────────────────────────────────┤
│ │
│ 输入:眼动时序数据 │
│ ┌──────────────────────────────────────────┐ │
│ │ [T, D] 时序 × 特征维度 │ │
│ └──────────────────┬───────────────────────┘ │
│ ▼ │
│ ┌──────────────────────────────────────────┐ │
│ │ 空间特征提取(CNN) │ │
│ │ ├─ 多视图空间特征 │ │
│ │ └─ 通道特征融合 │ │
│ └──────────────────┬───────────────────────┘ │
│ ▼ │
│ ┌──────────────────────────────────────────┐ │
│ │ 时间特征提取(GRU) │ │
│ │ ├─ 时序依赖建模 │ │
│ │ └─ 隐藏状态提取 │ │
│ └──────────────────┬───────────────────────┘ │
│ ▼ │
│ ┌──────────────────────────────────────────┐ │
│ │ 融合分类层 │ │
│ │ ├─ 全连接层 │ │
│ │ └─ Softmax 输出 │ │
│ └──────────────────┬───────────────────────┘ │
│ ▼ │
│ 输出:认知分心概率 │
│ │
└─────────────────────────────────────────────────────────┘

2.3 多视图空间-通道特征

视图 说明
空间视图 注视点空间分布
时间视图 注视点时序变化
通道视图 多特征通道融合

三、实验结果

3.1 数据集

数据集 说明
驾驶模拟数据 模拟器采集
真实道路数据 部分验证

3.2 性能指标

指标 说明
准确率 分类准确率
召回率 检出率
F1 分数 平衡指标

3.3 对比方法

方法 说明
纯 CNN 仅空间特征
纯 GRU 仅时间特征
CNN + GRU 时空融合(本文)

四、对 IMS 开发的启示

4.1 眼动特征设计

特征 重要性 实现难度
注视点位置
扫描模式
注视时长

4.2 模型架构选择

架构 适用场景
CNN 空间特征提取
GRU/LSTM 时序建模
Transformer 长序列依赖

4.3 开发优先级

优先级 任务 说明
P0 设计眼动特征提取模块 基础能力
P1 实现 CNN + GRU 模型 核心算法
P2 优化实时推理性能 边缘部署

五、总结

核心结论

结论 说明
时空融合有效 CNN + GRU 优于单一模型
眼动行为是关键 认知分心通过眼动模式变化检测
扫描模式重要 空间分布特征有区分度

IMS 开发行动项

行动 时间窗口
实现眼动特征提取 Q2 2026
开发 CNN + GRU 模型 Q3 2026
部署到边缘平台 Q4 2026

参考来源:

  1. Springer: Driver Cognitive Distraction Detection Based on Eye Movement Behavior and Spatio-Temporal Information Fusion
  2. ScienceDirect: Driver Cognitive Distraction Detection based on eye movement behavior and integration of multi-view space-channel feature

发布日期: 2026-04-12
标签: 认知分心, 眼动行为, 时空融合, CNN, GRU, 神经信息处理


驾驶员认知分心检测:眼动行为与时空信息融合模型
https://dapalm.com/2026/04/12/2026-04-12-Cognitive-Distraction-Eye-Movement-Spatio-Temporal-Fusion/
作者
Mars
发布于
2026年4月12日
许可协议