驾驶员认知分心检测：眼动行为与时空信息融合模型

核心要点

要点	说明
论文来源	Springer Neural Information Processing 2026
核心方法	眼动行为 + 时空信息融合
模型架构	CNN + GRU
检测目标	认知分心（非视觉分心）
关键技术	多视图空间-通道特征融合

一、研究背景

1.1 认知分心 vs 视觉分心

类型	特点	检测难度
视觉分心	眼睛离开道路	低（眼动直接检测）
认知分心	心智偏离，眼睛可能在路	高（无外部行为）

1.2 挑战

挑战	说明
无外部行为	眼睛可能在路，但心智不在
眼动模式变化	扫描模式异常
时间依赖	需要时序分析

二、方法设计

2.1 眼动行为特征

特征	说明
注视点位置	视线落点
注视时长	单次注视时间
扫视幅度	眼球运动距离
扫视频率	扫视次数
扫描模式	注视点分布

2.2 模型架构

CNN + GRU 时空融合架构

┌─────────────────────────────────────────────────────────┐
│                  时空融合模型                            │
├─────────────────────────────────────────────────────────┤
│                                                          │
│  输入：眼动时序数据                                      │
│  ┌──────────────────────────────────────────┐           │
│  │ [T, D] 时序 × 特征维度                    │           │
│  └──────────────────┬───────────────────────┘           │
│                     ▼                                   │
│  ┌──────────────────────────────────────────┐           │
│  │ 空间特征提取（CNN）                        │           │
│  │ ├─ 多视图空间特征                         │           │
│  │ └─ 通道特征融合                           │           │
│  └──────────────────┬───────────────────────┘           │
│                     ▼                                   │
│  ┌──────────────────────────────────────────┐           │
│  │ 时间特征提取（GRU）                        │           │
│  │ ├─ 时序依赖建模                           │           │
│  │ └─ 隐藏状态提取                           │           │
│  └──────────────────┬───────────────────────┘           │
│                     ▼                                   │
│  ┌──────────────────────────────────────────┐           │
│  │ 融合分类层                                 │           │
│  │ ├─ 全连接层                               │           │
│  │ └─ Softmax 输出                           │           │
│  └──────────────────┬───────────────────────┘           │
│                     ▼                                   │
│  输出：认知分心概率                                      │
│                                                          │
└─────────────────────────────────────────────────────────┘

2.3 多视图空间-通道特征

视图	说明
空间视图	注视点空间分布
时间视图	注视点时序变化
通道视图	多特征通道融合

三、实验结果

3.1 数据集

数据集	说明
驾驶模拟数据	模拟器采集
真实道路数据	部分验证

3.2 性能指标

指标	说明
准确率	分类准确率
召回率	检出率
F1 分数	平衡指标

3.3 对比方法

方法	说明
纯 CNN	仅空间特征
纯 GRU	仅时间特征
CNN + GRU	时空融合（本文）

四、对 IMS 开发的启示

4.1 眼动特征设计

特征	重要性	实现难度
注视点位置	高	低
扫描模式	高	中
注视时长	中	低

4.2 模型架构选择

架构	适用场景
CNN	空间特征提取
GRU/LSTM	时序建模
Transformer	长序列依赖

4.3 开发优先级

优先级	任务	说明
P0	设计眼动特征提取模块	基础能力
P1	实现 CNN + GRU 模型	核心算法
P2	优化实时推理性能	边缘部署

五、总结

核心结论

结论	说明
时空融合有效	CNN + GRU 优于单一模型
眼动行为是关键	认知分心通过眼动模式变化检测
扫描模式重要	空间分布特征有区分度

IMS 开发行动项

行动	时间窗口
实现眼动特征提取	Q2 2026
开发 CNN + GRU 模型	Q3 2026
部署到边缘平台	Q4 2026

参考来源：

发布日期： 2026-04-12
标签： 认知分心, 眼动行为, 时空融合, CNN, GRU, 神经信息处理

技术方案

#深度学习 #认知分心

驾驶员认知分心检测：眼动行为与时空信息融合模型

https://dapalm.com/2026/04/12/2026-04-12-Cognitive-Distraction-Eye-Movement-Spatio-Temporal-Fusion/

作者

Mars

发布于

2026年4月12日

许可协议

Euro NCAP 2026 酒驾检测：DMS 如何识别酒精损伤？上一篇

TD2D 数据集：条件自动驾驶分心检测多模态生理眼动信号下一篇