核心要点
| 要点 |
说明 |
| 论文来源 |
Springer Neural Information Processing 2026 |
| 核心方法 |
眼动行为 + 时空信息融合 |
| 模型架构 |
CNN + GRU |
| 检测目标 |
认知分心(非视觉分心) |
| 关键技术 |
多视图空间-通道特征融合 |
一、研究背景
1.1 认知分心 vs 视觉分心
| 类型 |
特点 |
检测难度 |
| 视觉分心 |
眼睛离开道路 |
低(眼动直接检测) |
| 认知分心 |
心智偏离,眼睛可能在路 |
高(无外部行为) |
1.2 挑战
| 挑战 |
说明 |
| 无外部行为 |
眼睛可能在路,但心智不在 |
| 眼动模式变化 |
扫描模式异常 |
| 时间依赖 |
需要时序分析 |
二、方法设计
2.1 眼动行为特征
| 特征 |
说明 |
| 注视点位置 |
视线落点 |
| 注视时长 |
单次注视时间 |
| 扫视幅度 |
眼球运动距离 |
| 扫视频率 |
扫视次数 |
| 扫描模式 |
注视点分布 |
2.2 模型架构
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
| CNN + GRU 时空融合架构
┌─────────────────────────────────────────────────────────┐ │ 时空融合模型 │ ├─────────────────────────────────────────────────────────┤ │ │ │ 输入:眼动时序数据 │ │ ┌──────────────────────────────────────────┐ │ │ │ [T, D] 时序 × 特征维度 │ │ │ └──────────────────┬───────────────────────┘ │ │ ▼ │ │ ┌──────────────────────────────────────────┐ │ │ │ 空间特征提取(CNN) │ │ │ │ ├─ 多视图空间特征 │ │ │ │ └─ 通道特征融合 │ │ │ └──────────────────┬───────────────────────┘ │ │ ▼ │ │ ┌──────────────────────────────────────────┐ │ │ │ 时间特征提取(GRU) │ │ │ │ ├─ 时序依赖建模 │ │ │ │ └─ 隐藏状态提取 │ │ │ └──────────────────┬───────────────────────┘ │ │ ▼ │ │ ┌──────────────────────────────────────────┐ │ │ │ 融合分类层 │ │ │ │ ├─ 全连接层 │ │ │ │ └─ Softmax 输出 │ │ │ └──────────────────┬───────────────────────┘ │ │ ▼ │ │ 输出:认知分心概率 │ │ │ └─────────────────────────────────────────────────────────┘
|
2.3 多视图空间-通道特征
| 视图 |
说明 |
| 空间视图 |
注视点空间分布 |
| 时间视图 |
注视点时序变化 |
| 通道视图 |
多特征通道融合 |
三、实验结果
3.1 数据集
| 数据集 |
说明 |
| 驾驶模拟数据 |
模拟器采集 |
| 真实道路数据 |
部分验证 |
3.2 性能指标
| 指标 |
说明 |
| 准确率 |
分类准确率 |
| 召回率 |
检出率 |
| F1 分数 |
平衡指标 |
3.3 对比方法
| 方法 |
说明 |
| 纯 CNN |
仅空间特征 |
| 纯 GRU |
仅时间特征 |
| CNN + GRU |
时空融合(本文) |
四、对 IMS 开发的启示
4.1 眼动特征设计
| 特征 |
重要性 |
实现难度 |
| 注视点位置 |
高 |
低 |
| 扫描模式 |
高 |
中 |
| 注视时长 |
中 |
低 |
4.2 模型架构选择
| 架构 |
适用场景 |
| CNN |
空间特征提取 |
| GRU/LSTM |
时序建模 |
| Transformer |
长序列依赖 |
4.3 开发优先级
| 优先级 |
任务 |
说明 |
| P0 |
设计眼动特征提取模块 |
基础能力 |
| P1 |
实现 CNN + GRU 模型 |
核心算法 |
| P2 |
优化实时推理性能 |
边缘部署 |
五、总结
核心结论
| 结论 |
说明 |
| 时空融合有效 |
CNN + GRU 优于单一模型 |
| 眼动行为是关键 |
认知分心通过眼动模式变化检测 |
| 扫描模式重要 |
空间分布特征有区分度 |
IMS 开发行动项
| 行动 |
时间窗口 |
| 实现眼动特征提取 |
Q2 2026 |
| 开发 CNN + GRU 模型 |
Q3 2026 |
| 部署到边缘平台 |
Q4 2026 |
参考来源:
- Springer: Driver Cognitive Distraction Detection Based on Eye Movement Behavior and Spatio-Temporal Information Fusion
- ScienceDirect: Driver Cognitive Distraction Detection based on eye movement behavior and integration of multi-view space-channel feature
发布日期: 2026-04-12
标签: 认知分心, 眼动行为, 时空融合, CNN, GRU, 神经信息处理