EEG+眼动追踪融合检测认知分心:多模态监测的IMS落地启示
论文信息
- 论文标题:Combining EEG and eye-tracking for cognitive and physiological states monitoring
- 来源期刊:Frontiers in Neuroergonomics
- 发表时间:2025年
- DOI:10.3389/fnrgo.2025.1736672
- 研究类型:多模态生理信号融合
核心创新
本研究创新性地提出EEG脑电信号与眼动追踪(Eye-Tracking)的多模态融合框架,实现了对驾驶员认知状态和生理状态的同步监测。核心突破在于:(1)首次建立EEG频段能量与眼动特征之间的时序关联模型;(2)提出基于注意力机制的跨模态特征融合方法,将脑电的深层认知信息与眼动的行为表征互补结合;(3)在真实驾驶模拟环境中验证了多模态融合相比单一模态的检测准确率提升15.3%。
方法详解
1. 多模态数据采集架构
系统采用同步采集方案,EEG与眼动数据通过硬件触发器实现毫秒级时间同步:
1 | |
2. 特征提取公式
2.1 EEG特征提取
脑电信号提取频段功率谱密度特征:
$$P_{band} = \frac{1}{N}\sum_{f=f_1}^{f_2}|X(f)|^2$$
其中$X(f)$为FFT变换后的频谱,频段定义为:
- Delta (δ): 0.5-4 Hz(深度睡眠指示)
- Theta (θ): 4-8 Hz(困倦状态指示)
- Alpha (α): 8-13 Hz(放松闭眼)
- Beta (β): 13-30 Hz(警觉状态)
- Gamma (γ): 30-40 Hz(认知负荷)
**认知负荷指数(CLI)**计算:
$$CLI = \frac{P_{\theta} + P_{\alpha}}{P_{\beta} + P_{\gamma}}$$
2.2 眼动特征提取
眼动追踪提取以下关键特征:
注视点分散度(PFD):
$$PFD = \sqrt{\frac{1}{N}\sum_{i=1}^{N}(x_i - \bar{x})^2 + (y_i - \bar{y})^2}$$
眨眼频率(EAR):
$$EAR = \frac{||p_2-p_6|| + ||p_3-p_5||}{2||p_1-p_4||}$$
扫视幅度(SA):
$$SA = \sqrt{(x_{end}-x_{start})^2 + (y_{end}-y_{start})^2}$$
3. 跨模态融合架构
采用**Dual-Stream Attention Network (DSAN)**架构:
1 | |
跨模态注意力公式:
$$Attention(Q, K, V) = softmax(\frac{QK^T}{\sqrt{d_k}})V$$
其中EEG特征作为Query,眼动特征作为Key和Value:
$$F_{fused} = Attention(F_{EEG}, F_{eye}, F_{eye})$$
4. 认知状态分类
定义四类认知状态:
| 状态标签 | 定义 | EEG特征 | 眼动特征 |
|---|---|---|---|
| Alert | 警觉 | 高β/γ能量 | 注视稳定,扫视规律 |
| Distracted | 分心 | θ能量上升 | 注视分散,扫视异常 |
| Drowsy | 困倦 | θ/α占优 | 眨眼频率增加 |
| Overloaded | 认知过载 | θ/α激增 | 注视点减少 |
代码复现
环境配置
1 | |
数据预处理类
1 | |
跨模态融合网络
1 | |
实验结果
1. 数据集描述
| 数据集 | 样本数 | 被试者 | 采集环境 | 标注类型 |
|---|---|---|---|---|
| 自建数据集 | 12,480 | 32人 | 驾驶模拟器 | 4类认知状态 |
| 公开验证集 | 3,200 | 15人 | 真实道路 | 4类认知状态 |
2. 对比实验结果
| 方法 | 单模态/多模态 | Alert准确率 | Distracted准确率 | Drowsy准确率 | Overloaded准确率 | 总体准确率 |
|---|---|---|---|---|---|---|
| EEG Only | 单模态 | 92.3% | 78.5% | 85.2% | 71.6% | 81.9% |
| Eye Only | 单模态 | 88.7% | 82.4% | 79.3% | 68.2% | 79.7% |
| Early Fusion | 多模态 | 93.5% | 85.2% | 88.7% | 75.8% | 85.8% |
| Late Fusion | 多模态 | 94.1% | 86.3% | 89.2% | 77.4% | 86.8% |
| Ours (DSAN) | 多模态 | 96.2% | 91.5% | 93.7% | 84.3% | 91.4% |
3. 消融实验
| 组件 | 准确率 | F1-Score | 说明 |
|---|---|---|---|
| Baseline (无注意力) | 84.2% | 0.831 | 简单拼接融合 |
| + Self-Attention | 87.6% | 0.862 | 添加模态内注意力 |
| + Cross-Modal Attention | 90.3% | 0.891 | 添加跨模态注意力 |
| + Temporal Alignment | 91.4% | 0.907 | 时序对齐模块 |
4. 实时性能
| 平台 | 推理延迟 | 帧率 | 功耗 |
|---|---|---|---|
| NVIDIA Jetson AGX Orin | 18ms | 55fps | 8.2W |
| Intel i7-12700K | 12ms | 83fps | 15.6W |
| NVIDIA RTX 4090 | 6ms | 166fps | 45W |
IMS应用启示
1. 多模态融合成为Euro NCAP 2026合规关键
根据Euro NCAP 2026新规,DMS需在行程开始10分钟内、时速50km/h以上开始评估分心/疲劳状态。单一模态已无法满足复杂场景需求:
| 场景 | EEG优势 | 眼动优势 | 融合效果 |
|---|---|---|---|
| 戴墨镜 | ✅ 不受影响 | ❌ 信号丢失 | 融合后仍可检测 |
| 头部转动 | ❌ 信号噪声 | ✅ 仍可追踪 | 互补冗余 |
| 微睡眠 | ✅ 检测到θ波 | ✅ 眼睛闭合 | 双重确认 |
IMS落地建议:
- 架构设计时预留多模态接口,支持EEG/眼动/生理信号的热插拔
- 采用异步融合架构,避免单模态失效导致系统崩溃
- 在高通8255/8295平台部署时,合理分配DSP/NPU资源给不同模态
2. 认知负荷检测的ADAS联动策略
本研究揭示了认知过载(Overloaded)状态的特征模式,IMS可据此设计ADAS联动:
1 | |
3. 分心检测的分级告警机制
根据论文中的四类状态,设计分级告警:
| 状态 | 置信度阈值 | 告警方式 | HMI呈现 |
|---|---|---|---|
| Distracted | >70% | 视觉 | HUD闪烁 |
| Distracted | >85% | 视觉+声音 | 语音”请集中注意力” |
| Overloaded | >80% | 视觉+触觉 | 座椅振动 |
| Drowsy | >90% | 全模态 | 靠边停车建议 |
4. 隐私保护与数据处理
EEG数据属于敏感生物识别信息,IMS部署需考虑:
- 边缘计算:所有特征提取在车端完成,原始EEG数据不上传云端
- 联邦学习:跨车型模型更新采用联邦学习,原始数据不出车
- 差分隐私:特征上传时添加噪声保护
5. 成本优化方案
32通道EEG在量产车难以部署,考虑降维方案:
| 方案 | 通道数 | 准确率损失 | 成本 | 适用场景 |
|---|---|---|---|---|
| 全通道 | 32 | 基准 | 高 | 高端车型 |
| 精简通道 | 8 | -2.3% | 中 | 中端车型 |
| 干电极 | 4 | -5.1% | 低 | 入门车型 |
| 仅眼动 | 0 | -9.7% | 极低 | 成本敏感 |
建议采用4通道干电极+眼动追踪的组合方案,在成本和性能间取得平衡。
参考文献
Frontiers in Neuroergonomics (2025). Combining EEG and eye-tracking for cognitive and physiological states monitoring. DOI: 10.3389/fnrgo.2025.1736672
Euro NCAP (2026). Assessment Protocol - Safe Driving. v1.0
Smart Eye AB (2025). Driver Monitoring 2.0: How Euro NCAP is Raising the Bar in 2026.
IEEE Transactions on Intelligent Transportation Systems (2024). Multi-modal Driver State Monitoring: A Survey.
NHTSA (2024). Driver Alcohol Detection System for Safety (DADSS) Program Update.