眼动熵为什么可能成为认知分心检测里比传统注视指标更关键的一层信号
眼动熵为什么可能成为认知分心检测里比传统注视指标更关键的一层信号?
关键词:cognitive distraction、eye gaze entropy、GTE、SGE、driver monitoring、mental workload
一、认知分心真正难的地方,是驾驶员“看起来在看路”,但脑子已经不在路上
视觉分心相对好理解。
比如:
- 低头看手机
- 长时间看中控
- 明显把视线移出道路
这类问题,传统 gaze / head pose / eyelid 体系已经能做不少。
但认知分心不是这样。
它最麻烦的一点在于:
驾驶员的眼睛可能还朝着前方,道路也还在看,但注意力资源已经被别的任务吞掉了。
所以认知分心往往无法靠“看没看路”直接判断。
这也是为什么 2026 之后,认知分心会成为 DMS 里最难啃的一块。
最近一篇由 Harman Research 团队发表的研究 《Discriminative Capabilities of Eye Gaze Measures for Cognitive Load Evaluation in a Driving Simulation Task》 很值得关注。它在一个 N=685 的较大规模驾驶模拟实验里,比较了不同眼动指标和主观负荷量表对认知负荷的区分能力。
最重要的信号不是“眼动有用”这么简单,而是:
眼动熵(尤其 gaze transition entropy)在区分道路环境复杂度和认知负荷动态方面,显示出比很多传统眼动统计量更强的判别价值。
这对 IMS / DMS 很关键,因为它提示我们:
- 认知分心检测不能只盯注视点位置
- 也不能只做 glance duration 和 blink
- “眼动分布的规律性 / 混乱度” 可能才是更接近注意力控制状态的那层信号
二、为什么传统 gaze 指标不够:因为它们更像“结果快照”,不是“注意力组织方式”
很多 DMS 方案已经在用:
- 注视持续时间
- 视线偏转角
- 头姿
- 眨眼频率
- PERCLOS
- 扫视速度
这些指标当然有价值,尤其对:
- 视觉分心
- 疲劳
- 困倦
- 明显不看路
但它们对认知分心的天然局限也很明显:
1)驾驶员可能依然保持“表面正确”的看路模式
也就是说:
- 眼睛在前方
- glance 不长
- 头姿很正常
但视觉扫描和注意力分配已经变僵硬、变机械,或者对环境变化的响应变差。
2)很多统计量只看单点,不看扫描结构
例如平均 fixation duration 或平均 saccade velocity,可能能反映一些趋势,但它们不一定能解释:
- 驾驶员扫描道路的顺序是否合理
- 视线在关键 AOI 之间转换是否变少
- 整体视觉搜索是否变窄、变随机、变失衡
而这正是认知分心更可能首先影响的地方。
三、眼动熵的价值:它看的是“扫描行为的组织度”
这篇研究里,一个很值得重视的方向是 gaze entropy。
简单说,熵在这里不是玄学,而是在衡量:
- 视线分布是否过于集中
- 视线转移是否过于僵硬或异常混乱
- 驾驶员对不同区域的注意分配是否仍保持健康结构
文中提到的几个指标里,尤其值得关注的是:
- GTE(Gaze Transition Entropy)
- SGE(Stationary Gaze Entropy)
GTE 更像什么?
它更像是在看:
你的视线从一个区域切到另一个区域时,转换模式是否还保有合理复杂度和规律性。
如果认知负荷上升,有可能出现两种极端:
- 扫描模式过于单一,注意范围变窄
- 扫描模式变得混乱,缺少有效结构
两者都可能意味着 situational awareness 在下降。
SGE 更像什么?
它更像是在看:
视线停留分布本身是否过于集中或失衡。
这类信息对判断驾驶员是否只“盯着前方某一小块区域”而忽略环境变化,可能很有用。
四、这篇研究真正给 DMS 的启示:认知分心应该从“看没看路”升级为“扫描策略是否退化”
研究摘要里最亮眼的一点是:
- 眼动熵指标在区分 highway vs urban 场景上,平均准确率可到 0.95(针对某些比较)
- 眼动指标和 NASA-TLX 自评在某些场景下有显著相关性
- 眼动与主观量表并不是互相替代,而是互补
这说明什么?
说明认知分心检测不能再只是问:
- 有没有离路?
- 头有没有偏?
- 眼睛有没有闭?
而应该开始问:
- 驾驶员的视觉搜索结构有没有变差?
- AOI 转移规律有没有退化?
- 眼动是否失去环境适配性?
- 当前道路复杂度下,这种扫描模式是否“不正常”?
这才更接近认知分心的本质。
五、对 IMS 来说,眼动熵最重要的价值不是单独上车,而是补齐现有 DMS 的盲区
我不认为短期内“眼动熵一个指标”就能独立解决认知分心。
但它非常可能成为现有 DMS 体系里缺的一层。
现有体系擅长的
- 看没看路
- 闭眼多久
- 头姿是否异常
- 是否明显进行高风险视觉分心
眼动熵更可能补的
- 扫描策略是否缩窄
- 注意分配是否失衡
- 视觉搜索是否脱离当前道路任务需求
- “表面看路、实则走神”的早期迹象
换句话说:
传统 gaze 指标更像显性行为层,眼动熵更像注意力组织层。
两层叠起来,才更有机会碰到认知分心问题的核心。
六、落地时要注意什么:别把眼动熵直接当成法规分数机
这个方向很值得跟,但也要冷静。
风险 1:熵高度依赖场景上下文
同样的扫描模式,在城市道路和高速公路上意义可能完全不同。
所以认知分心模型不能脱离:
- 道路类型
- 交通密度
- 车速
- 场景复杂度
- 交互任务类型
否则很容易把“正常高速驾驶的集中看前”误判成低扫描熵异常。
风险 2:硬件质量会显著影响熵稳定性
如果 gaze 估计本身抖动大、漏点多、受眼镜和光照影响强,那么熵特征很容易被噪声污染。
所以要先保证:
- 基础 eye tracking 足够稳
- AOI 映射合理
- 时窗设计合理
- 置信度过滤充分
风险 3:认知分心没有单一 ground truth
这篇研究也提醒了一个很现实的问题:
- 自评量表有用,但时间分辨率低
- 眼动客观,但未必覆盖全部主观感受
- 两者更像互补,而不是一方替代另一方
这意味着以后做认知分心训练数据时,ground truth 不能太偷懒。
应该考虑组合:
- secondary task 设计
- 主观负荷量表
- 驾驶绩效变化
- 眼动熵 / 生理信号 / 行为信号
七、对 IMS 开发最直接的 7 个建议
建议 1:在现有 gaze pipeline 里新增 entropy 特征支路
先别大改架构。
可以先在当前 gaze / AOI pipeline 上增加:
- stationary gaze entropy
- gaze transition entropy
- 不同时间窗下的稳定性统计
建议 2:必须和道路上下文一起建模
不能只做 cabin-only。
建议至少接入:
- 车速
- 道路类型
- 曲率/路口密度
- 前方风险事件
否则熵特征很容易被误读。
建议 3:把认知分心做成风险评分,不要急着做硬分类
短期更适合:
- 作为 driver capability / cognitive load risk score 的一部分
- 与 visual distraction / drowsiness / takeover readiness 共同融合
而不是上来就输出“你认知分心了”。
建议 4:优先做 highway vs urban 的场景归一化
研究本身已经显示不同道路环境会显著影响指标。
所以第一步应该先学会:
- 在不同道路环境下建立正常扫描基线
- 再检测偏离程度
建议 5:重点关注“表面看路但危险响应迟缓”的案例
这是眼动熵最可能产生价值的地方。
比如:
- gaze 还在前方
- 但 hazard awareness 明显下降
- driver readiness 与外部事件不匹配
这类样本值得单独建专题数据集。
建议 6:可与 EEG / 生理信号形成研究级联合验证
短期量产未必能直接上 EEG,但在研究阶段非常值得用它们做辅助验证,帮助确认:
- 哪些熵变化真对应 cognitive load
- 哪些只是道路复杂度变化
建议 7:将其纳入 DMS-ADAS 协同框架
最终目标不是做一个“眼动熵模型”,而是回答:
- 驾驶员当前是否具备足够 hazard awareness?
- 是否需要更早提醒?
- 是否应提高 takeover 提示强度?
- 是否需要和外部风险感知联合判断?
八、结论:认知分心的下一步,不是看得更久,而是看懂“扫描秩序是否失常”
舱内监控往前走,最难的不是把“看没看路”做得更准一点。
真正难的是发现那些:
- 眼睛还在路上
- 人也没明显疲劳
- 但注意力组织已经变差
- 对环境风险的内部处理能力正在下降
眼动熵之所以重要,不是因为它神奇,而是因为它提供了一个更接近认知层的切口。
它让 DMS 开始不只盯着“视线落点”,而是去看:
驾驶员的视觉扫描是否仍然符合当前驾驶任务所需的注意力结构。
这很可能就是认知分心检测真正值得深挖的一条路线。
参考来源
- Discriminative Capabilities of Eye Gaze Measures for Cognitive Load Evaluation in a Driving Simulation Task(2025, Harman Research / JEMR)
- Euro NCAP 2026 Driver Monitoring 相关公开协议与实施说明
一句话开发启示
认知分心检测别只盯 gaze 点位和眨眼率,下一步更该研究的是:驾驶员在当前道路上下文里的视觉扫描秩序,是否已经开始失常。