认知分心与接管准备度正在收敛为同一条driver-capability评估链

认知分心与接管准备度正在收敛为同一条 driver capability 评估链

发布时间: 2026-03-27
主题: cognitive distraction / takeover readiness / driver capability / automated driving
关键词: cognitive distraction、takeover readiness、driver capability、RtI、situation awareness、gaze transitions、ORI


一句话结论

过去很多系统把“认知分心”和“接管准备度”当成两条独立问题:

  • 认知分心归 DMS
  • 接管准备度归 automated driving / RtI
  • 前者负责判断司机状态
  • 后者负责判断要不要让司机接管

但 2025-2026 的研究信号越来越清楚:

认知分心与接管准备度,正在收敛为同一条 driver capability 评估链。

也就是说,系统真正关心的已经不是:

  • 你是否在 cognitive distraction
  • 你是否“表面上” ready

而是:

  • 你当前是否具备足够的 situational awareness 与有效参与能力,去在几秒内完成安全接管

这会直接改变 DMS / ADS / HMI 的接口设计。


1. 为什么今天必须把这两个问题合并看

如果只单看认知分心,系统容易停留在:

  • eyes-on-mind-off
  • cognitive load 高低
  • 眼动节律异常

如果只单看接管准备度,系统又容易停留在:

  • hands on / off
  • head pose
  • 是否看前方
  • RtI 后反应时间

这两种看法都有用,但各自都不完整。

因为真正决定安全的,是这两个问题在接管场景里的交集:

司机是不是在当前道路与自动化上下文下,已经形成足够的感知、理解和动作准备。

这本质上就是 driver capability 问题。


2. Driver-Net 给了一个强信号:takeover readiness 已经不再是单 gaze 问题

2025 年的 Driver-Net 研究非常有代表性。

它强调:

  • 接管准备度不能只看 head pose / eye gaze
  • 需要融合 头部、手部、身体姿态 等多视角视觉线索
  • 通过 multi-camera fusion 估计 driver take-over readiness
  • 背后的对象不是单个 feature,而是更高层的 readiness state

这件事很重要。

因为它说明接管准备度正在从:

  • 局部生理/视觉信号判断

升级为:

  • driver whole-body readiness inference

而一旦你开始看 whole-body readiness,就已经很难把 cognitive distraction 单独切出去了。

因为认知分心会直接影响:

  • 视觉采样质量
  • 手部任务占用
  • 姿态回正速度
  • 接管前的 situational awareness 重建

也就是说,两者天然耦合。


3. gaze transition 研究进一步证明:静态 eyes-on-road 指标不够解释监督 readiness

MDPI 2026 关于 L2 监督 gaze behaviour 的研究给了另一个关键方向。

它的核心不是看总 eyes-on-road 时间,而是:

  • Markov-based transition analysis 看 gaze 在不同 AOI 间如何切换
  • 强调 supervision quality 取决于 attention shifts 的结构,而不是静态 glance proportions
  • 指出 automation exposure 增加后,监督 engagement 会下降
  • 大约 15 分钟量级就可能出现明显 attentional change

这对认知分心与接管准备度的关系特别关键。

因为它说明:

一个人就算“眼睛还在路上”,也未必保持了足够的 supervisory structure。

换句话说:

  • 认知分心未必导致 eyes-off-road
  • 但可能导致 gaze transition structure 退化
  • 而这种退化正是接管准备度下降的前兆

这就是两条线真正合流的地方。


4. HMI 研究也在提醒:能力不足时,不只是要发 RtI,还要帮助重建理解

Nature 2025 关于 take-over HMI 的研究强调:

  • automation 等级与 ODD 限制常被用户误解
  • RtI 的设计不一致会加剧接管混乱
  • 不同 HMI 模态会影响 takeover phase 中的 gaze wandering 与 workload
  • 问题不只是反应速度,而是 driver 是否真正理解系统限制与当前任务

这再次说明:

接管准备度不是纯动作反应能力,而是 perception + comprehension + action 的联合状态。

而 cognitive distraction 本质上就是这条链中 perception/comprehension 的衰减。

所以从系统架构看,认知分心和接管准备度根本不该拆在两条完全独立的模型线上。


5. 真正应该评估的对象:driver capability,而不是两个平行标签

我越来越倾向于把这条主线定义成:

evidence → supervision quality → driver capability → intervention

其中:

5.1 evidence 层

  • gaze transition structure
  • road-center / dispersion dynamics
  • hand availability
  • body posture / reorientation
  • NDRT engagement
  • automation mode / ODD proximity
  • road hazard context

5.2 supervision quality 层

这里不是在问“你有没有分心”,而是在问:

  • 当前监督是不是有效
  • 环境采样是否完整
  • attention 是否结构化
  • 是否出现 eyes-on-mind-off

5.3 driver capability 层

进一步输出控制层真正需要的量:

  • takeover_readiness
  • cognitive_load_penalty
  • situational_awareness_confidence
  • intervention_urgency

5.4 intervention 层

最后才决定:

  • soft prompt
  • pre-alert
  • RtI
  • reasoned explanation
  • automation downgrade
  • MRM hook

这比“认知分心模型 + readiness 模型各自出一个 flag”更接近量产逻辑。


6. 为什么“静态阈值 + eyes-on-road”会越来越不够用

今天很多系统仍然爱用:

  • 前视占比
  • eyes-on-road 时间
  • head-forward 时间

这些指标在部分场景下确实有效,但越来越不够解释:

  • automation supervision drift
  • cognitive load 下的 situational awareness 退化
  • RtI 前后 gaze transition 的组织能力
  • HMI 不同模态对 readiness 的影响

更实际的问题是:

  • 司机眼睛在路上,但没看关键对象
  • gaze 在动,但 transition structure 崩了
  • 司机在 RtI 后转头回路,但认知上还没完成情境重建

这些场景下,如果系统只看静态 gaze proportion,就很容易误判。

所以我更明确地觉得,下一阶段应该从:

  • static attention thresholds

转向:

  • dynamic supervisory structure assessment

7. 对 IMS 的直接启示:认知分心模块应该并入接管能力模块

如果还把认知分心独立成一个 alert-only 模块,很容易出现:

  • 它报了分心,但 RtI 逻辑没用到
  • RtI 发了,但没有吃 cognitive load 证据
  • automation downgrade 只看手离方向盘,不看理解能力衰减

更合理的做法应该是:

7.1 认知分心证据并入 capability stack

让 cognitive load、gaze transition、eyes-on-mind-off 不直接变成独立告警,而先进入 capability score。

7.2 takeover readiness 不只看姿态,还看监督质量

不仅看:

  • 身体

还要看:

  • gaze structure
  • context acknowledgment
  • hazard awareness proxy

7.3 HMI 设计围绕能力缺口而非单标签

如果系统判断司机“具备动作能力但缺少理解”,就该解释原因;
如果判断“理解和动作都不足”,就应该更快升级到 automation downgrade / MRM。


8. 我的路线判断:下一代 DMS/ADS 会从“状态识别”转向“能力闭环”

如果继续往下看,我更倾向于做几个判断:

8.1 cognitive distraction 会被 capability 模型吸收

不再长期作为独立告警 feature 存在,而会成为 supervision degradation 的一个因子。

8.2 takeover readiness 会从姿态推断升级为综合能力推断

包括:

  • perception
  • comprehension
  • motor readiness
  • context alignment

8.3 HMI 会越来越需要 reasoned, staged intervention

不是只发一个接管提示,而是分阶段帮助 driver 恢复 situation model。

8.4 Euro NCAP / 产业趋势会进一步推动“effective engagement”定义

最终关注的不是 eyes-on-road 本身,而是:

  • effective supervisory engagement

9. 对当前 IMS 团队的优先级建议

P0:把认知分心与 takeover readiness 放进同一 capability schema

不要各自维护一套并行状态机。

P1:把 gaze transition / scan structure 引入 readiness 评估

不要只看 aggregate eyes-on-road。

让 HMI 不是只“催”,而是帮助建立理解。

P2:验证矩阵升级为 cognitive load × supervisory structure × takeover outcome

建议至少覆盖:

  • NDRT type × automation duration × gaze transition pattern × HMI modality × RtI timing × takeover quality

P2:把 failed takeover case 沉淀为 capability replay asset

尤其关注那些“眼睛看着路,但接管仍失败”的案例。


10. 下一轮 TrendRadar 关键词建议

这一轮之后,建议继续扩展:

  • cognitive distraction takeover readiness unified model
  • supervisory gaze transition takeover quality
  • driver capability schema automated driving RtI
  • effective engagement situation awareness takeover
  • reasoned HMI takeover readiness cognitive load
  • eyes-on-mind-off takeover failure

因为真正值得持续追踪的,不再只是“能不能测认知分心”,而是:

谁在把认知分心、监督质量、接管准备度和干预策略收敛为同一条 driver capability 主链。


总结

我对这条线的判断已经很明确:

认知分心与接管准备度,正在收敛为同一条 driver capability 评估链。

下一代更成熟的系统,不会把这两者看成平行标签,而会统一评估:

  • 司机当前有没有形成有效监督
  • 是否具备足够 situational awareness
  • 几秒内能不能完成安全接管
  • 系统该发什么级别的提示、解释和升级动作

谁先把这条 capability chain 做成正式平台能力,谁就更接近 2029 前后 automated driving 里真正可靠的 DMS / RtI / intervention 主架构。


参考资料

  1. Rezaei & Azarmi, Multi-Camera Fusion for Assessing Driver Take-Over Readiness in Automated Vehicles, 2025
    https://arxiv.org/html/2507.04139v2
  2. Supervisory Gaze Behaviour Under Different Automation Durations in Level 2 Driving: A First-Order Transition Analysis, Applied Sciences, 2026
    https://www.mdpi.com/2076-3417/16/3/1401
  3. HMI efficiency, usability and workload during take-over in AVs, Scientific Reports, 2025
    https://www.nature.com/articles/s41598-025-99514-7

认知分心与接管准备度正在收敛为同一条driver-capability评估链
https://dapalm.com/2026/03/27/2026-03-27-认知分心与接管准备度正在收敛为同一条driver-capability评估链/
作者
Mars
发布于
2026年3月27日
许可协议