TD2D数据集:50人多模态分心检测,Random Forest达96%准确率

前言

TD2D(Takeover during Distracted L2 Automated Driving)是2025年发布的首个针对L2级自动驾驶的分心检测多模态数据集。本文解读数据集特点和研究发现,为IMS数据采集和算法开发提供参考。


一、数据集概述

1.1 基本信息

指标 数值
名称 TD2D
参与者 50人
任务条件 10种
传感器 ECG + PPG + EDA + 眼动追踪
场景 L2级自动驾驶
开源 Zenodo (DOI: 10.5281/zenodo.14185964)

1.2 研究来源

论文:Driver Distraction Detection in Conditionally Automated Driving Using Multimodal Physiological and Ocular Signals
期刊:Electronics (MDPI), September 2025
机构:Xihang University, Hubei University of Arts and Science


二、任务设计

2.1 十种任务条件

TD2D设计了十种任务条件,覆盖不同模态的分心:

类型 任务 描述
基线 无次任务 正常驾驶
视觉任务 电子书阅读 视觉分心
视觉短信 视觉分心
屏幕互动游戏 视觉分心
认知任务 0-back 认知分心(低)
1-back 认知分心(中)
2-back 认知分心(高)
听觉任务 有声书聆听 听觉分心
语音短信 听觉分心
语音游戏 听觉分心

2.2 NASA-TLX工作量重分类

研究使用NASA-TLX主观评分重新分类任务:

类别 任务
低工作量 基线、有声书
中工作量 语音短信、语音游戏、0-back
高工作量 电子书、视觉短信、屏幕游戏、1-back、2-back

三、传感器与信号

3.1 多模态传感器

传感器 信号 特征
ECG 心电图 HRV、心率
PPG 光电容积描记 心率、血氧
EDA 电皮肤活动 皮肤电导
眼动追踪 注视数据 注视点、扫视、眨眼

3.2 特征提取

总计25个特征

模态 特征类别 特征数
心血管 时域、频域 ~10
EDA 时域、频域 ~5
眼动 注视、扫视、眨眼 ~10

3.3 时间窗口优化

研究发现最优时间窗口配置:

参数 最优值 说明
窗口长度 5-8秒 平衡准确率与延迟
重叠率 部分重叠 时序重叠比窗口长度影响更大

四、分类结果

4.1 模型对比

模型 被试内准确率 跨被试准确率
Random Forest 96% 69%
SVM 较低 较低
MLP 较低 较低

4.2 SHAP 特征重要性

排名 特征类别 重要性
1 眼动特征 ⭐⭐⭐⭐⭐
2 EDA特征 ⭐⭐⭐
3 心血管特征 ⭐⭐

4.3 模态贡献分析

1
眼动特征 >>> EDA特征 > 心血管特征

关键发现

  • 眼动特征是主要判别因子
  • EDA提供补充鲁棒性
  • 心血管特征辅助信息

五、跨被试泛化挑战

5.1 问题分析

指标 被试内 跨被试 差距
准确率 96% 69% 27%

5.2 原因分析

  1. 个体差异:生理信号基线差异大
  2. 信号质量:不同被试传感器佩戴质量不同
  3. 行为模式:分心行为表现形式不同

5.3 解决方案

方案 说明
域适应 学习域不变特征
迁移学习 预训练+微调
数据增强 合成数据补充
被试特定校准 初始校准阶段

六、IMS 应用建议

6.1 数据采集参考

TD2D为IMS数据采集提供了良好范本:

要素 TD2D方案 IMS建议
参与者 50人 ≥100人覆盖多样性
任务设计 10种任务 参考TD2D任务类型
传感器 4种模态 优先眼动+EDA
时间窗口 5-8秒 采用此配置

6.2 算法开发建议

  1. 特征工程

    • 优先提取眼动特征
    • EDA作为补充特征
    • 心血管特征可选
  2. 模型选择

    • Random Forest 作为基线
    • 深度学习探索(CNN-LSTM)
    • 考虑跨被试泛化
  3. 时间窗口

    • 默认使用5-8秒窗口
    • 部分重叠提升检测率

6.3 跨被试泛化策略

1
2
3
4
5
6
7
8
策略1:被试特定校准
初始5分钟正常驾驶数据校准

策略2:在线自适应
运行时持续更新模型

策略3:元学习
学习快速适应新用户

七、数据集获取

7.1 下载地址

Zenodo: https://zenodo.org/records/14185964

7.2 许可证

  • 开源许可
  • 学术研究免费使用
  • 商用需联系作者

7.3 数据格式

文件 格式
生理信号 CSV
眼动数据 CSV
标签 CSV
元数据 JSON

八、相关数据集对比

数据集 参与者 传感器 场景 特点
TD2D 50 4种 L2自动驾驶 多模态、任务丰富
STEW 48 EEG 静态任务 EEG认知负荷
NTHU-DDD 36 摄像头 手动驾驶 疲劳检测
Drive&Act 多人 多视角 自动驾驶 细粒度行为

总结

TD2D数据集的核心贡献:

贡献 说明
首个L2分心检测数据集 自动驾驶场景
多模态信号 ECG+PPG+EDA+眼动
任务丰富 10种分心类型
基准结果 Random Forest 96%

IMS 启示

  • 眼动特征是分心检测的核心
  • 多模态融合提升鲁棒性
  • 跨被试泛化是主要挑战
  • 5-8秒时间窗口最优

研究日期: 2026-03-13
数据集:TD2D (Zenodo DOI: 10.5281/zenodo.14185964)
关键词: TD2D, 多模态, 分心检测, 数据集, Random Forest


TD2D数据集:50人多模态分心检测,Random Forest达96%准确率
https://dapalm.com/2026/03/13/2026-03-13-TD2D数据集-50人多模态分心检测基准/
作者
Mars
发布于
2026年3月13日
许可协议