DMS疲劳/分心/情绪检测统一框架:基于MobileNetV2和MediaPipe的实时系统
一、研究背景与Euro NCAP 2026要求
根据Euro NCAP 2026协议,驾驶员监控系统(DMS)评分从2分提升到25分,成为车辆安全评级的核心指标。新协议要求:
| 检测类型 | 2023协议 | 2026协议 | 技术要求 |
|---|---|---|---|
| 疲劳检测 | 可选 | 强制 | PERCLOS阈值、检测时延要求 |
| 分心检测 | 可选 | 强制 | 视线偏离、手机使用检测 |
| 情绪/状态 | 无 | 新增 | 行为异常识别 |
本文基于2026年1月发表在PMC的最新研究,详细介绍一套统一检测框架,能够同时处理疲劳、分心、情绪三类任务,且满足实时性要求。
二、系统架构设计
2.1 整体流程
1 | 摄像头输入 → 面部检测 → 468点landmark提取 |
2.2 硬件配置
| 组件 | 型号 | 参数 | 成本估算 |
|---|---|---|---|
| 摄像头 | 通用USB CMOS | 640×480@30fps | $15-30 |
| 处理器 | Intel i7-12700 | 基频3.4GHz | - |
| GPU | NVIDIA RTX 3070 | CUDA 11.8 | - |
关键发现: 采用USB Video Class (UVC)标准摄像头,无需专用驱动,大幅降低系统集成难度。
三、核心算法详解
3.1 疲劳检测 - Eye Aspect Ratio (EAR)
计算公式
1 | # 基于MediaPipe Face Mesh的468点landmark |
阈值设定
基于27名驾驶员的统计数据:
| 参数 | 值 | 来源 |
|---|---|---|
| 平均EAR(清醒状态) | 0.257 ± 0.021 | 实测数据 |
| 疲劳阈值 | 0.23 | 约均值-1.3σ |
| 触发时延 | 连续3帧 | 避免眨眼误检 |
Euro NCAP对应要求:
- PERCLOS(Percentage of Eye Closure)计算
- OEM需在Dossier中声明阈值
- 建议采用自适应阈值策略
3.2 哈欠检测 - Mouth Aspect Ratio (MAR)
1 | # 嘴唇关键点索引:61, 65, 63, 67, 64, 66 |
检测精度: 85.19%(27人测试)
挑战:
- 部分哈欠嘴未完全张开
- 说话/笑可能误触发
- 需结合时序分析
3.3 分心检测 - 头部姿态 + 虹膜定位
头部姿态估计
1 | import cv2 |
虹膜定位
MediaPipe Face Mesh提供虹膜关键点:
1 | # 虹膜关键点索引 |
检测精度:100%(27人测试,所有分心行为正确识别)
3.4 情绪识别 - MobileNetV2 CNN
模型架构
1 | import torch |
训练配置
| 参数 | 值 |
|---|---|
| 数据集 | RAF-DB(30,000张) |
| 输入尺寸 | 224×224 |
| 批大小 | 32 |
| 训练轮次 | 15 epochs |
| 优化器 | Adam |
| 学习率 | 0.0003 |
| 损失函数 | CrossEntropy |
检测精度
| 情绪类别 | 精度 | 备注 |
|---|---|---|
| 快乐 | 100% | 表情明显 |
| 愤怒/厌恶 | 96.3% | 合并类别 |
| 惊讶 | 92.6% | 表情明显 |
| 悲伤 | 66.7% | 表情微弱 |
| 恐惧 | 0% | 数据集不匹配 |
关键发现: 恐惧检测失败是因为RAF-DB数据集中的恐惧表情过于夸张,与真实驾驶场景不符。需要领域自适应或驾驶场景专用数据集。
四、系统集成与实时运行
4.1 优先级机制
1 | class DMSDetector: |
4.2 性能指标
| 指标 | 值 |
|---|---|
| 帧率 | 30 fps(640×480) |
| 单帧处理时延 | <33ms |
| GPU利用率 | ~40%(RTX 3070) |
| CPU利用率 | ~30%(i7-12700) |
五、IMS开发启示
5.1 技术路线选择
| 方案 | 优点 | 缺点 | 推荐场景 |
|---|---|---|---|
| 纯视觉(本方案) | 非侵入、低成本 | 光照敏感 | 乘用车量产 |
| 多传感器融合 | 高精度 | 高成本 | 高端车型 |
| 生理信号(EEG/HRV) | 准确度高 | 侵入式 | 研究验证 |
5.2 部署优化建议
1 | # 1. 模型量化(INT8) |
5.3 Euro NCAP合规检查清单
- PERCLOS计算实现
- 阈值声明文档
- 检测时延验证
- 分心场景覆盖
- 警告等级机制
- 误报率统计
六、总结
本研究展示了基于MobileNetV2和MediaPipe的统一DMS框架,实现了:
- 疲劳检测: EAR阈值法,88.89%精度
- 分心检测: 头部姿态+虹膜定位,100%精度
- 情绪识别: CNN分类,部分情绪精度高
核心优势:
- 实时运行(30fps)
- 轻量级架构(MobileNetV2)
- 标准摄像头兼容
- 满足Euro NCAP 2026基本要求
待改进方向:
- 自适应阈值校准
- 恐惧情绪数据集
- 低光场景优化
- 多传感器融合
参考论文:
- “Driver Monitoring System Using Computer Vision for Real-Time Detection of Fatigue, Distraction and Emotion via Facial Landmarks and Deep Learning”, Sensors 2026
- MediaPipe Face Mesh Documentation
- Euro NCAP 2026 Assessment Protocol
相关文章: