前言
CES 2025,Smart Eye 发布了 Synthetic Data Generation Tool(合成数据生成工具),通过生成多样化、逼真的合成数据集,革命性地改变了 DMS AI 系统的训练方式。
一、合成数据的必要性
1.1 真实数据的局限
| 问题 |
说明 |
| 采集成本高 |
需要大量驾驶员参与测试 |
| 隐私合规 |
人脸、眼动数据涉及敏感信息 |
| 长尾场景缺失 |
危险、罕见行为难以采集 |
| 标注成本 |
专业标注人员费用高昂 |
1.2 合成数据的优势
| 优势 |
说明 |
| 可扩展性 |
无限生成数据 |
| 可控性 |
精确控制场景参数 |
| 隐私友好 |
无真实个人信息 |
| 成本降低 |
减少实车测试需求 |
二、Smart Eye 合成数据工具
2.1 核心能力
| 功能 |
说明 |
| 场景生成 |
从常见行为到罕见高风险场景 |
| 驾驶员行为模拟 |
疲劳、分心、情绪等状态 |
| 环境变化 |
光照、天气、遮挡等 |
| 多模态对齐 |
IR、RGB、深度数据同步 |
2.2 应用场景
| 场景 |
数据类型 |
| 疲劳检测训练 |
眼睑下垂、打哈欠、点头 |
| 分心检测训练 |
手机使用、视线偏离 |
| 极端场景 |
强光、暗光、遮挡、墨镜 |
| 边缘案例 |
罕见姿态、特殊行为 |
三、合成数据技术对比
3.1 主流平台
| 平台 |
厂商 |
特点 |
| Anyverse InCabin |
Anyverse |
NCAP 场景对齐、多模态 |
| Smart Eye SDG |
Smart Eye |
驾驶员行为专业化 |
| LEyes |
学术 |
轻量化眼动数据 |
| SP-EyeGAN |
学术 |
注视点 + 扫视分离生成 |
3.2 技术路线
| 方法 |
说明 |
| 物理仿真 |
基于光线追踪的传感器建模 |
| GAN 生成 |
生成对抗网络创建逼真图像 |
| 参数化模型 |
可控的人脸、眼球模型 |
| 混合方法 |
仿真 + GAN 结合 |
四、LEyes 框架解析
4.1 概述
LEyes 是 2025 年发布的轻量化眼动合成数据框架,用于深度学习眼动追踪。
4.2 核心创新
| 特性 |
说明 |
| 简化表示 |
不追求真实眼图像,仅保留关键特征 |
| 多任务支持 |
定位、分割、CR 检测 |
| 跨设备泛化 |
适应不同眼动仪配置 |
| 性能优异 |
与真实数据训练相当甚至更好 |
4.3 任务类型
| 任务 |
说明 |
| 眼部特征定位 |
瞳孔、眼角、眼睑 |
| 眼部分割 |
虹膜、巩膜、皮肤分离 |
| CR 检测 |
检测多个角膜反射点 |
| CR 匹配 |
确定 CR 对应的照明器 |
五、SP-EyeGAN 框架
5.1 双 GAN 架构
| 组件 |
功能 |
| FixGAN |
生成注视点微动(fixations) |
| SacGAN |
生成扫视运动(saccades) |
5.2 优势
| 优势 |
说明 |
| 模拟真实眼动模式 |
分离微动和宏动 |
| 隐私友好 |
无需真实眼动数据 |
| 预训练支持 |
可用于模型预训练 |
六、对 IMS 开发的启示
6.1 数据策略
| 阶段 |
数据来源 |
比例 |
| 预训练 |
合成数据 |
80% |
| 微调 |
真实数据 |
20% |
| 验证 |
合成 + 真实 |
50/50 |
6.2 工具选型
| 需求 |
推荐方案 |
| NCAP 合规验证 |
Anyverse InCabin |
| 疲劳/分心训练 |
Smart Eye SDG |
| 眼动追踪专用 |
LEyes |
| 眼动模式研究 |
SP-EyeGAN |
6.3 开发流程
1
| 合成数据生成 → 模型预训练 → 真实数据微调 → 仿真验证 → 实车测试
|
七、成本效益分析
7.1 成本对比
| 方案 |
成本估算 |
时间 |
| 纯真实数据 |
高(采集+标注) |
长 |
| 合成+真实 |
中(软件许可+少量真实) |
短 |
| 纯合成 |
低(软件许可) |
最短 |
7.2 效果对比
| 方案 |
精度 |
泛化性 |
| 纯真实 |
高 |
受限于数据分布 |
| 合成+真实 |
最高 |
最佳 |
| 纯合成 |
中高 |
需域适应 |
八、未来趋势
8.1 技术演进
| 方向 |
说明 |
| 更高保真 |
物理仿真 + 神经渲染 |
| 域适应 |
合成到真实的迁移学习 |
| 自动化验证 |
自动生成 NCAP 测试场景 |
8.2 法规认可
| 进展 |
说明 |
| C-NCAP |
接受虚拟仿真验证 |
| Euro NCAP |
鼓励合成数据使用 |
| NHTSA |
评估合成数据在法规测试中的角色 |
总结
合成数据正在改变 DMS 开发范式:
- 成本降低:减少实车测试需求
- 隐私合规:无个人信息风险
- 场景覆盖:覆盖长尾边缘案例
- 迭代加速:快速生成、快速验证
- 法规认可:NCAP 接受仿真验证
对于 IMS 开发,合成数据 + 真实数据混合策略是最优解。
参考来源:
发布日期: 2026-04-10