SynAD:用合成数据增强端到端自动驾驶模型
前言
自动驾驶数据采集成本高昂,长尾场景难以获取。SynAD (ICCV 2025) 提出了一种创新方案:生成合成场景,直接增强真实世界的端到端自动驾驶模型,无需传感器数据,碰撞率降低16.7%。

图1:SynAD 核心概念 - 合成数据增强真实模型
一、核心问题
现有方案的局限
| 方法 | 局限性 |
|---|---|
| 真实数据采集 | 成本高、长尾场景难获取、标注周期长 |
| 仿真器训练(CARLA) | 虚拟环境,迁移到真实场景效果差 |
| 路径生成方法 | 只生成轨迹,无传感器数据 |
SynAD 解决方案
1 | |
核心创新:
- ✅ 选择信息最丰富的车辆作为Ego
- ✅ Map-to-BEV无需传感器输入
- ✅ 合成+真实数据联合训练
二、技术架构
2.1 整体流程
1 | |

图2:SynAD 整体架构
2.2 Map-to-BEV 网络
核心思想: 从地图直接生成BEV特征,无需渲染相机图像
| 传统方法 | SynAD方法 |
|---|---|
| 相机图像 → CNN → BEV | 地图+位置 → MLP → BEV |
| 需要传感器数据 | 无需传感器数据 |
| 渲染成本高 | 计算高效 |

图3:Map-to-BEV 网络结构
输入:
- 地图(道路布局、车道线)
- 车辆位置信息
输出:
- BEV特征(与真实传感器提取一致)
三、实验结果
3.1 规划性能提升
| 指标 | 仅真实数据 | +SynAD合成 | 提升 |
|---|---|---|---|
| L2误差 (m) | 0.89 | 0.83 | ↓6.7% |
| 碰撞率 (%) | 0.42 | 0.35 | ↓16.7% |
3.2 合成场景规模影响
| 合成场景数 | L2误差 (m) | 碰撞率 (%) |
|---|---|---|
| 0(仅真实) | 0.89 | 0.42 |
| 1,000 | 0.86 | 0.39 |
| 5,000 | 0.84 | 0.36 |
| 10,000 | 0.83 | 0.35 |
结论: 合成场景越多,性能越好,边际递减在10K场景
3.3 预测性能
| 指标 | 仅真实数据 | +SynAD合成 | 提升 |
|---|---|---|---|
| minADE (m) | 0.87 | 0.80 | ↓8.0% |
| minFDE (m) | 1.72 | 1.58 | ↓8.1% |
| MR (%) | 0.38 | 0.35 | ↓7.9% |

图4:合成场景规模对性能的影响
四、关键技术细节
4.1 Ego车辆选择
问题: 合成场景有多个智能体,谁是Ego?
解决: 选择信息最丰富的车辆
1 | |
| 车辆 | 行驶距离 | 信息完整度 | 得分 |
|---|---|---|---|
| 车辆A | 100m | 80% | 80 |
| 车辆B | 50m | 90% | 45 |
| 车辆C | 200m | 85% | 170 ✅ |
4.2 场景生成引导
多目标优化:
1 | |
| 引导函数 | 作用 |
|---|---|
| 碰撞引导 | 生成危险场景 |
| 速度引导 | 生成超速场景 |
| 车道偏离引导 | 生成异常轨迹 |

图5:合成场景生成示例
五、对自动驾驶的启示
5.1 直接应用场景
| SynAD技术 | 应用场景 |
|---|---|
| Map-to-BEV | 无传感器生成BEV特征 |
| 合成+真实联合训练 | 数据增强策略 |
| Ego车辆选择 | 多目标场景主目标识别 |
5.2 数据增强策略
短期:
- 合成数据占比 10-20%
- 聚焦长尾场景
中期:
- 开发专用场景描述→BEV映射
- 验证规划/预测模块效果
长期:
- 端到端合成数据平台
- 与真实数据闭环迭代
5.3 局限性
| 局限 | 说明 |
|---|---|
| 仿真到真实差距 | 合成场景与真实场景存在domain gap |
| 场景多样性 | 依赖场景生成算法的能力 |
| 计算成本 | 大规模场景生成需要算力 |
六、论文信息
- 标题: SynAD: Enhancing Real-World End-to-End Autonomous Driving Models through Synthetic Data Integration
- 会议: ICCV 2025
- 作者: Jongsuk Kim, Jaeyoung Lee et al.
- 机构: KAIST + Samsung Electronics
总结
SynAD 首次实现了合成场景到真实E2E模型的无缝集成,核心创新是 Map-to-BEV网络,无需传感器数据即可生成BEV特征。实验证明,合成数据可以显著提升模型的安全性能(碰撞率降低16.7%)。
关键价值:
- ✅ 低成本数据增强方案
- ✅ 无需传感器渲染
- ✅ 可扩展到多种场景
适用场景:
- 长尾场景数据补充
- 危险场景安全训练
- 数据采集成本优化
核心论文引用:
“SynAD effectively integrates all components and notably enhances safety performance. By bridging synthetic scenario generation and E2E AD, SynAD paves the way for more comprehensive and robust autonomous driving models.”
SynAD:用合成数据增强端到端自动驾驶模型
https://dapalm.com/2026/03/08/SynAD合成数据增强自动驾驶模型/