SynAD：用合成数据增强端到端自动驾驶模型

前言

自动驾驶数据采集成本高昂，长尾场景难以获取。SynAD (ICCV 2025) 提出了一种创新方案：生成合成场景，直接增强真实世界的端到端自动驾驶模型，无需传感器数据，碰撞率降低16.7%。

图1：SynAD 核心概念 - 合成数据增强真实模型

一、核心问题

现有方案的局限

方法	局限性
真实数据采集	成本高、长尾场景难获取、标注周期长
仿真器训练（CARLA）	虚拟环境，迁移到真实场景效果差
路径生成方法	只生成轨迹，无传感器数据

SynAD 解决方案

1	`合成场景生成 → Ego车辆选择 → Map-to-BEV网络 → 真实模型增强`

核心创新：

✅ 选择信息最丰富的车辆作为Ego
✅ Map-to-BEV无需传感器输入
✅ 合成+真实数据联合训练

二、技术架构

2.1 整体流程

┌─────────────────────────────────────────────────────┐
│                   训练阶段                           │
│  真实数据 ──→ 多相机图像 ──→ BEV特征 ──┐            │
│                                        ├──→ E2E模型 │
│  合成场景 ──→ 地图投影 ──→ MapBEV特征 ──┘            │
└─────────────────────────────────────────────────────┘

┌─────────────────────────────────────────────────────┐
│                   测试阶段                           │
│  真实数据 ──→ 多相机图像 ──→ BEV特征 ──→ E2E模型    │
└─────────────────────────────────────────────────────┘

SynAD 架构
图2：SynAD 整体架构

2.2 Map-to-BEV 网络

核心思想： 从地图直接生成BEV特征，无需渲染相机图像

传统方法	SynAD方法
相机图像 → CNN → BEV	地图+位置 → MLP → BEV
需要传感器数据	无需传感器数据
渲染成本高	计算高效

图3：Map-to-BEV 网络结构

输入：

地图（道路布局、车道线）
车辆位置信息

输出：

BEV特征（与真实传感器提取一致）

三、实验结果

3.1 规划性能提升

指标	仅真实数据	+SynAD合成	提升
L2误差 (m)	0.89	0.83	↓6.7%
碰撞率 (%)	0.42	0.35	↓16.7%

3.2 合成场景规模影响

合成场景数	L2误差 (m)	碰撞率 (%)
0（仅真实）	0.89	0.42
1,000	0.86	0.39
5,000	0.84	0.36
10,000	0.83	0.35

结论： 合成场景越多，性能越好，边际递减在10K场景

3.3 预测性能

指标	仅真实数据	+SynAD合成	提升
minADE (m)	0.87	0.80	↓8.0%
minFDE (m)	1.72	1.58	↓8.1%
MR (%)	0.38	0.35	↓7.9%

实验结果对比
图4：合成场景规模对性能的影响

四、关键技术细节

4.1 Ego车辆选择

问题： 合成场景有多个智能体，谁是Ego？

解决： 选择信息最丰富的车辆

1	`Score = 行驶距离 × 信息完整度`

车辆	行驶距离	信息完整度	得分
车辆A	100m	80%	80
车辆B	50m	90%	45
车辆C	200m	85%	170 ✅

4.2 场景生成引导

多目标优化：

1	`Loss = λ_collision × L_collision + λ_speed × L_speed + ...`

引导函数	作用
碰撞引导	生成危险场景
速度引导	生成超速场景
车道偏离引导	生成异常轨迹

图5：合成场景生成示例

五、对自动驾驶的启示

5.1 直接应用场景

SynAD技术	应用场景
Map-to-BEV	无传感器生成BEV特征
合成+真实联合训练	数据增强策略
Ego车辆选择	多目标场景主目标识别

5.2 数据增强策略

短期：

合成数据占比 10-20%
聚焦长尾场景

中期：

开发专用场景描述→BEV映射
验证规划/预测模块效果

长期：

端到端合成数据平台
与真实数据闭环迭代

5.3 局限性

局限	说明
仿真到真实差距	合成场景与真实场景存在domain gap
场景多样性	依赖场景生成算法的能力
计算成本	大规模场景生成需要算力

六、论文信息

标题： SynAD: Enhancing Real-World End-to-End Autonomous Driving Models through Synthetic Data Integration
会议： ICCV 2025
作者： Jongsuk Kim, Jaeyoung Lee et al.
机构： KAIST + Samsung Electronics

总结

SynAD 首次实现了合成场景到真实E2E模型的无缝集成，核心创新是 Map-to-BEV网络，无需传感器数据即可生成BEV特征。实验证明，合成数据可以显著提升模型的安全性能（碰撞率降低16.7%）。

关键价值：

✅ 低成本数据增强方案
✅ 无需传感器渲染
✅ 可扩展到多种场景

适用场景：

长尾场景数据补充
危险场景安全训练
数据采集成本优化

核心论文引用：
“SynAD effectively integrates all components and notably enhances safety performance. By bridging synthetic scenario generation and E2E AD, SynAD paves the way for more comprehensive and robust autonomous driving models.”

论文解读 > 自动驾驶

#合成数据 #自动驾驶 #SynAD #ICCV2025 #E2E

SynAD：用合成数据增强端到端自动驾驶模型

https://dapalm.com/2026/03/08/SynAD合成数据增强自动驾驶模型/

作者

Mars

发布于

2026年3月8日

许可协议

SMPLest-X：大规模人体姿态估计基础模型上一篇

FileBrowser安装与配置完整指南：搭建自己的Web文件管理器下一篇