NVIDIA集中式雷达处理:L4自动驾驶感知的新范式
技术背景
GTC 2026上,NVIDIA与ChengTech演示了集中式雷达处理管线,在DRIVE AGX Thor上实时运行。这代表了汽车雷达架构的重大变革。

传统雷达架构的局限
边缘处理模式
传统汽车雷达采用边缘处理架构:
| 特性 | 边缘处理模式 |
|---|---|
| 处理位置 | 传感器内置SoC/FPGA |
| 输出 | 稀疏点云 |
| 数据量 | ~0.064 MB/帧 |
| 帧率 | ~20 FPS |
| 占空比 | <50% |
关键问题
- 信息损失:点云仅保留峰值检测,丢失约100倍数据
- 低帧率:占空比<50%限制时间分辨率
- 中间数据丢弃:Range-FFT、Doppler-FFT、Angle-FFT被丢弃
- 固定流水线:无法适配新算法
集中式雷达架构
核心创新
| 对比项 | 边缘处理 | 集中式处理 |
|---|---|---|
| 数据类型 | 点云 | 原始ADC |
| 数据量 | 0.064 MB/帧 | 6 MB/帧 |
| 帧率 | ~20 FPS | 30 FPS |
| 处理位置 | 传感器内置 | DRIVE平台 |
| 灵活性 | 固定 | 可编程 |
成本与效率
| 指标 | 改进 |
|---|---|
| 单元成本 | 降低30%+ |
| 体积 | 减少20% |
| 系统功耗 | 降低20% |
技术实现
硬件配置
五雷达阵列:
- 1个ChengTech 8T8R前向雷达
- 4个ChengTech 4T4R角雷达
数据流:
- 原始ADC数据:540 MB/s
- 等效点云:4.8 MB/s
PVA处理管线
**可编程视觉加速器(PVA)**特性:
| 参数 | 规格 |
|---|---|
| 架构 | VLIW + SIMD DSP |
| 组件 | 向量处理单元 + DMA + 本地内存 |
| 功耗 | 低功耗设计 |
| 运行方式 | 异步于CPU/GPU |
处理阶段:
- Range-FFT(快时间轴)
- Doppler-FFT(慢时间轴)
- 角度估计
- 点云生成
数据同步
- 雷达与摄像头硬件同步信号
- 时间戳对齐
- 多模态融合就绪
L4感知优势
1. 全信号保真
| 数据类型 | 可用性 | 应用 |
|---|---|---|
| 原始ADC | ✅ | 深度学习直接输入 |
| Range-FFT | ✅ | 距离分析 |
| Doppler-FFT | ✅ | 速度分析 |
| Angle-FFT | ✅ | 角度分辨率 |
| Range-Doppler图 | ✅ | 密集频谱结构 |
| 点云 | ✅ | 传统检测 |
2. 早期融合
支持方案:
- 雷达+摄像头特征融合
- 多雷达信号级融合
- VLA风格训练流程
3. 大模型支持
L4堆栈采用视觉-语言-动作(VLA)架构:
- 直接从原始传感器数据学习
- 雷达与其他传感器同等地位
- 支持端到端训练
IMS开发启示
短期(2026)
雷达数据评估
- 评估原始ADC数据价值
- 对比点云vs全信号方案
平台选型
- 关注DRIVE AGX Thor生态
- 评估PVA加速能力
中期(2027-2028)
多模态融合
- 雷达+摄像头早期融合
- Range-Doppler图分析
算法优化
- 自定义PVA流水线
- 信号级融合模型
长期(2029+)
VLA架构
- 原始传感器数据学习
- 端到端训练流程
集中式架构
- 雷达与其他传感器统一处理
- 软件定义感知管线
应用场景
座舱感知
60GHz集中式雷达可用于:
- 乘员检测
- 呼吸监测
- 心跳检测
- 儿童存在检测
外部感知
77GHz集中式雷达可用于:
- 远距离目标检测
- 恶劣天气感知
- 摄像头互补融合
技术路线图
雷达架构演进
| 时间 | 架构 | 特点 |
|---|---|---|
| 2024 | 边缘处理 | 固定流水线 |
| 2026 | 集中式处理 | 可编程管线 |
| 2028 | AI原生雷达 | 端到端学习 |
处理能力演进
| 时间 | GPU占用 | 特点 |
|---|---|---|
| 2024 | 高 | GPU处理雷达 |
| 2026 | 低 | PVA处理雷达 |
| 2028 | 最低 | 专用加速器 |
生态合作伙伴
雷达供应商
ChengTech:
- 首个原始雷达数据合作伙伴
- 8T8R前向雷达
- 4T4R角雷达
开发工具
- PVA SDK:自定义雷达流水线
- PVA Solutions:优化雷达算子库
- DRIVE Hyperion:生产级参考架构
总结
NVIDIA集中式雷达处理代表了L4感知的重要突破:
- 100倍数据增量:从点云到原始ADC
- 可编程管线:PVA加速,GPU释放
- 成本优化:单元成本降低30%
- 融合就绪:多模态早期融合
对于IMS开发团队:
- 集中式架构是未来方向
- PVA可显著降低GPU负载
- 原始雷达数据支持更丰富感知
- 需要评估集中式vs边缘方案
参考来源:
- NVIDIA Technical Blog: How Centralized Radar Processing on NVIDIA DRIVE Enables Safer, Smarter Level 4 Autonomy
- GTC 2026: NVIDIA + ChengTech Demo
- DRIVE AGX Thor Documentation
NVIDIA集中式雷达处理:L4自动驾驶感知的新范式
https://dapalm.com/2026/04/04/2026-04-04-NVIDIA-Centralized-Radar-Processing-L4/