InCaRPose:车内相机姿态估计新突破

前言

车内摄像头通常安装在后视镜等可调节位置,外参会随驾驶员调整而变化。如何实时校准相机姿态?Aptiv 与 Wuppertal 大学合作发表的 InCaRPose 论文提供了创新解决方案。


一、问题背景

1.1 车内相机标定挑战

挑战 说明
外参动态变化 后视镜调节导致相机姿态改变
鱼眼畸变 宽视角镜头畸变严重
标定困难 车内空间有限,难以获取真值
实时性要求 安全应用需要实时校准

1.2 应用场景

场景 时间要求
驾驶员眼动追踪 需要准确的空间位置
乘员位置感知 气囊部署需要毫秒级响应
手势识别 需要准确的三维定位

二、InCaRPose 核心创新

2.1 参考相对姿态预测

传统方案 InCaRPose 方案
车辆坐标系绝对姿态 相对于参考帧的相对姿态
需要车辆特定训练 车辆无关,无需重训

2.2 架构设计

1
2
3
4
5
6
7
8
9
参考图像 + 目标图像

冻结 ViT 编码器(DINOv3)

Transformer 交叉注意力解码器

MLP 预测头

相对姿态(旋转 + 平移)

2.3 关键特性

特性 说明
冻结骨干 仅训练解码器和预测头
合成数据训练 仅需 6500 对合成图像
端到端鱼眼处理 无需去畸变预处理
度量平移输出 输出真实米制单位

三、实验结果

3.1 In-Cabin-Pose 数据集

指标 结果
平移误差(中位数) 0.07 m
旋转误差(中位数) 2.75°
推理速度 > 70 FPS(RTX 4090)

3.2 与基线对比

方案 平移误差 旋转误差
InCaRPose-Large 0.07 m 2.75°
Reloc3r 仅方向 3.14°
SIFT 匹配 仅方向 4.52°

3.3 7-Scenes 数据集

指标 InCaRPose Reloc3r
旋转误差(均值) 2.21° 6.37°
平移误差(中位数) 0.13 m 仅方向

四、技术细节

4.1 旋转表示

表示方式 维度
四元数 4D + 3D 平移 = 7D
旋转向量 3D + 3D 平移 = 6D
旋转矩阵 9D + 3D 平移 = 12D

最佳选择:四元数 + 四元数损失

4.2 数据增强

增强 说明
ColorJitter 亮度、对比度、饱和度、色调
零填充 保持全视场,不裁剪
多车辆合成 8 辆训练,3 辆验证

4.3 真值获取

方法 优势
ArUco 标记 度量真值,鲁棒
COLMAP SfM 无需标记,但有尺度模糊

五、对 IMS 开发的启示

5.1 相机校准策略

场景 方案
生产校准 标准参考帧存储
在线校准 InCaRPose 实时估计相对姿态
校准验证 定期检查外参变化

5.2 实现要点

要点 说明
参考帧定义 标准后视镜位置的相机姿态
相对姿态估计 检测镜面调整后的相对变化
姿态更新 实时更新眼动追踪的空间映射

5.3 精度要求

应用 精度要求
疲劳检测 中等(姿态偏差容忍度高)
视线追踪 高(需要准确的空间映射)
气囊部署 极高(毫秒级,厘米级)

六、未来方向

6.1 论文提出

方向 说明
遮挡鲁棒性 乘员和物品遮挡场景
动态乘员 复杂动态座舱环境

6.2 实际应用考虑

考虑 说明
多相机融合 多个 DMS/OMS 相机联合校准
温度补偿 温度变化影响镜头和安装
长期漂移 长期使用后的校准漂移

总结

InCaRPose 的核心贡献:

  1. 参考相对姿态预测:车辆无关,无需重训
  2. 合成到真实泛化:仅 6500 对合成图像
  3. 度量平移输出:真实米制单位
  4. 实时性能:> 70 FPS
  5. 鱼眼端到端:无需去畸变

对于 IMS 开发,在线相机校准是提升眼动追踪精度的关键


参考来源:

发布日期: 2026-04-10


InCaRPose:车内相机姿态估计新突破
https://dapalm.com/2026/04/10/2026-04-10-InCaRPose-In-Cabin-Camera-Pose-Estimation/
作者
Mars
发布于
2026年4月10日
许可协议