DMS 传感器融合：RGB + IR + 雷达构建鲁棒舱内感知

发表于 2026-04-13 更新于 2026-04-25 分类于技术研究

发布日期： 2026-04-13
标签： DMS, 传感器融合, RGB, IR, 雷达, Euro NCAP, 舱内监控
来源： Anyverse、Euro NCAP 2026 协议

单传感器的局限性

RGB 摄像头

优势	局限性
✅ 高语义细节（人脸、视线、行为）	❌ 依赖环境光
✅ 成熟的 CV 工具链	❌ 对眩光/阴影敏感
✅ 强特征提取能力	❌ 易被遮挡（手、墨镜、遮阳板）

最佳用途： 行为分类、人脸识别、视线追踪、姿态估计

红外（IR/NIR/ToF）

优势	局限性
✅ 黑暗中工作	❌ 反射材料问题
✅ 对光照变化鲁棒	❌ 上下文细节较少
✅ 强深度 + 3D 姿态线索	❌ 某些织物降低深度精度
✅ 可检测生理信号

最佳用途： 夜间 DMS、遮挡鲁棒姿态、生命体征

雷达（60-77GHz / 4D 雷达）

优势	局限性
✅ 光照独立	❌ 空间分辨率低
✅ 穿透毯子/衣物	❌ 语义理解差
✅ 检测微运动（呼吸、心跳）	❌ 杂波导致误报
✅ 强存在检测能力

最佳用途： 儿童存在检测、生命体征、占用检测

融合架构

为什么融合是必要

单传感器无法独立处理现代车辆内部的复杂性。融合不是选项，而是架构必要性。

┌────────────────────────────────────────────────────────┐
│           DMS 传感器融合架构                          │
├────────────────────────────────────────────────────────┤
│                                                        │
│  ┌─────────────┐  ┌─────────────┐  ┌─────────────┐   │
│  │ RGB 摄像头  │  │  IR 摄像头  │  │  60GHz 雷达 │   │
│  │             │  │             │  │             │   │
│  │ • 人脸检测  │  │ • 夜间眼动  │  │ • 呼吸检测  │   │
│  │ • 视线追踪  │  │ • 遮挡鲁棒  │  │ • 运动检测  │   │
│  │ • 行为识别  │  │ • 深度估计  │  │ • 存在检测  │   │
│  └──────┬──────┘  └──────┬──────┘  └──────┬──────┘   │
│         │                │                │           │
│         ↓                ↓                ↓           │
│  ┌─────────────────────────────────────────────┐      │
│  │              数据对齐层                      │      │
│  │  • 时间同步                                 │      │
│  │  • 空间标定                                 │      │
│  │  • 数据格式统一                             │      │
│  └───────────────────┬─────────────────────────┘      │
│                      ↓                                 │
│  ┌─────────────────────────────────────────────┐      │
│  │              特征融合层                      │      │
│  │  • RGB 特征：人脸/视线/行为                │      │
│  │  • IR 特征：眼动/深度/姿态                 │      │
│  │  • 雷达特征：呼吸/运动/存在                │      │
│  └───────────────────┬─────────────────────────┘      │
│                      ↓                                 │
│  ┌─────────────────────────────────────────────┐      │
│  │              决策融合层                      │      │
│  │  • 分心检测：RGB + IR 融合                  │      │
│  │  • 疲劳检测：RGB + IR 融合                  │      │
│  │  • 损伤检测：RGB + IR + 驾驶行为            │      │
│  │  • CPD：雷达主导 + IR 辅助                  │      │
│  └───────────────────┬─────────────────────────┘      │
│                      ↓                                 │
│  ┌─────────────────────────────────────────────┐      │
│  │              输出层                          │      │
│  │  • 警告等级（1-3 级）                       │      │
│  │  • ADAS 联动信号                            │      │
│  │  • CPD 警报                                 │      │
│  └─────────────────────────────────────────────┘      │
│                                                        │
└────────────────────────────────────────────────────────┘

融合策略

早期融合（像素级）

方法	说明
RGB + IR 拼接	将 RGB 和 IR 图像拼接为多通道输入
优势	简单、端到端训练
劣势	需要精确配准

中期融合（特征级）

方法	说明
特征拼接	分别提取特征后拼接
注意力融合	使用注意力机制加权融合
优势	灵活、可解释
劣势	需要设计融合网络

晚期融合（决策级）

方法	说明
投票机制	各模态独立决策后投票
置信度加权	根据各模态置信度加权
优势	鲁棒、可处理传感器失效
劣势	丢失跨模态信息

场景化融合方案

白天 DMS

传感器	权重	用途
RGB	70%	人脸检测、视线追踪、行为识别
IR	30%	辅助深度估计

夜间 DMS

传感器	权重	用途
IR	80%	眼动追踪、姿态估计
RGB	20%	辅助语义理解

墨镜场景

传感器	权重	用途
IR	90%	穿透墨镜检测眼动
RGB	10%	辅助头部姿态
雷达	可选	辅助存在检测

CPD 场景

传感器	权重	用途
雷达	80%	呼吸检测、运动检测
IR	20%	辅助视觉确认

传感器对比总结

传感器	语义	夜间	遮挡	深度	生命体征	成本
RGB	⭐⭐⭐	❌	❌	❌	❌	$
IR	⭐⭐	⭐⭐⭐	⭐	⭐⭐	⭐	$$
ToF	⭐	⭐⭐⭐	⭐	⭐⭐⭐	⭐	$$$
雷达	❌	⭐⭐⭐	⭐⭐⭐	⭐	⭐⭐⭐	$$

技术实现

融合网络架构

import torch
import torch.nn as nn

class DMSFusionNetwork(nn.Module):
    """
    DMS 多模态融合网络
    """
    
    def __init__(self):
        super().__init__()
        
        # RGB 特征提取
        self.rgb_backbone = ResNet18(pretrained=True)
        self.rgb_pool = nn.AdaptiveAvgPool2d(1)
        
        # IR 特征提取
        self.ir_backbone = ResNet18(pretrained=True)
        self.ir_pool = nn.AdaptiveAvgPool2d(1)
        
        # 雷达特征提取
        self.radar_encoder = nn.Sequential(
            nn.Linear(128, 256),
            nn.ReLU(),
            nn.Linear(256, 128)
        )
        
        # 融合层
        self.fusion = nn.MultiheadAttention(
            embed_dim=512,
            num_heads=8,
            batch_first=True
        )
        
        # 分类头
        self.classifier = nn.Sequential(
            nn.Linear(512, 256),
            nn.ReLU(),
            nn.Linear(256, 4)  # 正常/分心/疲劳/损伤
        )
    
    def forward(self, rgb, ir, radar):
        """
        前向传播
        
        参数:
            rgb: RGB 图像 (B, 3, H, W)
            ir: IR 图像 (B, 1, H, W)
            radar: 雷达特征 (B, 128)
        """
        # RGB 特征
        rgb_feat = self.rgb_backbone(rgb)
        rgb_feat = self.rgb_pool(rgb_feat).flatten(1)  # (B, 512)
        
        # IR 特征
        ir_feat = self.ir_backbone(ir)
        ir_feat = self.ir_pool(ir_feat).flatten(1)  # (B, 512)
        
        # 雷达特征
        radar_feat = self.radar_encoder(radar)  # (B, 128)
        
        # 特征拼接
        # 将雷达特征扩展到 512 维
        radar_feat = nn.functional.pad(radar_feat, (0, 384))
        
        # 多模态注意力融合
        multi_modal = torch.stack([rgb_feat, ir_feat, radar_feat], dim=1)  # (B, 3, 512)
        fused, _ = self.fusion(multi_modal, multi_modal, multi_modal)
        fused = fused.mean(dim=1)  # (B, 512)
        
        # 分类
        output = self.classifier(fused)
        
        return output

开发启示

传感器选型建议

场景	推荐方案
成本敏感	RGB 单摄（白天） + IR 单摄（夜间）
标准方案	RGB-IR 双摄 + 60GHz 雷达
高端方案	RGB + ToF + 4D 雷达

融合优先级

优先级	融合组合
P0	RGB + IR（基础 DMS）
P1	RGB + IR + 雷达（DMS + CPD）
P2	RGB + ToF + 雷达（高端 OMS）

验证测试

测试项	方法
光照鲁棒性	不同光照条件测试
夜间性能	全黑环境测试
遮挡鲁棒性	墨镜/口罩测试
融合失效	单传感器失效测试

参考资料

开发启示： 单传感器无法满足 Euro NCAP 2026 全场景要求。RGB 提供语义、IR 提供鲁棒性、雷达提供生命体征。融合是架构必要性，不是选项。推荐 RGB + IR + 60GHz 雷达的标准方案。