MediaPipe 系列 34-40:其他内置 Solution 概览

一、Audio Classification

1.1 功能

特性 说明
输入 音频流
输出 音频类别 + 置信度
应用 语音唤醒、环境音识别

1.2 Graph

1
2
3
4
5
node {
calculator: "AudioClassificationCalculator"
input_stream: "AUDIO:audio"
output_stream: "CLASSIFICATIONS:classifications"
}

二、Text Detection

2.1 功能

特性 说明
功能 文本检测 + OCR
输出 文本框 + 识别结果

2.2 Graph

1
2
3
4
5
node {
calculator: "TextDetectionCalculator"
input_stream: "IMAGE:image"
output_stream: "TEXT:text_regions"
}

三、Gesture Recognition

3.1 功能

特性 说明
输入 Hand Landmarks
输出 手势类别
预置手势 7 种常见手势

四、Object Tracking

4.1 功能

特性 说明
功能 多目标追踪
输出 目标 ID + 位置

五、总结

Solution 功能 应用
Audio Classification 音频分类 语音唤醒
Text Detection 文本检测 OCR
Gesture Recognition 手势识别 交互控制
Object Tracking 目标追踪 多目标监控

系列进度: 34-40/55
更新时间: 2026-03-12


MediaPipe 系列 34-40:其他内置 Solution 概览
https://dapalm.com/2026/03/12/MediaPipe系列34-40:其他内置Solution概览/
作者
Mars
发布于
2026年3月12日
许可协议