一、Audio Classification
1.1 功能
| 特性 |
说明 |
| 输入 |
音频流 |
| 输出 |
音频类别 + 置信度 |
| 应用 |
语音唤醒、环境音识别 |
1.2 Graph
1 2 3 4 5
| node { calculator: "AudioClassificationCalculator" input_stream: "AUDIO:audio" output_stream: "CLASSIFICATIONS:classifications" }
|
二、Text Detection
2.1 功能
| 特性 |
说明 |
| 功能 |
文本检测 + OCR |
| 输出 |
文本框 + 识别结果 |
2.2 Graph
1 2 3 4 5
| node { calculator: "TextDetectionCalculator" input_stream: "IMAGE:image" output_stream: "TEXT:text_regions" }
|
三、Gesture Recognition
3.1 功能
| 特性 |
说明 |
| 输入 |
Hand Landmarks |
| 输出 |
手势类别 |
| 预置手势 |
7 种常见手势 |
四、Object Tracking
4.1 功能
| 特性 |
说明 |
| 功能 |
多目标追踪 |
| 输出 |
目标 ID + 位置 |
五、总结
| Solution |
功能 |
应用 |
| Audio Classification |
音频分类 |
语音唤醒 |
| Text Detection |
文本检测 |
OCR |
| Gesture Recognition |
手势识别 |
交互控制 |
| Object Tracking |
目标追踪 |
多目标监控 |
系列进度: 34-40/55
更新时间: 2026-03-12