Python 设置指南

本页介绍如何设置开发环境,以在 Python 应用中使用 MediaPipe Tasks。

支持的平台和版本

使用 MediaPipe Tasks 构建应用需要以下开发环境资源:

  • 操作系统:
    • 桌面设备:Windows、Mac、Linux
    • IoT:Raspberry OS 64 位
  • Python:版本 3.9 - 3.12
  • 画中画:20.3 版及更高版本

开发者环境设置

在 Python 应用上运行 MediaPipe 任务之前,请安装 MediaPipe 软件包。

$ python -m pip install mediapipe

安装软件包后,将其导入开发项目。

import mediapipe as mp

MediaPipe Tasks 依赖项

MediaPipe Tasks 提供了三个预构建的视觉、文本和音频库。根据应用使用的 MediaPipe Task,将视觉、文本或音频库导入您的开发项目。

视觉任务

MediaPipe Tasks 视觉模块包含用于处理图片或视频输入的任务。如需导入 MediaPipe Tasks Vision 库,请将以下依赖项导入到您的开发项目中。

from mediapipe.tasks.python import vision

文本任务

MediaPipe Tasks 文本模块包含处理字符串输入的任务。如需导入 MediaPipe Tasks 文本库,请将以下依赖项导入您的开发项目中。

from mediapipe.tasks.python import text

音频任务

MediaPipe Tasks 音频模块包含用于处理声音输入的任务。如需导入 MediaPipe Tasks 音频库,请将以下依赖项导入到您的开发项目中。

from mediapipe.tasks.python import audio

BaseOptions 配置

BaseOptions 支持对 MediaPipe Task API 进行常规配置。

选项名称 说明 已接受的值
model_asset_buffer 模型资产文件内容。 将模型内容作为字节字符串
model_asset_path 要打开并映射到内存的模型资源的路径。 字符串形式的文件路径

问题排查

如有与 MediaPipe 相关的技术问题,请访问论坛Stack Overflow 以获得社区支持。如需报告 bug 或提出功能请求,请在 GitHub 上提交问题

如需有关设置 Python 开发环境的帮助,请访问 Python 开发者指南