このページでは、Python アプリケーションで MediaPipe Tasks を使用するように開発環境を設定する方法について説明します。
サポートされているプラットフォームとバージョン
MediaPipe Tasks を使用してアプリケーションを構築するには、次の開発環境リソースが必要です。
- OS の場合:
- パソコン: Windows、Mac、Linux
- IoT: Raspberry OS 64 ビット
- Python: バージョン 3.9 ~ 3.12
- PIP: バージョン 20.3 以降
開発環境の設定
Python アプリケーションで MediaPipe タスクを実行する前に、MediaPipe パッケージをインストールします。
$ python -m pip install mediapipe
パッケージをインストールしたら、開発プロジェクトにインポートします。
import mediapipe as mp
MediaPipe Tasks の依存関係
MediaPipe Tasks には、ビジョン、テキスト、オーディオ用の 3 つのビルド済みライブラリが用意されています。アプリで使用する MediaPipe タスクに応じて、開発プロジェクトにビジョン、テキスト、またはオーディオ ライブラリをインポートします。
視覚に関するタスク
MediaPipe Tasks ビジョン モジュールには、画像または動画の入力を処理するタスクが含まれています。MediaPipe Tasks ビジョン ライブラリをインポートするには、開発プロジェクトに次の依存関係をインポートします。
from mediapipe.tasks.python import vision
テキスト タスク
MediaPipe Tasks テキスト モジュールには、文字列入力を処理するタスクが含まれています。MediaPipe Tasks テキスト ライブラリをインポートするには、次の依存関係を開発プロジェクトにインポートします。
from mediapipe.tasks.python import text
音声タスク
MediaPipe Tasks オーディオ モジュールには、音声入力を処理するタスクが含まれています。MediaPipe Tasks のオーディオ ライブラリをインポートするには、次の依存関係を開発プロジェクトにインポートします。
from mediapipe.tasks.python import audio
BaseOptions 構成
BaseOptions を使用すると、MediaPipe Task API の一般的な構成が可能になります。
オプション名 | 説明 | 指定可能な値 |
---|---|---|
model_asset_buffer |
モデルアセット ファイルの内容。 | バイト文字列としてモデル コンテンツを表示する |
model_asset_path |
モデルアセットを開いてメモリにマッピングするパス。 | 文字列としてのファイルパス |
トラブルシューティング
MediaPipe に関連する技術的な質問については、ヘルプグループまたは Stack Overflow でコミュニティのサポートを受けてください。バグの報告または機能リクエストを行うには、GitHub で問題を報告してください。
Python 開発環境の設定については、Python デベロッパー ガイドをご覧ください。