このページでは、Python アプリケーションで MediaPipe タスクを使用するための開発環境を設定する方法について説明します。
サポートされているプラットフォームとバージョン
MediaPipe Tasks を使用してアプリケーションをビルドするには、次の開発環境リソースが必要です。
- OS:
- パソコン: Windows、Mac、Linux
- IoT: Raspberry OS 64 ビット
- Python: バージョン 3.8 ~ 3.11
- PIP: バージョン 20.3 以降
開発環境の設定
Python アプリケーションで MediaPipe タスクを実行する前に、MediaPipe パッケージをインストールします。
$ python -m pip install mediapipe
パッケージをインストールしたら、開発プロジェクトにインポートします。
import mediapipe as mp
MediaPipe タスクの依存関係
MediaPipe Tasks には、ビジョン、テキスト、オーディオ用の 3 つのビルド済みライブラリが用意されています。アプリで使用する MediaPipe タスクに応じて、ビジョン、テキスト、またはオーディオ ライブラリを開発プロジェクトにインポートします。
視覚タスク
MediaPipe Tasks ビジョン モジュールには、画像または動画の入力を処理するタスクが含まれています。MediaPipe Tasks ビジョン ライブラリをインポートするには、次の依存関係を開発プロジェクトにインポートします。
from mediapipe.tasks.python import vision
テキストタスク
MediaPipe Tasks テキスト モジュールには、文字列入力を処理するタスクが含まれています。MediaPipe Tasks テキスト ライブラリをインポートするには、次の依存関係を開発プロジェクトにインポートします。
from mediapipe.tasks.python import text
音声タスク
MediaPipe Tasks のオーディオ モジュールには、音声入力を処理するタスクが含まれています。MediaPipe Tasks オーディオ ライブラリをインポートするには、次の依存関係を開発プロジェクトにインポートします。
from mediapipe.tasks.python import audio
BaseOptions 構成
BaseOptions を使用すると、MediaPipe Task API の一般的な構成が可能になります。
オプション名 | 説明 | 指定可能な値 |
---|---|---|
model_asset_buffer |
モデルアセット ファイルの内容。 | コンテンツをバイト文字列としてモデル化する |
model_asset_path |
モデルアセットを開いてメモリにマッピングするパス。 | 文字列としてのファイルパス |
トラブルシューティング
MediaPipe に関する技術的な質問については、ディスカッション グループまたは Stack Overflow にアクセスして、コミュニティからサポートを受けてください。バグの報告または機能リクエストを行う場合は、GitHub で問題を報告してください。
Python 開発環境の設定については、Python デベロッパー ガイドをご覧ください。