Python の設定ガイド

このページでは、Python アプリケーションで MediaPipe タスクを使用するための開発環境を設定する方法について説明します。

サポートされているプラットフォームとバージョン

MediaPipe Tasks を使用してアプリケーションをビルドするには、次の開発環境リソースが必要です。

  • OS:
    • パソコン: Windows、Mac、Linux
    • IoT: Raspberry OS 64 ビット
  • Python: バージョン 3.8 ~ 3.11
  • PIP: バージョン 20.3 以降

開発環境の設定

Python アプリケーションで MediaPipe タスクを実行する前に、MediaPipe パッケージをインストールします。

$ python -m pip install mediapipe

パッケージをインストールしたら、開発プロジェクトにインポートします。

import mediapipe as mp

MediaPipe タスクの依存関係

MediaPipe Tasks には、ビジョン、テキスト、オーディオ用の 3 つのビルド済みライブラリが用意されています。アプリで使用する MediaPipe タスクに応じて、ビジョン、テキスト、またはオーディオ ライブラリを開発プロジェクトにインポートします。

視覚タスク

MediaPipe Tasks ビジョン モジュールには、画像または動画の入力を処理するタスクが含まれています。MediaPipe Tasks ビジョン ライブラリをインポートするには、次の依存関係を開発プロジェクトにインポートします。

from mediapipe.tasks.python import vision

テキストタスク

MediaPipe Tasks テキスト モジュールには、文字列入力を処理するタスクが含まれています。MediaPipe Tasks テキスト ライブラリをインポートするには、次の依存関係を開発プロジェクトにインポートします。

from mediapipe.tasks.python import text

音声タスク

MediaPipe Tasks のオーディオ モジュールには、音声入力を処理するタスクが含まれています。MediaPipe Tasks オーディオ ライブラリをインポートするには、次の依存関係を開発プロジェクトにインポートします。

from mediapipe.tasks.python import audio

BaseOptions 構成

BaseOptions を使用すると、MediaPipe Task API の一般的な構成が可能になります。

オプション名 説明 指定可能な値
model_asset_buffer モデルアセット ファイルの内容。 コンテンツをバイト文字列としてモデル化する
model_asset_path モデルアセットを開いてメモリにマッピングするパス。 文字列としてのファイルパス

トラブルシューティング

MediaPipe に関する技術的な質問については、ディスカッション グループまたは Stack Overflow にアクセスして、コミュニティからサポートを受けてください。バグの報告または機能リクエストを行う場合は、GitHub で問題を報告してください。

Python 開発環境の設定については、Python デベロッパー ガイドをご覧ください。