このページでは、MediaPipe を使用する開発環境の設定方法について説明します。 Python アプリケーションのタスク。
サポートされているプラットフォームとバージョン
MediaPipe Tasks を使用してアプリケーションを構築するには、次の開発が必要です 環境リソース:
- OS:
<ph type="x-smartling-placeholder">
- </ph>
- パソコン: Windows、Mac、Linux
- IoT: Raspberry OS 64 ビット
- Python: バージョン 3.9 ~ 3.12
- PIP: バージョン 20.3 以降
開発環境のセットアップ
Python アプリケーションで MediaPipe タスクを実行する前に、MediaPipe をインストールします。 パッケージ化されています。
$ python -m pip install mediapipe
パッケージをインストールしたら、開発プロジェクトにインポートします。
import mediapipe as mp
MediaPipe Tasks の依存関係
MediaPipe Tasks には、ビジョン、テキスト、音声用の 3 つのビルド済みライブラリが用意されています。 アプリで使用される MediaPipe タスクに応じて、Vision、text、または 開発プロジェクトにコピーします。
視覚に関するタスク
MediaPipe Tasks ビジョン モジュールには、画像や動画を処理するタスクが含まれます できます。MediaPipe Tasks ビジョン ライブラリをインポートするには、以下をインポートします。 開発プロジェクトに組み込めます。
from mediapipe.tasks.python import vision
テキスト タスク
MediaPipe Tasks テキスト モジュールには、文字列入力を処理するタスクが含まれています。 MediaPipe Tasks テキスト ライブラリをインポートし、次の依存関係を 組み込むことが重要です
from mediapipe.tasks.python import text
音声タスク
MediaPipe Tasks オーディオ モジュールには、音声入力を処理するタスクが含まれています。宛先 MediaPipe Tasks オーディオ ライブラリをインポートし、次の依存関係を 開発プロジェクトに組み込めます
from mediapipe.tasks.python import audio
BaseOptions 構成
BaseOptions を使用すると、MediaPipe Task API の一般的な構成が可能になります。
オプション名 | 説明 | 有効な値 |
---|---|---|
model_asset_buffer |
モデルアセット ファイルの内容。 | バイト文字列としてモデル コンテンツを表示する |
model_asset_path |
モデルアセットを開いてメモリにマッピングするパス。 | 文字列としてのファイルパス |
トラブルシューティング
MediaPipe に関する技術的な質問については、 ディスカッション グループ、 Stack Overflow: コミュニティによるサポートも受けています。バグの報告や機能リクエストを行う際は、 GitHub で問題を報告してください。
Python 開発環境の設定については、 Python デベロッパー ガイド