MediaPipe Pose Drager 任務可讓你偵測圖片中人體的人物地標 影片。您可以用這項工作找出主要的身體位置、分析情況 以及分類運動這項工作採用的機器學習 (ML) 模型 適用於單一圖片或影片這項工作會輸出圖片中的身體姿勢地標 以及 3D 世界座標。
開始使用
請依照您的 目標廣告平台這些平台專屬指南將逐步說明 實作這項工作,包含建議模型和程式碼範例 下方列出建議的設定選項:
任務詳細資料
本節會說明功能、輸入、輸出內容和設定 這個工作的選項
功能
- 輸入圖片處理:處理的內容包括圖片旋轉、調整大小、正規化和色域轉換。
- 分數門檻:根據預測分數篩選結果。
工作輸入內容 | 工作輸出 |
---|---|
Pose 地標 er 接受以下任一資料類型的輸入內容:
|
Pose 地標 er 會輸出下列結果:
|
設定選項
這項工作包含下列設定選項:
選項名稱 | 說明 | 值範圍 | 預設值 |
---|---|---|---|
running_mode |
設定任務的執行模式。在架構中
模式: 圖片:單一圖片輸入模式。 VIDEO:影片已解碼的影格模式。 LIVE_STREAM:輸入串流模式 擷取的資訊等。 在此模式下, resultListener 設定接聽程式來接收結果 以非同步方式載入物件 |
{IMAGE, VIDEO, LIVE_STREAM } |
IMAGE |
num_poses |
可偵測的姿勢數量上限 擺好姿勢的地標師。 | Integer > 0 |
1 |
min_pose_detection_confidence |
姿勢偵測必須達到的最低可信度分數 。 | Float [0.0,1.0] |
0.5 |
min_pose_presence_confidence |
擺出姿勢的最低可信度分數 姿勢地標偵測結果的分數 | Float [0.0,1.0] |
0.5 |
min_tracking_confidence |
姿勢追蹤的最低可信度分數 才算是成功 | Float [0.0,1.0] |
0.5 |
output_segmentation_masks |
Pose 地標 er 是否會為偵測到的警示輸出區隔遮罩 姿勢。 | Boolean |
False |
result_callback |
設定結果事件監聽器以接收地標結果
以非同步方式顯示參與者
只有在執行模式設為「LIVE_STREAM 」時才能使用 |
ResultListener |
N/A |
模型
Pose 地標 er 使用一系列的模型來預測姿勢地標。第一個 模型會偵測圖片影格中是否有人類身體 模型可找出人體上的地標。
下列模型會封裝成可下載的模型組合:
- 姿勢偵測模型:偵測身體是否具有一些關鍵姿勢 地標。
- 姿勢地標模型:新增完整的姿勢對應。模型 輸出預估的 33D 立體姿勢地標。
這個套裝組合會使用卷積類神經網路 和 MobileNetV2 類似,且已經過最佳化 。這個 BlazePose 模型 GHUM、 3D 人體形狀建模管線,可用於估算轉折式圖片的完整 3D 身體姿態 或圖片中的人物
模型套裝組合 | 輸入形狀 | 資料類型 | 模型資訊卡 | 版本 |
---|---|---|---|---|
調整位置指標 (精簡) | 姿勢偵測器:224 x 224 x 3 姿勢地標:256 x 256 x 3 |
浮點值 16 | 資訊 | 最新 |
姿勢地標 (完整) | 姿勢偵測器:224 x 224 x 3 姿勢地標:256 x 256 x 3 |
浮點值 16 | 資訊 | 最新 |
姿勢地標 (重) | 姿勢偵測器:224 x 224 x 3 姿勢地標:256 x 256 x 3 |
浮點值 16 | 資訊 | 最新 |
姿勢地標模型
姿勢地標模型追蹤了 33 個人體地標位置,代表 下列人體部位的大概位置:
模型輸出內容包含正規化座標 (Landmarks
) 和世界
每個地標的座標 (WorldLandmarks
)。