راهنمای تشخیص نقطه عطف

وظیفه MediaPipe Pose Landmarker به شما امکان می دهد نشانه های بدن انسان را در یک تصویر یا ویدیو تشخیص دهید. شما می توانید از این کار برای شناسایی مکان های کلیدی بدن، تجزیه و تحلیل وضعیت بدن و دسته بندی حرکات استفاده کنید. این کار از مدل‌های یادگیری ماشینی (ML) استفاده می‌کند که با تصاویر یا ویدیوهای منفرد کار می‌کنند. وظیفه خروجی نقاط عطف ژست بدن در مختصات تصویر و در مختصات جهان سه بعدی است.

آن را امتحان کنید!

شروع کنید

استفاده از این کار را با دنبال کردن راهنمای پیاده سازی پلت فرم مورد نظر خود شروع کنید. این راهنماهای مخصوص پلتفرم شما را از طریق اجرای اساسی این کار، از جمله یک مدل توصیه شده، و نمونه کد با گزینه های پیکربندی توصیه شده، راهنمایی می کنند:

جزئیات کار

این بخش قابلیت ها، ورودی ها، خروجی ها و گزینه های پیکربندی این کار را شرح می دهد.

امکانات

  • پردازش تصویر ورودی - پردازش شامل چرخش تصویر، تغییر اندازه، عادی سازی و تبدیل فضای رنگی است.
  • آستانه امتیاز - نتایج را بر اساس نمرات پیش بینی فیلتر کنید.
ورودی های وظیفه خروجی های وظیفه
Pose Landmarker ورودی یکی از انواع داده های زیر را می پذیرد:
  • تصاویر ثابت
  • فریم های ویدئویی رمزگشایی شده
  • فید ویدیوی زنده
Pose Landmarker نتایج زیر را به دست می دهد:
  • نقاط عطف را در مختصات تصویر عادی قرار دهید
  • نقاط عطف را در مختصات جهانی قرار دهید
  • اختیاری: یک ماسک تقسیم بندی برای ژست.

گزینه های پیکربندی

این کار دارای گزینه های پیکربندی زیر است:

نام گزینه شرح محدوده ارزش مقدار پیش فرض
running_mode حالت اجرا را برای کار تنظیم می کند. سه حالت وجود دارد:

IMAGE: حالت برای ورودی های تک تصویر.

VIDEO: حالت برای فریم های رمزگشایی شده یک ویدیو.

LIVE_STREAM: حالت پخش زنده داده های ورودی، مانند دوربین. در این حالت، resultListener باید فراخوانی شود تا شنونده ای را برای دریافت نتایج به صورت ناهمزمان تنظیم کند.
{ IMAGE, VIDEO, LIVE_STREAM } IMAGE
num_poses حداکثر تعداد پوزی که می تواند توسط Pose Landmarker شناسایی شود. Integer > 0 1
min_pose_detection_confidence حداقل امتیاز اطمینان برای تشخیص پوس موفق در نظر گرفته شود. Float [0.0,1.0] 0.5
min_pose_presence_confidence حداقل امتیاز اطمینان امتیاز حضور پوز در تشخیص نقطه عطف پوس. Float [0.0,1.0] 0.5
min_tracking_confidence حداقل امتیاز اطمینان برای ردیابی ژست موفقیت آمیز در نظر گرفته شود. Float [0.0,1.0] 0.5
output_segmentation_masks آیا Pose Landmarker یک ماسک تقسیم‌بندی را برای ژست شناسایی شده خروجی می‌دهد یا خیر. Boolean False
result_callback شنونده نتیجه را طوری تنظیم می کند که وقتی Pose Landmarker در حالت پخش زنده است، نتایج نشانگر را به صورت ناهمزمان دریافت کند. فقط زمانی قابل استفاده است که حالت اجرا روی LIVE_STREAM تنظیم شده باشد ResultListener N/A

مدل ها

Pose Landmarker از مجموعه ای از مدل ها برای پیش بینی نشانه های ژست استفاده می کند. مدل اول حضور اجساد انسان را در یک قاب تصویر تشخیص می دهد و مدل دوم نقاط عطف را بر روی اجساد مشخص می کند.

مدل های زیر با هم در یک بسته مدل قابل دانلود بسته بندی می شوند:

  • مدل تشخیص پوس : وجود اجساد را با چند نشانه کلیدی تشخیص می دهد.
  • Pose Landmarker Model : یک نقشه کامل از ژست اضافه می کند. این مدل تخمینی از 33 نشانه 3 بعدی را ارائه می دهد.

این بسته از یک شبکه عصبی کانولوشنال مشابه MobileNetV2 استفاده می‌کند و برای برنامه‌های تناسب اندام روی دستگاه و در زمان واقعی بهینه شده است. این نوع از مدل BlazePose از GHUM ، یک خط لوله مدل‌سازی شکل انسان سه بعدی، برای تخمین وضعیت بدن سه بعدی کامل یک فرد در تصاویر یا ویدیوها استفاده می‌کند.

بسته مدل شکل ورودی نوع داده کارت های مدل نسخه ها
نشانگر ژست (لایت) آشکارساز پوس: 224 x 224 x 3
نشانگر ژست: 256 x 256 x 3
شناور 16 اطلاعات آخرین
نشانگر ژست (کامل) آشکارساز پوس: 224 x 224 x 3
نشانگر ژست: 256 x 256 x 3
شناور 16 اطلاعات آخرین
نشانگر ژست (سنگین) آشکارساز پوس: 224 x 224 x 3
نشانگر ژست: 256 x 256 x 3
شناور 16 اطلاعات آخرین

مدل نشانگر ژست

مدل نشانگر ژست 33 مکان مشخصه بدن را ردیابی می کند که نشان دهنده مکان تقریبی قسمت های بدن زیر است:

0 - nose
1 - left eye (inner)
2 - left eye
3 - left eye (outer)
4 - right eye (inner)
5 - right eye
6 - right eye (outer)
7 - left ear
8 - right ear
9 - mouth (left)
10 - mouth (right)
11 - left shoulder
12 - right shoulder
13 - left elbow
14 - right elbow
15 - left wrist
16 - right wrist
17 - left pinky
18 - right pinky
19 - left index
20 - right index
21 - left thumb
22 - right thumb
23 - left hip
24 - right hip
25 - left knee
26 - right knee
27 - left ankle
28 - right ankle
29 - left heel
30 - right heel
31 - left foot index
32 - right foot index

خروجی مدل شامل مختصات نرمال شده ( Landmarks ) و مختصات جهان ( WorldLandmarks ) برای هر نقطه عطف است.