आस-पास मौजूद लैंडमार्क का पता लगाने वाली गाइड

MediaPipe पोज़ लैंडमार्कर टास्क से, आपको किसी इमेज में इंसानी शरीर के लैंडमार्क का पता लगाने की सुविधा मिलती है या वीडियो. इस टास्क की मदद से, शरीर की प्रमुख जगहों की पहचान की जा सकती है, पॉस्चर का विश्लेषण किया जा सकता है, और गतिविधियों को अलग-अलग कैटगरी में बांट सकता है. यह टास्क, मशीन लर्निंग (एमएल) मॉडल का इस्तेमाल करता है अलग-अलग इमेज या वीडियो के साथ काम करते हैं. टास्क, इमेज में बॉडी पोज़ लैंडमार्क दिखाता है निर्देशांकों और 3-आयामी दुनिया के निर्देशांकों में भी देखा जा सकता है.

इसे आज़माएं!

शुरू करें

इस टास्क का इस्तेमाल शुरू करने के लिए, लागू करने की गाइड में बताए गए तरीके का पालन करें टारगेट प्लैटफ़ॉर्म पर लागू होता है. प्लैटफ़ॉर्म के हिसाब से, इन गाइड से आपको बुनियादी चीज़ों के बारे में जानकारी मिलेगी इस टास्क को लागू करने की प्रोसेस. इसमें, सुझाया गया मॉडल और कोड का उदाहरण भी शामिल है सुझाए गए कॉन्फ़िगरेशन विकल्पों के साथ:

टास्क की जानकारी

इस सेक्शन में सुविधाओं, इनपुट, आउटपुट, और कॉन्फ़िगरेशन के बारे में बताया गया है इस टास्क के विकल्प देखें.

सुविधाएं

  • इनपुट इमेज प्रोसेसिंग - प्रोसेसिंग में इमेज रोटेशन, साइज़ बदलना, नॉर्मलाइज़ेशन, और कलर स्पेस कन्वर्ज़न शामिल हैं.
  • स्कोर थ्रेशोल्ड - अनुमान के स्कोर के आधार पर नतीजों को फ़िल्टर करें.
टास्क के इनपुट टास्क के आउटपुट
पोज़ लैंडमार्कर, इनमें से किसी एक डेटा टाइप के इनपुट को स्वीकार करता है:
  • फ़ोटो
  • डिकोड किए गए वीडियो फ़्रेम
  • लाइव वीडियो फ़ीड
पोज़ लैंडमार्कर से ये नतीजे मिलते हैं:
  • लैंडमार्क को सामान्य इमेज के कोऑर्डिनेट में दिखाएं
  • दुनिया के निर्देशांकों में लैंडमार्क की फ़ोटो खींचें
  • ज़रूरी नहीं: पोज़ के लिए सेगमेंटेशन मास्क.

कॉन्फ़िगरेशन के विकल्प

इस टास्क में कॉन्फ़िगरेशन के ये विकल्प हैं:

विकल्प का नाम ब्यौरा मान की सीमा डिफ़ॉल्ट मान
running_mode टास्क के लिए रनिंग मोड सेट करता है. तीन मोड:

अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है इमेज: सिंगल इमेज इनपुट का मोड.
अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है
अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है वीडियो: किसी वीडियो के डिकोड किए गए फ़्रेम के लिए मोड.
अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है
अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है LIVE_STREAM: इनपुट की लाइवस्ट्रीम करने का मोड जैसे कि कोई डेटा रिकॉर्ड किया जा सकता है. इस मोड में, resultListener होना चाहिए नतीजे पाने के लिए, लिसनर सेट अप करने के लिए कॉल किया गया एसिंक्रोनस रूप से.
{IMAGE, VIDEO, LIVE_STREAM} IMAGE
num_poses ज़्यादा से ज़्यादा पोज़ की संख्या जिनका पता लैंडमार्क पोज़ दें. Integer > 0 1
min_pose_detection_confidence पोज़ की पहचान के लिए कम से कम कॉन्फ़िडेंस स्कोर यह होना चाहिए सफल माना जाता है. Float [0.0,1.0] 0.5
min_pose_presence_confidence पोज़ की मौजूदगी का कम से कम कॉन्फ़िडेंस स्कोर पोज़ लैंडमार्क की पहचान करने के लिए स्कोर किया जा सकता है. Float [0.0,1.0] 0.5
min_tracking_confidence पोज़ ट्रैकिंग के लिए कम से कम कॉन्फ़िडेंस स्कोर इन्हें सफल माना जाता है. Float [0.0,1.0] 0.5
output_segmentation_masks क्या पोज़ लैंडमार्कर, पहचाने गए आइटम के लिए सेगमेंटेशन मास्क देता है पोज़. Boolean False
result_callback लैंडमार्कर के नतीजे पाने के लिए, यह नतीजा लिसनर को सेट करता है जब Pose मार्कर लाइव स्ट्रीम मोड में हो, तब यह एसिंक्रोनस रूप से उपलब्ध नहीं होता है. इसका इस्तेमाल सिर्फ़ तब किया जा सकता है, जब रनिंग मोड को LIVE_STREAM पर सेट किया गया हो ResultListener N/A

मॉडल

पोज़ लैंडमार्कर, पोज़ लैंडमार्क का अनुमान लगाने के लिए कई मॉडल का इस्तेमाल करता है. पहला मॉडल किसी इमेज फ़्रेम में इंसानी लाशों की मौजूदगी का पता लगाता है और दूसरा मॉडल शवों पर लैंडमार्क का पता लगाता है.

नीचे दिए गए मॉडल, डाउनलोड किए जा सकने वाले मॉडल बंडल में एक साथ पैकेज किए जाते हैं:

  • पोज़ डिटेक्शन मॉडल: यह कुछ खास पोज़ का इस्तेमाल करके, शरीर की मौजूदगी का पता लगाता है लैंडमार्क.
  • पोज़ लैंडमार्कर मॉडल: यह पोज़ को पूरी तरह से मैप करने की सुविधा देता है. मॉडल 33 3-डाइमेंशन वाले पोज़ लैंडमार्क का अनुमान दिखाता है.

यह बंडल कॉन्वोलूशनल न्यूरल नेटवर्क का इस्तेमाल करता है MobileNetV2 से मिलता-जुलता है और इसे ऑप्टिमाइज़ किया गया है डिवाइस पर, रीयल-टाइम में फ़िटनेस ऐप्लिकेशन के लिए. इसका यह वैरिएंट BlazePose मॉडल का इस्तेमाल, GHUM, यह एक 3D मानव आकृति की मॉडलिंग पाइपलाइन है, जो इमेज या वीडियो में अलग-अलग दिखाना.

मॉडल बंडल आकार इनपुट करें डेटा टाइप मॉडल कार्ड वर्शन
पोज़ लैंडमार्क (लाइट) पोज़ डिटेक्टर: 224 x 224 x 3
पोज़ लैंडमार्क: 256 x 256 x 3
फ़्लोट 16 जानकारी नया
पोज़ लैंडमार्कर (फ़ुल) पोज़ डिटेक्टर: 224 x 224 x 3
पोज़ लैंडमार्क: 256 x 256 x 3
फ़्लोट 16 जानकारी नया
पोज़ लैंडमार्कर (बहुत ज़्यादा) पोज़ डिटेक्टर: 224 x 224 x 3
पोज़ लैंडमार्क: 256 x 256 x 3
फ़्लोट 16 जानकारी नया

पोज़ लैंडमार्क मॉडल

पोज़ लैंडमार्कर मॉडल, बॉडी लैंडमार्क की 33 जगहों को ट्रैक करता है. इनसे यह पता चलता है कि शरीर के निम्न अंगों का अनुमानित स्थान:

मॉडल आउटपुट में नॉर्मलाइज़्ड कोऑर्डिनेट (Landmarks) और वर्ल्ड, दोनों शामिल होते हैं हर लैंडमार्क के लिए निर्देशांक (WorldLandmarks) डालें.

0 - nose
1 - left eye (inner)
2 - left eye
3 - left eye (outer)
4 - right eye (inner)
5 - right eye
6 - right eye (outer)
7 - left ear
8 - right ear
9 - mouth (left)
10 - mouth (right)
11 - left shoulder
12 - right shoulder
13 - left elbow
14 - right elbow
15 - left wrist
16 - right wrist
17 - left pinky
18 - right pinky
19 - left index
20 - right index
21 - left thumb
22 - right thumb
23 - left hip
24 - right hip
25 - left knee
26 - right knee
27 - left ankle
28 - right ankle
29 - left heel
30 - right heel
31 - left foot index
32 - right foot index