MediaPipe पोज़ लैंडमार्कर टास्क से, आपको किसी इमेज में इंसानी शरीर के लैंडमार्क का पता लगाने की सुविधा मिलती है या वीडियो. इस टास्क की मदद से, शरीर की प्रमुख जगहों की पहचान की जा सकती है, पॉस्चर का विश्लेषण किया जा सकता है, और गतिविधियों को अलग-अलग कैटगरी में बांट सकता है. यह टास्क, मशीन लर्निंग (एमएल) मॉडल का इस्तेमाल करता है अलग-अलग इमेज या वीडियो के साथ काम करते हैं. टास्क, इमेज में बॉडी पोज़ लैंडमार्क दिखाता है निर्देशांकों और 3-आयामी दुनिया के निर्देशांकों में भी देखा जा सकता है.
शुरू करें
इस टास्क का इस्तेमाल शुरू करने के लिए, लागू करने की गाइड में बताए गए तरीके का पालन करें टारगेट प्लैटफ़ॉर्म पर लागू होता है. प्लैटफ़ॉर्म के हिसाब से, इन गाइड से आपको बुनियादी चीज़ों के बारे में जानकारी मिलेगी इस टास्क को लागू करने की प्रोसेस. इसमें, सुझाया गया मॉडल और कोड का उदाहरण भी शामिल है सुझाए गए कॉन्फ़िगरेशन विकल्पों के साथ:
- Android - कोड का उदाहरण - गाइड
- Python - कोड का उदाहरण - गाइड
- वेब - कोड का उदाहरण - गाइड
टास्क की जानकारी
इस सेक्शन में सुविधाओं, इनपुट, आउटपुट, और कॉन्फ़िगरेशन के बारे में बताया गया है इस टास्क के विकल्प देखें.
सुविधाएं
- इनपुट इमेज प्रोसेसिंग - प्रोसेसिंग में इमेज रोटेशन, साइज़ बदलना, नॉर्मलाइज़ेशन, और कलर स्पेस कन्वर्ज़न शामिल हैं.
- स्कोर थ्रेशोल्ड - अनुमान के स्कोर के आधार पर नतीजों को फ़िल्टर करें.
टास्क के इनपुट | टास्क के आउटपुट |
---|---|
पोज़ लैंडमार्कर, इनमें से किसी एक डेटा टाइप के इनपुट को स्वीकार करता है:
|
पोज़ लैंडमार्कर से ये नतीजे मिलते हैं:
|
कॉन्फ़िगरेशन के विकल्प
इस टास्क में कॉन्फ़िगरेशन के ये विकल्प हैं:
विकल्प का नाम | ब्यौरा | मान की सीमा | डिफ़ॉल्ट मान |
---|---|---|---|
running_mode |
टास्क के लिए रनिंग मोड सेट करता है. तीन
मोड: अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है इमेज: सिंगल इमेज इनपुट का मोड. अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है वीडियो: किसी वीडियो के डिकोड किए गए फ़्रेम के लिए मोड. अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है LIVE_STREAM: इनपुट की लाइवस्ट्रीम करने का मोड जैसे कि कोई डेटा रिकॉर्ड किया जा सकता है. इस मोड में, resultListener होना चाहिए नतीजे पाने के लिए, लिसनर सेट अप करने के लिए कॉल किया गया एसिंक्रोनस रूप से. |
{IMAGE, VIDEO, LIVE_STREAM } |
IMAGE |
num_poses |
ज़्यादा से ज़्यादा पोज़ की संख्या जिनका पता लैंडमार्क पोज़ दें. | Integer > 0 |
1 |
min_pose_detection_confidence |
पोज़ की पहचान के लिए कम से कम कॉन्फ़िडेंस स्कोर यह होना चाहिए सफल माना जाता है. | Float [0.0,1.0] |
0.5 |
min_pose_presence_confidence |
पोज़ की मौजूदगी का कम से कम कॉन्फ़िडेंस स्कोर पोज़ लैंडमार्क की पहचान करने के लिए स्कोर किया जा सकता है. | Float [0.0,1.0] |
0.5 |
min_tracking_confidence |
पोज़ ट्रैकिंग के लिए कम से कम कॉन्फ़िडेंस स्कोर इन्हें सफल माना जाता है. | Float [0.0,1.0] |
0.5 |
output_segmentation_masks |
क्या पोज़ लैंडमार्कर, पहचाने गए आइटम के लिए सेगमेंटेशन मास्क देता है पोज़. | Boolean |
False |
result_callback |
लैंडमार्कर के नतीजे पाने के लिए, यह नतीजा लिसनर को सेट करता है
जब Pose मार्कर लाइव स्ट्रीम मोड में हो, तब यह एसिंक्रोनस रूप से उपलब्ध नहीं होता है.
इसका इस्तेमाल सिर्फ़ तब किया जा सकता है, जब रनिंग मोड को LIVE_STREAM पर सेट किया गया हो |
ResultListener |
N/A |
मॉडल
पोज़ लैंडमार्कर, पोज़ लैंडमार्क का अनुमान लगाने के लिए कई मॉडल का इस्तेमाल करता है. पहला मॉडल किसी इमेज फ़्रेम में इंसानी लाशों की मौजूदगी का पता लगाता है और दूसरा मॉडल शवों पर लैंडमार्क का पता लगाता है.
नीचे दिए गए मॉडल, डाउनलोड किए जा सकने वाले मॉडल बंडल में एक साथ पैकेज किए जाते हैं:
- पोज़ डिटेक्शन मॉडल: यह कुछ खास पोज़ का इस्तेमाल करके, शरीर की मौजूदगी का पता लगाता है लैंडमार्क.
- पोज़ लैंडमार्कर मॉडल: यह पोज़ को पूरी तरह से मैप करने की सुविधा देता है. मॉडल 33 3-डाइमेंशन वाले पोज़ लैंडमार्क का अनुमान दिखाता है.
यह बंडल कॉन्वोलूशनल न्यूरल नेटवर्क का इस्तेमाल करता है MobileNetV2 से मिलता-जुलता है और इसे ऑप्टिमाइज़ किया गया है डिवाइस पर, रीयल-टाइम में फ़िटनेस ऐप्लिकेशन के लिए. इसका यह वैरिएंट BlazePose मॉडल का इस्तेमाल, GHUM, यह एक 3D मानव आकृति की मॉडलिंग पाइपलाइन है, जो इमेज या वीडियो में अलग-अलग दिखाना.
मॉडल बंडल | आकार इनपुट करें | डेटा टाइप | मॉडल कार्ड | वर्शन |
---|---|---|---|---|
पोज़ लैंडमार्क (लाइट) | पोज़ डिटेक्टर: 224 x 224 x 3 पोज़ लैंडमार्क: 256 x 256 x 3 |
फ़्लोट 16 | जानकारी | नया |
पोज़ लैंडमार्कर (फ़ुल) | पोज़ डिटेक्टर: 224 x 224 x 3 पोज़ लैंडमार्क: 256 x 256 x 3 |
फ़्लोट 16 | जानकारी | नया |
पोज़ लैंडमार्कर (बहुत ज़्यादा) | पोज़ डिटेक्टर: 224 x 224 x 3 पोज़ लैंडमार्क: 256 x 256 x 3 |
फ़्लोट 16 | जानकारी | नया |
पोज़ लैंडमार्क मॉडल
पोज़ लैंडमार्कर मॉडल, बॉडी लैंडमार्क की 33 जगहों को ट्रैक करता है. इनसे यह पता चलता है कि शरीर के निम्न अंगों का अनुमानित स्थान:
मॉडल आउटपुट में नॉर्मलाइज़्ड कोऑर्डिनेट (Landmarks
) और वर्ल्ड, दोनों शामिल होते हैं
हर लैंडमार्क के लिए निर्देशांक (WorldLandmarks
) डालें.