মুখের ল্যান্ডমার্ক সনাক্তকরণ গাইড

ল্যান্ডমার্কার টাস্ক ফেস করুন

MediaPipe ফেস ল্যান্ডমার্কার টাস্ক আপনাকে ছবি এবং ভিডিওতে মুখের ল্যান্ডমার্ক এবং মুখের অভিব্যক্তি সনাক্ত করতে দেয়। আপনি মানুষের মুখের অভিব্যক্তি সনাক্ত করতে, মুখের ফিল্টার এবং প্রভাব প্রয়োগ করতে এবং ভার্চুয়াল অবতার তৈরি করতে এই কাজটি ব্যবহার করতে পারেন। এই টাস্কটি মেশিন লার্নিং (ML) মডেলগুলি ব্যবহার করে যা একক চিত্র বা একটি অবিচ্ছিন্ন চিত্রের সাথে কাজ করতে পারে। টাস্কটি 3-মাত্রিক মুখের ল্যান্ডমার্ক, ব্লেন্ডশেপ স্কোর (মুখের অভিব্যক্তির প্রতিনিধিত্বকারী সহগ) রিয়েল-টাইমে মুখের উপরিভাগের বিস্তারিত অনুমান করতে এবং ইফেক্ট রেন্ডারিংয়ের জন্য প্রয়োজনীয় রূপান্তরগুলি সম্পাদন করার জন্য রূপান্তর ম্যাট্রিক্স আউটপুট করে।

এটা চেষ্টা করুন!

এবার শুরু করা যাক

আপনার লক্ষ্য প্ল্যাটফর্মের জন্য বাস্তবায়ন নির্দেশিকাগুলির একটি অনুসরণ করে এই কাজটি ব্যবহার করা শুরু করুন। এই প্ল্যাটফর্ম-নির্দিষ্ট নির্দেশিকাগুলি আপনাকে এই টাস্কের একটি প্রাথমিক বাস্তবায়নের মাধ্যমে নিয়ে যায়, যার মধ্যে একটি প্রস্তাবিত মডেল এবং প্রস্তাবিত কনফিগারেশন বিকল্পগুলির সাথে কোড উদাহরণ রয়েছে:

টাস্কের বিবরণ

এই বিভাগটি এই কাজের ক্ষমতা, ইনপুট, আউটপুট এবং কনফিগারেশন বিকল্পগুলি বর্ণনা করে।

বৈশিষ্ট্য

  • ইনপুট ইমেজ প্রসেসিং - প্রসেসিং এর মধ্যে রয়েছে ইমেজ রোটেশন, রিসাইজ, নরমালাইজেশন এবং কালার স্পেস কনভার্সন।
  • স্কোর থ্রেশহোল্ড - পূর্বাভাস স্কোরের উপর ভিত্তি করে ফলাফল ফিল্টার করুন।
টাস্ক ইনপুট টাস্ক আউটপুট
ফেস ল্যান্ডমার্কার নিম্নলিখিত ডেটা প্রকারগুলির একটির একটি ইনপুট গ্রহণ করে:
  • স্থিরচিত্রসমূহ
  • ডিকোডেড ভিডিও ফ্রেম
  • লাইভ ভিডিও ফিড
ফেস ল্যান্ডমার্কার নিম্নলিখিত ফলাফলগুলি আউটপুট করে:
  • একটি ইমেজ ফ্রেমে শনাক্ত করা মুখের জন্য বাউন্ডিং বক্স।
  • প্রতিটি শনাক্ত মুখের জন্য একটি সম্পূর্ণ ফেস মেশ, মুখের ল্যান্ডমার্কের জন্য মুখের অভিব্যক্তি এবং স্থানাঙ্কের মিশ্রণের স্কোর সহ।

কনফিগারেশন অপশন

এই কাজের নিম্নলিখিত কনফিগারেশন বিকল্প আছে:

বিকল্পের নাম বর্ণনা মান পরিসীমা ডিফল্ট মান
running_mode টাস্কের জন্য চলমান মোড সেট করে। তিনটি মোড আছে:

IMAGE: একক ইমেজ ইনপুট জন্য মোড.

ভিডিও: একটি ভিডিওর ডিকোড করা ফ্রেমের মোড।

লাইভ_স্ট্রিম: ইনপুট ডেটার লাইভস্ট্রিমের মোড, যেমন ক্যামেরা থেকে। এই মোডে, ফলাফল শ্রোতাকে অ্যাসিঙ্ক্রোনাসভাবে ফলাফল পেতে একটি শ্রোতা সেট আপ করতে কল করতে হবে।
{ IMAGE, VIDEO, LIVE_STREAM } IMAGE
num_faces FaceLandmarker দ্বারা শনাক্ত করা যায় এমন মুখের সর্বাধিক সংখ্যা৷ smoothing শুধুমাত্র প্রয়োগ করা হয় যখন num_faces 1 এ সেট করা হয়। Integer > 0 1
min_face_detection_confidence মুখ শনাক্তকরণ সফল বলে বিবেচিত হওয়ার জন্য সর্বনিম্ন আত্মবিশ্বাসের স্কোর৷ Float [0.0,1.0] 0.5
min_face_presence_confidence মুখের ল্যান্ডমার্ক সনাক্তকরণে মুখ উপস্থিতি স্কোরের সর্বনিম্ন আত্মবিশ্বাসের স্কোর। Float [0.0,1.0] 0.5
min_tracking_confidence ফেস ট্র্যাকিংয়ের জন্য ন্যূনতম আত্মবিশ্বাসের স্কোর সফল বলে বিবেচিত হবে। Float [0.0,1.0] 0.5
output_face_blendshapes ফেস ল্যান্ডমার্কার ফেস ব্লেন্ডশেপ আউটপুট করে কিনা। 3D ফেস মডেল রেন্ডার করার জন্য ফেস ব্লেন্ডশেপ ব্যবহার করা হয়। Boolean False
output_facial_transformation_matrixes ফেসল্যান্ডমার্কার ফেসিয়াল ট্রান্সফরমেশন ম্যাট্রিক্স আউটপুট করে কিনা। ফেসল্যান্ডমার্কার ম্যাট্রিক্স ব্যবহার করে মুখের ল্যান্ডমার্কগুলিকে ক্যানোনিকাল ফেস মডেল থেকে শনাক্ত করা ফেসে রূপান্তর করতে, যাতে ব্যবহারকারীরা সনাক্ত করা ল্যান্ডমার্কগুলিতে প্রভাব প্রয়োগ করতে পারে৷ Boolean False
result_callback FaceLandmarker যখন লাইভ স্ট্রিম মোডে থাকে তখন ফলাফল শ্রোতাকে অ্যাসিঙ্ক্রোনাসভাবে ল্যান্ডমার্কারের ফলাফল পেতে সেট করে। চলমান মোড LIVE_STREAM এ সেট করা থাকলেই কেবল ব্যবহার করা যাবে৷ ResultListener N/A

মডেল

ফেস ল্যান্ডমার্কার মুখের ল্যান্ডমার্কের পূর্বাভাস দিতে মডেলের একটি সিরিজ ব্যবহার করে। প্রথম মডেল মুখগুলি সনাক্ত করে, একটি দ্বিতীয় মডেল সনাক্ত করা মুখগুলিতে ল্যান্ডমার্কগুলি সনাক্ত করে এবং একটি তৃতীয় মডেল মুখের বৈশিষ্ট্য এবং অভিব্যক্তি সনাক্ত করতে সেই ল্যান্ডমার্কগুলি ব্যবহার করে৷

নিম্নলিখিত মডেলগুলি একটি ডাউনলোডযোগ্য মডেল বান্ডিলে একসাথে প্যাকেজ করা হয়েছে:

  • মুখ সনাক্তকরণ মডেল : কয়েকটি মুখের ল্যান্ডমার্ক সহ মুখের উপস্থিতি সনাক্ত করে।
  • ফেস মেশ মডেল : মুখের একটি সম্পূর্ণ ম্যাপিং যোগ করে। মডেলটি 478টি 3-মাত্রিক মুখের ল্যান্ডমার্কের একটি অনুমান আউটপুট করে।
  • ব্লেন্ডশেপ ভবিষ্যদ্বাণী মডেল : ফেস মেশ মডেল থেকে আউটপুট গ্রহণ করে 52টি ব্লেন্ডশেপ স্কোর ভবিষ্যদ্বাণী করে, যা মুখের বিভিন্ন অভিব্যক্তির প্রতিনিধিত্বকারী সহগ।

ফেস ডিটেকশন মডেল হল ব্লেজফেস শর্ট-রেঞ্জ মডেল, মোবাইল GPU অনুমানের জন্য অপ্টিমাইজ করা একটি হালকা ওজনের এবং সঠিক ফেস ডিটেক্টর। আরও তথ্যের জন্য, ফেস ডিটেক্টর টাস্ক দেখুন।

নীচের ছবিটি মডেল বান্ডেল আউটপুট থেকে মুখের ল্যান্ডমার্কগুলির একটি সম্পূর্ণ ম্যাপিং দেখায়৷

ফেস ল্যান্ডমার্কার কীপয়েন্ট

মুখের ল্যান্ডমার্কগুলির আরও বিশদ দৃশ্যের জন্য, পূর্ণ-আকারের চিত্রটি দেখুন।

মডেল বান্ডিল ইনপুট আকৃতি ডেটা টাইপ মডেল কার্ড সংস্করণ
ফেসল্যান্ডমার্কার ফেসডিটেক্টর: 192 x 192
FaceMesh-V2: 256 x 256
ব্লেন্ডশেপ: 1 x 146 x 2
ভাসা 16 ফেসডিটেক্টর
FaceMesh-V2
ব্লেন্ডশেপ
সর্বশেষ