Udhëzues për zbulimin e fytyrës

Tre persona me fytyrat e tyre të theksuara me kuti kufizuese

Detyra MediaPipe Face Detector ju lejon të zbuloni fytyrat në një imazh ose video. Mund ta përdorni këtë detyrë për të gjetur fytyrat dhe tiparet e fytyrës brenda një kuadri. Kjo detyrë përdor një model të të mësuarit automatik (ML) që funksionon me imazhe të vetme ose me një rrjedhë të vazhdueshme imazhesh. Detyra nxjerr vendndodhjet e fytyrave, së bashku me pikat kryesore të mëposhtme të fytyrës: syri i majtë, syri i djathtë, maja e hundës, goja, tragioni i syrit të majtë dhe tragioni i syrit të djathtë.

Provojeni!

Filloni

Filloni ta përdorni këtë detyrë duke ndjekur një nga këto udhëzues zbatimi për platformën tuaj të synuar. Këta udhëzues specifikë për platformën ju udhëzojnë përmes një zbatimi bazë të kësaj detyre, duke përfshirë një model të rekomanduar dhe një shembull kodi me opsione të rekomanduara konfigurimi:

Detajet e detyrës

Ky seksion përshkruan aftësitë, të dhënat hyrëse, të dhënat dalëse dhe opsionet e konfigurimit të kësaj detyre.

Karakteristikat

  • Përpunimi i imazhit hyrës - Përpunimi përfshin rrotullimin e imazhit, ndryshimin e madhësisë, normalizimin dhe konvertimin e hapësirës së ngjyrave.
  • Pragu i rezultatit - Filtroni rezultatet bazuar në rezultatet e parashikimit.
Hyrjet e detyrave Rezultatet e detyrave
Detektori i fytyrës pranon një hyrje të njërit prej llojeve të mëposhtme të të dhënave:
  • Imazhe statike
  • Korniza video të dekoduara
  • Transmetim video i drejtpërdrejtë
Detektori i fytyrës jep rezultatet e mëposhtme:
  • Kutitë kufizuese për fytyrat e zbuluara në një kornizë imazhi.
  • Koordinatat për 6 pika referimi të fytyrës për secilën fytyrë të zbuluar.

Opsionet e konfigurimit

Kjo detyrë ka opsionet e mëposhtme të konfigurimit:

Emri i opsionit Përshkrimi Diapazoni i Vlerave Vlera e parazgjedhur
running_mode Cakton modalitetin e ekzekutimit për detyrën. Ekzistojnë tre mënyra:

IMAZH: Modaliteti për futjen e një imazhi të vetëm.

VIDEO: Modaliteti për kuadrot e dekoduara të një videoje.

LIVE_STREAM: Modaliteti për një transmetim të drejtpërdrejtë të të dhënave hyrëse, si p.sh. nga një kamera. Në këtë modalitet, duhet të thirret resultListener për të konfiguruar një dëgjues për të marrë rezultatet në mënyrë asinkrone.
{ IMAGE, VIDEO, LIVE_STREAM } IMAGE
min_detection_confidence Rezultati minimal i besimit që zbulimi i fytyrës të konsiderohet i suksesshëm. Float [0,1] 0.5
min_suppression_threshold Pragu minimal jo maksimal i shtypjes për zbulimin e fytyrës duhet të konsiderohet i mbivendosur. Float [0,1] 0.3
result_callback Cakton dëgjuesin e rezultateve që të marrë rezultatet e zbulimit në mënyrë asinkrone kur Detektori i Fytyrës është në modalitetin e transmetimit të drejtpërdrejtë. Mund të përdoret vetëm kur modaliteti i ekzekutimit është vendosur në LIVE_STREAM . N/A Not set

Modele

Modelet e zbulimit të fytyrës mund të ndryshojnë në varësi të rasteve të përdorimit të synuar, siç është zbulimi në distancë të shkurtër dhe të gjatë. Modelet gjithashtu zakonisht bëjnë kompromise midis performancës, saktësisë, rezolucionit dhe kërkesave për burime, dhe në disa raste, përfshijnë veçori shtesë.

Modelet e listuara në këtë seksion janë variante të BlazeFace, një detektor fytyre i lehtë dhe i saktë i optimizuar për nxjerrjen e përfundimeve të GPU-së mobile. Modelet BlazeFace janë të përshtatshme për aplikacione si vlerësimi i pikave kyçe të fytyrës 3D, klasifikimi i shprehjeve dhe segmentimi i rajonit të fytyrës. BlazeFace përdor një rrjet të lehtë për nxjerrjen e karakteristikave të ngjashme me MobileNetV1/V2 .

BlazeFace (me rreze të shkurtër veprimi)

Një model i lehtë për zbulimin e fytyrave të vetme ose të shumëfishta brenda imazheve të ngjashme me selfie nga një kamera telefoni inteligjent ose një webcam. Modeli është i optimizuar për imazhet e kamerës së telefonit të përparme në një distancë të shkurtër. Arkitektura e modelit përdor një teknikë rrjeti konvolucional të Single Shot Detector (SSD) me një enkoder të personalizuar. Për më shumë informacion, shihni punimin kërkimor mbi Single Shot MultiBox Detector .

Emri i modelit Forma e hyrjes Lloji i kuantizimit Kartë modeli Versionet
BlazeFace (me rreze të shkurtër veprimi) 128 x 128 noton 16 informacion Më të fundit

BlazeFace (me gamë të plotë)

Një model relativisht i lehtë për zbulimin e fytyrave të vetme ose të shumëfishta brenda imazheve nga një kamera e një telefoni inteligjent ose një webcam. Modeli është i optimizuar për imazhe me gamë të plotë, si ato të marra me imazhe të kamerës së një telefoni të kthyer nga mbrapa. Arkitektura e modelit përdor një teknikë të ngjashme me një rrjet konvolucional CenterNet me një enkodues të personalizuar.

Emri i modelit Forma e hyrjes Lloji i kuantizimit Kartë modeli Versionet
BlazeFace (me gamë të plotë) 128 x 128 noton 16 informacion Më të fundit

BlazeFace Sparse (me gamë të plotë)

Një version më i lehtë i modelit të rregullt BlazeFace me gamë të plotë, afërsisht 60% më i vogël në madhësi. Modeli është i optimizuar për imazhe me gamë të plotë, si ato të marra me imazhe të kamerës së telefonit nga mbrapa. Arkitektura e modelit përdor një teknikë të ngjashme me një rrjet konvolucional CenterNet me një enkoder të personalizuar.

Emri i modelit Forma e hyrjes Lloji i kuantizimit Kartë modeli Versionet
BlazeFace Sparse (me gamë të plotë) 128 x 128 noton 16 informacion Më të fundit

Standardet e detyrave

Ja pikat e referencës së detyrave për të gjithë rrjedhën e punës bazuar në modelet e trajnuara paraprakisht më sipër. Rezultati i vonesës është vonesa mesatare në Pixel 6 duke përdorur CPU / GPU.

Emri i modelit Latencia e CPU-së Vonesa e GPU-së
BlazeFace (me rreze të shkurtër veprimi) 2.94ms 7.41ms