Udhëzues për zbulimin e fytyrës

Tre persona me fytyrat e tyre të theksuara me kuti kufizuese

Detyra MediaPipe Face Detector ju lejon të zbuloni fytyrat në një imazh ose video. Ju mund ta përdorni këtë detyrë për të lokalizuar fytyrat dhe tiparet e fytyrës brenda një kornize. Kjo detyrë përdor një model të mësimit të makinës (ML) që funksionon me imazhe të vetme ose një rrjedhë të vazhdueshme imazhesh. Detyra nxjerr vendndodhjet e fytyrës, së bashku me pikat kryesore të mëposhtme të fytyrës: syri i majtë, syri i djathtë, maja e hundës, goja, tragjia e syrit të majtë dhe tragjia e syrit të djathtë.

Provojeni!

Filloni

Filloni ta përdorni këtë detyrë duke ndjekur një nga këto udhëzues zbatimi për platformën tuaj të synuar. Këta udhëzues specifikë të platformës ju përcjellin një zbatim bazë të kësaj detyre, duke përfshirë një model të rekomanduar dhe shembull kodi me opsionet e rekomanduara të konfigurimit:

Detajet e detyrës

Ky seksion përshkruan aftësitë, hyrjet, daljet dhe opsionet e konfigurimit të kësaj detyre.

Veçoritë

  • Përpunimi i imazhit në hyrje - Përpunimi përfshin rrotullimin e imazhit, ndryshimin e madhësisë, normalizimin dhe konvertimin e hapësirës së ngjyrave.
  • Pragu i rezultatit - Filtro rezultatet bazuar në rezultatet e parashikimit.
Hyrjet e detyrave Rezultatet e detyrave
Detektori i fytyrës pranon një hyrje të një prej llojeve të të dhënave të mëposhtme:
  • Imazhe të palëvizshme
  • Korniza video të deshifruara
  • Furnizimi me video drejtpërdrejt
Detektori i fytyrës nxjerr rezultatet e mëposhtme:
  • Kutitë kufizuese për fytyrat e zbuluara në një kornizë imazhi.
  • Koordinatat për 6 pika referimi të fytyrës për secilën fytyrë të zbuluar.

Opsionet e konfigurimeve

Kjo detyrë ka opsionet e mëposhtme të konfigurimit:

Emri i opsionit Përshkrimi Gama e vlerave Vlera e paracaktuar
running_mode Vendos modalitetin e ekzekutimit për detyrën. Ekzistojnë tre mënyra:

IMAGE: Modaliteti për hyrjet e një imazhi të vetëm.

VIDEO: Modaliteti për kornizat e dekoduara të një videoje.

LIVE_STREAM: Modaliteti për një transmetim të drejtpërdrejtë të të dhënave hyrëse, si p.sh. nga një aparat fotografik. Në këtë modalitet, resultListener duhet të thirret për të vendosur një dëgjues për të marrë rezultatet në mënyrë asinkrone.
{ IMAGE, VIDEO, LIVE_STREAM } IMAGE
min_detection_confidence Rezultati minimal i besimit për zbulimin e fytyrës për t'u konsideruar i suksesshëm. Float [0,1] 0.5
min_suppression_threshold Pragu minimal jo-maksimal i shtypjes për zbulimin e fytyrës duhet të konsiderohet i mbivendosur. Float [0,1] 0.3
result_callback Vendos dëgjuesin e rezultateve që të marrë rezultatet e zbulimit në mënyrë asinkrone kur Detektori i fytyrës është në modalitetin e transmetimit të drejtpërdrejtë. Mund të përdoret vetëm kur modaliteti i ekzekutimit është caktuar në LIVE_STREAM . N/A Not set

Modelet

Modelet e zbulimit të fytyrës mund të ndryshojnë në varësi të rasteve të përdorimit të tyre të synuar, si zbulimi me rreze të shkurtër dhe me rreze të gjatë. Modelet gjithashtu zakonisht bëjnë shkëmbime ndërmjet performancës, saktësisë, rezolucionit dhe kërkesave për burime, dhe në disa raste përfshijnë veçori shtesë.

Modelet e listuara në këtë seksion janë variante të BlazeFace, një detektor fytyre i lehtë dhe i saktë i optimizuar për konkluzionet e GPU-së celulare. Modelet BlazeFace janë të përshtatshme për aplikacione si vlerësimi 3D i pikave kyçe të fytyrës, klasifikimi i shprehjeve dhe segmentimi i rajonit të fytyrës. BlazeFace përdor një rrjet të lehtë për nxjerrjen e veçorive të ngjashme me MobileNetV1/V2 .

BlazeFace (me rreze të shkurtër)

Një model i lehtë për zbulimin e fytyrave të vetme ose të shumëfishta brenda imazheve të ngjashme me "selfie" nga një kamerë smartphone ose kamerë në internet. Modeli është i optimizuar për imazhet e kamerës së telefonit të përparmë në rreze të shkurtër. Arkitektura e modelit përdor një teknikë rrjeti konvolucionar me një detektor të vetëm të goditjes (SSD) me një kodues të personalizuar. Për më shumë informacion, shihni punimin kërkimor mbi Detektorin MultiBox Single Shot .

Emri i modelit Forma e hyrjes Lloji i kuantizimit Kartelë model Versionet
BlazeFace (me rreze të shkurtër) 128 x 128 noton 16 informacion E fundit

BlazeFace (me rreze të plotë)

Një model relativisht i lehtë për zbulimin e fytyrave të vetme ose të shumëfishta brenda imazheve nga një kamerë smartphone ose kamerë në internet. Modeli është i optimizuar për imazhe me rreze të plotë, si ato të marra me imazhet e kamerës së telefonit nga ana e pasme. Arkitektura e modelit përdor një teknikë të ngjashme me një rrjet konvolucionist CenterNet me një kodues të personalizuar.

Emri i modelit Forma e hyrjes Lloji i kuantizimit Kartë Model Versionet
BlazeFace (me gamë të plotë) 128 x 128 noton 16 informacion Së shpejti

BlazeFace Sparse (me gamë të plotë)

Një version më i lehtë i modelit të rregullt BlazeFace me gamë të plotë, afërsisht 60% më i vogël në madhësi. Modeli është i optimizuar për imazhe me rreze të plotë, si ato të marra me imazhet e kamerës së telefonit nga ana e pasme. Arkitektura e modelit përdor një teknikë të ngjashme me një rrjet konvolucionist CenterNet me një kodues të personalizuar.

Emri i modelit Forma e hyrjes Lloji i kuantizimit Kartelë model Versionet
BlazeFace Sparse (me gamë të plotë) 128 x 128 noton 16 informacion Së shpejti

Standardet e detyrave

Këtu janë standardet e detyrave për të gjithë tubacionin bazuar në modelet e mësipërme të para-trajnuara. Rezultati i vonesës është vonesa mesatare në Pixel 6 duke përdorur CPU / GPU.

Emri i modelit Vonesa e CPU-së Vonesa e GPU-së
BlazeFace (me rreze të shkurtër) 2.94 ms 7.41 ms