Detyra MediaPipe Face Detector ju lejon të zbuloni fytyrat në një imazh ose video. Ju mund ta përdorni këtë detyrë për të lokalizuar fytyrat dhe tiparet e fytyrës brenda një kornize. Kjo detyrë përdor një model të mësimit të makinës (ML) që funksionon me imazhe të vetme ose një rrjedhë të vazhdueshme imazhesh. Detyra nxjerr vendndodhjet e fytyrës, së bashku me pikat kryesore të mëposhtme të fytyrës: syri i majtë, syri i djathtë, maja e hundës, goja, tragjia e syrit të majtë dhe tragjia e syrit të djathtë.
Filloni
Filloni ta përdorni këtë detyrë duke ndjekur një nga këto udhëzues zbatimi për platformën tuaj të synuar. Këta udhëzues specifikë të platformës ju përcjellin një zbatim bazë të kësaj detyre, duke përfshirë një model të rekomanduar dhe shembull kodi me opsionet e rekomanduara të konfigurimit:
- Android - Shembull kodi - Udhëzues
- Python - Shembull Kodi - Udhëzues
- Web - Shembull Kodi - Udhëzues
- iOS - Shembull kodi - Udhëzues
Detajet e detyrës
Ky seksion përshkruan aftësitë, hyrjet, daljet dhe opsionet e konfigurimit të kësaj detyre.
Veçoritë
- Përpunimi i imazhit në hyrje - Përpunimi përfshin rrotullimin e imazhit, ndryshimin e madhësisë, normalizimin dhe konvertimin e hapësirës së ngjyrave.
- Pragu i rezultatit - Filtro rezultatet bazuar në rezultatet e parashikimit.
Hyrjet e detyrave | Rezultatet e detyrave |
---|---|
Detektori i fytyrës pranon një hyrje të një prej llojeve të të dhënave të mëposhtme:
| Detektori i fytyrës nxjerr rezultatet e mëposhtme:
|
Opsionet e konfigurimeve
Kjo detyrë ka opsionet e mëposhtme të konfigurimit:
Emri i opsionit | Përshkrimi | Gama e vlerave | Vlera e paracaktuar |
---|---|---|---|
running_mode | Vendos modalitetin e ekzekutimit për detyrën. Ekzistojnë tre mënyra: IMAGE: Modaliteti për hyrjet e një imazhi të vetëm. VIDEO: Modaliteti për kornizat e dekoduara të një videoje. LIVE_STREAM: Modaliteti për një transmetim të drejtpërdrejtë të të dhënave hyrëse, si p.sh. nga një aparat fotografik. Në këtë modalitet, resultListener duhet të thirret për të vendosur një dëgjues për të marrë rezultatet në mënyrë asinkrone. | { IMAGE, VIDEO, LIVE_STREAM } | IMAGE |
min_detection_confidence | Rezultati minimal i besimit për zbulimin e fytyrës për t'u konsideruar i suksesshëm. | Float [0,1] | 0.5 |
min_suppression_threshold | Pragu minimal jo-maksimal i shtypjes për zbulimin e fytyrës duhet të konsiderohet i mbivendosur. | Float [0,1] | 0.3 |
result_callback | Vendos dëgjuesin e rezultateve që të marrë rezultatet e zbulimit në mënyrë asinkrone kur Detektori i fytyrës është në modalitetin e transmetimit të drejtpërdrejtë. Mund të përdoret vetëm kur modaliteti i ekzekutimit është caktuar në LIVE_STREAM . | N/A | Not set |
Modelet
Modelet e zbulimit të fytyrës mund të ndryshojnë në varësi të rasteve të përdorimit të tyre të synuar, si zbulimi me rreze të shkurtër dhe me rreze të gjatë. Modelet gjithashtu zakonisht bëjnë shkëmbime ndërmjet performancës, saktësisë, rezolucionit dhe kërkesave për burime, dhe në disa raste përfshijnë veçori shtesë.
Modelet e listuara në këtë seksion janë variante të BlazeFace, një detektor fytyre i lehtë dhe i saktë i optimizuar për konkluzionet e GPU-së celulare. Modelet BlazeFace janë të përshtatshme për aplikacione si vlerësimi 3D i pikave kyçe të fytyrës, klasifikimi i shprehjeve dhe segmentimi i rajonit të fytyrës. BlazeFace përdor një rrjet të lehtë për nxjerrjen e veçorive të ngjashme me MobileNetV1/V2 .
BlazeFace (me rreze të shkurtër)
Një model i lehtë për zbulimin e fytyrave të vetme ose të shumëfishta brenda imazheve të ngjashme me "selfie" nga një kamerë smartphone ose kamerë në internet. Modeli është i optimizuar për imazhet e kamerës së telefonit të përparmë në rreze të shkurtër. Arkitektura e modelit përdor një teknikë rrjeti konvolucionar me një detektor të vetëm të goditjes (SSD) me një kodues të personalizuar. Për më shumë informacion, shihni punimin kërkimor mbi Detektorin MultiBox Single Shot .
Emri i modelit | Forma e hyrjes | Lloji i kuantizimit | Kartelë model | Versionet |
---|---|---|---|---|
BlazeFace (me rreze të shkurtër) | 128 x 128 | noton 16 | informacion | E fundit |
BlazeFace (me rreze të plotë)
Një model relativisht i lehtë për zbulimin e fytyrave të vetme ose të shumëfishta brenda imazheve nga një kamerë smartphone ose kamerë në internet. Modeli është i optimizuar për imazhe me rreze të plotë, si ato të marra me imazhet e kamerës së telefonit nga ana e pasme. Arkitektura e modelit përdor një teknikë të ngjashme me një rrjet konvolucionist CenterNet me një kodues të personalizuar.
Emri i modelit | Forma e hyrjes | Lloji i kuantizimit | Kartë Model | Versionet |
---|---|---|---|---|
BlazeFace (me gamë të plotë) | 128 x 128 | noton 16 | informacion | Së shpejti |
BlazeFace Sparse (me gamë të plotë)
Një version më i lehtë i modelit të rregullt BlazeFace me gamë të plotë, afërsisht 60% më i vogël në madhësi. Modeli është i optimizuar për imazhe me rreze të plotë, si ato të marra me imazhet e kamerës së telefonit nga ana e pasme. Arkitektura e modelit përdor një teknikë të ngjashme me një rrjet konvolucionist CenterNet me një kodues të personalizuar.
Emri i modelit | Forma e hyrjes | Lloji i kuantizimit | Kartelë model | Versionet |
---|---|---|---|---|
BlazeFace Sparse (me gamë të plotë) | 128 x 128 | noton 16 | informacion | Së shpejti |
Standardet e detyrave
Këtu janë standardet e detyrave për të gjithë tubacionin bazuar në modelet e mësipërme të para-trajnuara. Rezultati i vonesës është vonesa mesatare në Pixel 6 duke përdorur CPU / GPU.
Emri i modelit | Vonesa e CPU-së | Vonesa e GPU-së |
---|---|---|
BlazeFace (me rreze të shkurtër) | 2.94 ms | 7.41 ms |