
Detyra MediaPipe Face Detector ju lejon të zbuloni fytyrat në një imazh ose video. Mund ta përdorni këtë detyrë për të gjetur fytyrat dhe tiparet e fytyrës brenda një kuadri. Kjo detyrë përdor një model të të mësuarit automatik (ML) që funksionon me imazhe të vetme ose me një rrjedhë të vazhdueshme imazhesh. Detyra nxjerr vendndodhjet e fytyrave, së bashku me pikat kryesore të mëposhtme të fytyrës: syri i majtë, syri i djathtë, maja e hundës, goja, tragioni i syrit të majtë dhe tragioni i syrit të djathtë.
Filloni
Filloni ta përdorni këtë detyrë duke ndjekur një nga këto udhëzues zbatimi për platformën tuaj të synuar. Këta udhëzues specifikë për platformën ju udhëzojnë përmes një zbatimi bazë të kësaj detyre, duke përfshirë një model të rekomanduar dhe një shembull kodi me opsione të rekomanduara konfigurimi:
- Android - Shembull kodi - Udhëzues
- Python - Shembull kodi - Udhëzues
- Ueb - Shembull Kodi - Udhëzues
- iOS - Shembull kodi - Udhëzues
Detajet e detyrës
Ky seksion përshkruan aftësitë, të dhënat hyrëse, të dhënat dalëse dhe opsionet e konfigurimit të kësaj detyre.
Karakteristikat
- Përpunimi i imazhit hyrës - Përpunimi përfshin rrotullimin e imazhit, ndryshimin e madhësisë, normalizimin dhe konvertimin e hapësirës së ngjyrave.
- Pragu i rezultatit - Filtroni rezultatet bazuar në rezultatet e parashikimit.
| Hyrjet e detyrave | Rezultatet e detyrave |
|---|---|
Detektori i fytyrës pranon një hyrje të njërit prej llojeve të mëposhtme të të dhënave:
| Detektori i fytyrës jep rezultatet e mëposhtme:
|
Opsionet e konfigurimit
Kjo detyrë ka opsionet e mëposhtme të konfigurimit:
| Emri i opsionit | Përshkrimi | Diapazoni i Vlerave | Vlera e parazgjedhur |
|---|---|---|---|
running_mode | Cakton modalitetin e ekzekutimit për detyrën. Ekzistojnë tre mënyra: IMAZH: Modaliteti për futjen e një imazhi të vetëm. VIDEO: Modaliteti për kuadrot e dekoduara të një videoje. LIVE_STREAM: Modaliteti për një transmetim të drejtpërdrejtë të të dhënave hyrëse, si p.sh. nga një kamera. Në këtë modalitet, duhet të thirret resultListener për të konfiguruar një dëgjues për të marrë rezultatet në mënyrë asinkrone. | { IMAGE, VIDEO, LIVE_STREAM } | IMAGE |
min_detection_confidence | Rezultati minimal i besimit që zbulimi i fytyrës të konsiderohet i suksesshëm. | Float [0,1] | 0.5 |
min_suppression_threshold | Pragu minimal jo maksimal i shtypjes për zbulimin e fytyrës duhet të konsiderohet i mbivendosur. | Float [0,1] | 0.3 |
result_callback | Cakton dëgjuesin e rezultateve që të marrë rezultatet e zbulimit në mënyrë asinkrone kur Detektori i Fytyrës është në modalitetin e transmetimit të drejtpërdrejtë. Mund të përdoret vetëm kur modaliteti i ekzekutimit është vendosur në LIVE_STREAM . | N/A | Not set |
Modele
Modelet e zbulimit të fytyrës mund të ndryshojnë në varësi të rasteve të përdorimit të synuar, siç është zbulimi në distancë të shkurtër dhe të gjatë. Modelet gjithashtu zakonisht bëjnë kompromise midis performancës, saktësisë, rezolucionit dhe kërkesave për burime, dhe në disa raste, përfshijnë veçori shtesë.
Modelet e listuara në këtë seksion janë variante të BlazeFace, një detektor fytyre i lehtë dhe i saktë i optimizuar për nxjerrjen e përfundimeve të GPU-së mobile. Modelet BlazeFace janë të përshtatshme për aplikacione si vlerësimi i pikave kyçe të fytyrës 3D, klasifikimi i shprehjeve dhe segmentimi i rajonit të fytyrës. BlazeFace përdor një rrjet të lehtë për nxjerrjen e karakteristikave të ngjashme me MobileNetV1/V2 .
BlazeFace (me rreze të shkurtër veprimi)
Një model i lehtë për zbulimin e fytyrave të vetme ose të shumëfishta brenda imazheve të ngjashme me selfie nga një kamera telefoni inteligjent ose një webcam. Modeli është i optimizuar për imazhet e kamerës së telefonit të përparme në një distancë të shkurtër. Arkitektura e modelit përdor një teknikë rrjeti konvolucional të Single Shot Detector (SSD) me një enkoder të personalizuar. Për më shumë informacion, shihni punimin kërkimor mbi Single Shot MultiBox Detector .
| Emri i modelit | Forma e hyrjes | Lloji i kuantizimit | Kartë modeli | Versionet |
|---|---|---|---|---|
| BlazeFace (me rreze të shkurtër veprimi) | 128 x 128 | noton 16 | informacion | Më të fundit |
BlazeFace (me gamë të plotë)
Një model relativisht i lehtë për zbulimin e fytyrave të vetme ose të shumëfishta brenda imazheve nga një kamera e një telefoni inteligjent ose një webcam. Modeli është i optimizuar për imazhe me gamë të plotë, si ato të marra me imazhe të kamerës së një telefoni të kthyer nga mbrapa. Arkitektura e modelit përdor një teknikë të ngjashme me një rrjet konvolucional CenterNet me një enkodues të personalizuar.
| Emri i modelit | Forma e hyrjes | Lloji i kuantizimit | Kartë modeli | Versionet |
|---|---|---|---|---|
| BlazeFace (me gamë të plotë) | 128 x 128 | noton 16 | informacion | Më të fundit |
BlazeFace Sparse (me gamë të plotë)
Një version më i lehtë i modelit të rregullt BlazeFace me gamë të plotë, afërsisht 60% më i vogël në madhësi. Modeli është i optimizuar për imazhe me gamë të plotë, si ato të marra me imazhe të kamerës së telefonit nga mbrapa. Arkitektura e modelit përdor një teknikë të ngjashme me një rrjet konvolucional CenterNet me një enkoder të personalizuar.
| Emri i modelit | Forma e hyrjes | Lloji i kuantizimit | Kartë modeli | Versionet |
|---|---|---|---|---|
| BlazeFace Sparse (me gamë të plotë) | 128 x 128 | noton 16 | informacion | Më të fundit |
Standardet e detyrave
Ja pikat e referencës së detyrave për të gjithë rrjedhën e punës bazuar në modelet e trajnuara paraprakisht më sipër. Rezultati i vonesës është vonesa mesatare në Pixel 6 duke përdorur CPU / GPU.
| Emri i modelit | Latencia e CPU-së | Vonesa e GPU-së |
|---|---|---|
| BlazeFace (me rreze të shkurtër veprimi) | 2.94ms | 7.41ms |