Introducing LiteRT: Google's high-performance runtime for on-device AI, formerly known as TensorFlow Lite. Learn more

Kjo faqe është përkthyer nga Cloud Translation API.

Udhëzues për zbulimin e fytyrës

Tre persona me fytyrat e tyre të theksuara me kuti kufizuese

Detyra MediaPipe Face Detector ju lejon të zbuloni fytyrat në një imazh ose video. Ju mund ta përdorni këtë detyrë për të lokalizuar fytyrat dhe tiparet e fytyrës brenda një kornize. Kjo detyrë përdor një model të mësimit të makinës (ML) që funksionon me imazhe të vetme ose një rrjedhë të vazhdueshme imazhesh. Detyra nxjerr vendndodhjet e fytyrës, së bashku me pikat kryesore të mëposhtme të fytyrës: syri i majtë, syri i djathtë, maja e hundës, goja, tragjia e syrit të majtë dhe tragjia e syrit të djathtë.

Provojeni!

Filloni

Filloni ta përdorni këtë detyrë duke ndjekur një nga këto udhëzues zbatimi për platformën tuaj të synuar. Këta udhëzues specifikë të platformës ju përcjellin një zbatim bazë të kësaj detyre, duke përfshirë një model të rekomanduar dhe shembull kodi me opsionet e rekomanduara të konfigurimit:

Android - Shembull kodi - Udhëzues
Python - Shembull Kodi - Udhëzues
Web - Shembull Kodi - Udhëzues
iOS - Shembull kodi - Udhëzues

Detajet e detyrës

Ky seksion përshkruan aftësitë, hyrjet, daljet dhe opsionet e konfigurimit të kësaj detyre.

Veçoritë

Përpunimi i imazhit në hyrje - Përpunimi përfshin rrotullimin e imazhit, ndryshimin e madhësisë, normalizimin dhe konvertimin e hapësirës së ngjyrave.
Pragu i rezultatit - Filtro rezultatet bazuar në rezultatet e parashikimit.

Hyrjet e detyrave	Rezultatet e detyrave
Detektori i fytyrës pranon një hyrje të një prej llojeve të të dhënave të mëposhtme: Imazhe të palëvizshme Korniza video të deshifruara Furnizimi me video drejtpërdrejt	Detektori i fytyrës nxjerr rezultatet e mëposhtme: Kutitë kufizuese për fytyrat e zbuluara në një kornizë imazhi. Koordinatat për 6 pika referimi të fytyrës për secilën fytyrë të zbuluar.

Hyrjet e detyrave

Rezultatet e detyrave

Detektori i fytyrës pranon një hyrje të një prej llojeve të të dhënave të mëposhtme:

Imazhe të palëvizshme

Korniza video të deshifruara

Furnizimi me video drejtpërdrejt

Detektori i fytyrës nxjerr rezultatet e mëposhtme:

Kutitë kufizuese për fytyrat e zbuluara në një kornizë imazhi.

Koordinatat për 6 pika referimi të fytyrës për secilën fytyrë të zbuluar.

Opsionet e konfigurimeve

Kjo detyrë ka opsionet e mëposhtme të konfigurimit:

Emri i opsionit	Përshkrimi	Gama e vlerave	Vlera e paracaktuar
`running_mode`	Vendos modalitetin e ekzekutimit për detyrën. Ekzistojnë tre mënyra: IMAGE: Modaliteti për hyrjet e një imazhi të vetëm. VIDEO: Modaliteti për kornizat e dekoduara të një videoje. LIVE_STREAM: Modaliteti për një transmetim të drejtpërdrejtë të të dhënave hyrëse, si p.sh. nga një aparat fotografik. Në këtë modalitet, resultListener duhet të thirret për të vendosur një dëgjues për të marrë rezultatet në mënyrë asinkrone.	{ `IMAGE, VIDEO, LIVE_STREAM` }	`IMAGE`
`min_detection_confidence`	Rezultati minimal i besimit për zbulimin e fytyrës për t'u konsideruar i suksesshëm.	`Float [0,1]`	`0.5`
`min_suppression_threshold`	Pragu minimal jo-maksimal i shtypjes për zbulimin e fytyrës duhet të konsiderohet i mbivendosur.	`Float [0,1]`	`0.3`
`result_callback`	Vendos dëgjuesin e rezultateve që të marrë rezultatet e zbulimit në mënyrë asinkrone kur Detektori i fytyrës është në modalitetin e transmetimit të drejtpërdrejtë. Mund të përdoret vetëm kur modaliteti i ekzekutimit është caktuar në `LIVE_STREAM` .	`N/A`	`Not set`

Modelet

Modelet e zbulimit të fytyrës mund të ndryshojnë në varësi të rasteve të përdorimit të tyre të synuar, si zbulimi me rreze të shkurtër dhe me rreze të gjatë. Modelet gjithashtu zakonisht bëjnë shkëmbime ndërmjet performancës, saktësisë, rezolucionit dhe kërkesave për burime, dhe në disa raste përfshijnë veçori shtesë.

Modelet e listuara në këtë seksion janë variante të BlazeFace, një detektor fytyre i lehtë dhe i saktë i optimizuar për konkluzionet e GPU-së celulare. Modelet BlazeFace janë të përshtatshme për aplikacione si vlerësimi 3D i pikave kyçe të fytyrës, klasifikimi i shprehjeve dhe segmentimi i rajonit të fytyrës. BlazeFace përdor një rrjet të lehtë për nxjerrjen e veçorive të ngjashme me MobileNetV1/V2 .

BlazeFace (me rreze të shkurtër)

Një model i lehtë për zbulimin e fytyrave të vetme ose të shumëfishta brenda imazheve të ngjashme me "selfie" nga një kamerë smartphone ose kamerë në internet. Modeli është i optimizuar për imazhet e kamerës së telefonit të përparmë në rreze të shkurtër. Arkitektura e modelit përdor një teknikë rrjeti konvolucionar me një detektor të vetëm të goditjes (SSD) me një kodues të personalizuar. Për më shumë informacion, shihni punimin kërkimor mbi Detektorin MultiBox Single Shot .

Emri i modelit	Forma e hyrjes	Lloji i kuantizimit	Kartelë model	Versionet
BlazeFace (me rreze të shkurtër)	128 x 128	noton 16	informacion	E fundit

BlazeFace (me rreze të plotë)

Një model relativisht i lehtë për zbulimin e fytyrave të vetme ose të shumëfishta brenda imazheve nga një kamerë smartphone ose kamerë në internet. Modeli është i optimizuar për imazhe me rreze të plotë, si ato të marra me imazhet e kamerës së telefonit nga ana e pasme. Arkitektura e modelit përdor një teknikë të ngjashme me një rrjet konvolucionist CenterNet me një kodues të personalizuar.

Emri i modelit	Forma e hyrjes	Lloji i kuantizimit	Kartë Model	Versionet
BlazeFace (me gamë të plotë)	128 x 128	noton 16	informacion	Së shpejti

BlazeFace Sparse (me gamë të plotë)

Një version më i lehtë i modelit të rregullt BlazeFace me gamë të plotë, afërsisht 60% më i vogël në madhësi. Modeli është i optimizuar për imazhe me rreze të plotë, si ato të marra me imazhet e kamerës së telefonit nga ana e pasme. Arkitektura e modelit përdor një teknikë të ngjashme me një rrjet konvolucionist CenterNet me një kodues të personalizuar.

Emri i modelit	Forma e hyrjes	Lloji i kuantizimit	Kartelë model	Versionet
BlazeFace Sparse (me gamë të plotë)	128 x 128	noton 16	informacion	Së shpejti

Standardet e detyrave

Këtu janë standardet e detyrave për të gjithë tubacionin bazuar në modelet e mësipërme të para-trajnuara. Rezultati i vonesës është vonesa mesatare në Pixel 6 duke përdorur CPU / GPU.

Emri i modelit	Vonesa e CPU-së	Vonesa e GPU-së
BlazeFace (me rreze të shkurtër)	2.94 ms	7.41 ms