Detyra MediaPipe Language Detector ju lejon të identifikoni gjuhën e një pjese teksti. Kjo detyrë funksionon në të dhënat e tekstit me një model të mësimit të makinës (ML) dhe nxjerr një listë parashikimesh, ku çdo parashikim përbëhet nga një kod gjuhësor ISO 639-1 dhe një probabilitet.
Filloni
Filloni ta përdorni këtë detyrë duke ndjekur një nga këto udhëzues zbatimi për platformën tuaj të synuar. Këta udhëzues specifikë të platformës ju përcjellin një zbatim bazë të kësaj detyre, duke përfshirë një model të rekomanduar dhe shembull kodi me opsionet e rekomanduara të konfigurimit:
- Android - Shembull kodi - Udhëzues
- Python - Shembull Kodi - Udhëzues
- Web - Shembull Kodi - Udhëzues
Detajet e detyrës
Ky seksion përshkruan aftësitë, hyrjet, daljet dhe opsionet e konfigurimit të kësaj detyre.
Veçoritë
- Pragu i rezultatit - Filtro rezultatet bazuar në rezultatet e parashikimit
- Emërtoni listën e lejeve dhe listën e refuzimit - Specifikoni kategoritë e zbuluara
Hyrjet e detyrave | Rezultatet e detyrave |
---|---|
Detektori i gjuhës pranon llojin e mëposhtëm të të dhënave hyrëse:
| Detektori i gjuhës nxjerr një listë parashikimesh që përmbajnë:
|
Opsionet e konfigurimeve
Kjo detyrë ka opsionet e mëposhtme të konfigurimit:
Emri i opsionit | Përshkrimi | Gama e vlerave | Vlera e paracaktuar |
---|---|---|---|
max_results | Vendos numrin maksimal opsional të parashikimeve të gjuhës me pikët më të larta për t'u kthyer. Nëse kjo vlerë është më e vogël se zero, të gjitha rezultatet e disponueshme kthehen. | Çdo numër pozitiv | -1 |
score_threshold | Vendos pragun e rezultatit të parashikimit që tejkalon atë të dhënë në meta të dhënat e modelit (nëse ka). Rezultatet nën këtë vlerë refuzohen. | Çdo noton | Nuk është vendosur |
category_allowlist | Vendos listën opsionale të kodeve të gjuhëve të lejuara. Nëse nuk janë bosh, parashikimet e gjuhës, kodi i gjuhës së të cilave nuk është në këtë grup do të filtrohen. Ky opsion është reciprokisht ekskluziv me category_denylist dhe duke përdorur të dyja rezultatet në një gabim. | Çdo varg | Nuk është vendosur |
category_denylist | Vendos listën opsionale të kodeve të gjuhëve që nuk lejohen. Nëse nuk janë bosh, parashikimet e gjuhës, kodi i gjuhës së të cilave është në këtë grup do të filtrohen. Ky opsion është reciprokisht ekskluziv me category_allowlist dhe duke përdorur të dyja rezultatet në një gabim. | Çdo varg | Nuk është vendosur |
Modelet
Ne ofrojmë një model të paracaktuar, të rekomanduar kur filloni të zhvilloni këtë detyrë.
Modeli i detektorit të gjuhës (rekomandohet)
Ky model është ndërtuar për të qenë i lehtë (315 KB) dhe përdor arkitekturën e klasifikimit të rrjetit nervor të bazuar në embedding. Modeli identifikon gjuhën duke përdorur një kod gjuhësor ISO 639-1 dhe mund të identifikojë 110 gjuhë. Për një listë të gjuhëve të mbështetura nga modeli, shihni skedarin e etiketës , i cili rendit gjuhët sipas kodit të tyre ISO 639-1.
Emri i modelit | Forma e hyrjes | Lloji i kuantizimit | Modeli i kartës | Versionet |
---|---|---|---|---|
Detektor i gjuhës | vargu UTF-8 | asnjë (float32) | informacion | E fundit |
Standardet e detyrave
Këtu janë standardet e detyrave për të gjithë tubacionin bazuar në modelet e mësipërme të para-trajnuara. Rezultati i vonesës është vonesa mesatare në Pixel 6 duke përdorur CPU / GPU.
Emri i modelit | Vonesa e CPU-së | Vonesa e GPU-së |
---|---|---|
Detektor i gjuhës | 0.31 ms | - |