Detyra MediaPipe Language Detector ju lejon të identifikoni gjuhën e një pjese teksti. Këto udhëzime ju tregojnë se si të përdorni detektorin e gjuhës për aplikacionet në ueb dhe JavaScript. Shembulli i kodit i përshkruar në këto udhëzime është i disponueshëm në GitHub .
Ju mund ta shihni këtë detyrë në veprim duke parë demonstrimin . Për më shumë informacion rreth aftësive, modeleve dhe opsioneve të konfigurimit të kësaj detyre, shihni Përmbledhjen .
Shembull kodi
Shembulli i kodit për detektorin e gjuhës ofron një zbatim të plotë të kësaj detyre në JavaScript për referencën tuaj. Ky kod ju ndihmon të testoni këtë detyrë dhe të filloni të ndërtoni veçorinë tuaj të detektorit të gjuhës. Mund të shikoni, ekzekutoni dhe modifikoni shembullin e kodit të Detektorit të Gjuhës duke përdorur vetëm shfletuesin tuaj të internetit.
Konfigurimi
Ky seksion përshkruan hapat kryesorë për konfigurimin e mjedisit tuaj të zhvillimit dhe projekteve të kodit në mënyrë specifike për të përdorur Detektorin e gjuhës. Për informacion të përgjithshëm mbi konfigurimin e mjedisit tuaj të zhvillimit për përdorimin e detyrave të MediaPipe, duke përfshirë kërkesat e versionit të platformës, shihni udhëzuesin e konfigurimit për Ueb .
Paketat JavaScript
Kodi i detektorit të gjuhës është i disponueshëm përmes paketës @mediapipe/tasks-text
. Ju mund t'i gjeni dhe shkarkoni këto biblioteka nga lidhjet e dhëna në udhëzuesin e konfigurimit të platformës.
Ju mund të instaloni paketat e kërkuara me kodin e mëposhtëm për vendosjen lokale duke përdorur komandën e mëposhtme:
npm install @mediapipe/tasks-text
Nëse dëshironi të vendoseni në një server, mund të përdorni një shërbim të rrjetit të shpërndarjes së përmbajtjes (CDN), siç është jsDelivr , për të shtuar kodin direkt në faqen tuaj HTML, si më poshtë:
<head>
<script src="https://cdn.jsdelivr.net/npm/@mediapipe/tasks-text@latest/index.js"
crossorigin="anonymous"></script>
</head>
Model
Detyra MediaPipe Language Detector kërkon një model të trajnuar që është në përputhje me këtë detyrë. Për më shumë informacion mbi modelet e trajnuara të disponueshme për Detektorin e gjuhës, shihni seksionin Modelet e përmbledhjes së detyrave.
Zgjidhni dhe shkarkoni një model dhe më pas ruajeni në direktorinë e projektit tuaj:
<dev-project-root>/app/shared/models
Specifikoni shtegun e modelit me parametrin e objektit baseOptions
modelAssetPath
, siç tregohet më poshtë:
baseOptions: {
modelAssetPath: `/app/shared/models/language_detector.tflite`
}
Krijo detyrën
Përdorni një nga funksionet Language Detector LanguageDetector.createFrom...()
për të përgatitur detyrën për ekzekutimin e konkluzioneve. Ju mund të përdorni funksionin createFromModelPath()
me një shteg relative ose absolute drejt skedarit të modelit të trajnuar. Shembulli i kodit më poshtë tregon përdorimin e funksionit createFromOptions()
. Për më shumë informacion mbi konfigurimin e detyrave, shihni Opsionet e konfigurimit .
Kodi i mëposhtëm tregon se si të ndërtohet dhe konfigurohet kjo detyrë.
async function createDetector() {
const textFiles = await FilesetResolver.forTextTasks(
"https://cdn.jsdelivr.net/npm/@mediapipe/tasks-text@latest/wasm/");
languageDetector = await languageDetector.createFromOptions(
textFiles,
{
baseOptions: {
modelAssetPath: `https://storage.googleapis.com/mediapipe-models/language_detector/language_detector/float32/1/language_detector.tflite`
},
}
);
}
createDetector();
Opsionet e konfigurimit
Kjo detyrë ka opsionet e mëposhtme të konfigurimit për aplikacionet Web dhe JavaScript:
Emri i opsionit | Përshkrimi | Gama e vlerave | Vlera e paracaktuar |
---|---|---|---|
maxResults | Vendos numrin maksimal opsional të parashikimeve të gjuhës me pikët më të larta për t'u kthyer. Nëse kjo vlerë është më e vogël se zero, të gjitha rezultatet e disponueshme kthehen. | Çdo numër pozitiv | -1 |
scoreThreshold | Vendos pragun e rezultatit të parashikimit që tejkalon atë të dhënë në meta të dhënat e modelit (nëse ka). Rezultatet nën këtë vlerë refuzohen. | Çdo noton | Nuk është vendosur |
categoryAllowlist | Vendos listën opsionale të kodeve të gjuhëve të lejuara. Nëse nuk janë bosh, parashikimet e gjuhës, kodi i gjuhës së të cilave nuk është në këtë grup do të filtrohen. Ky opsion është reciprokisht ekskluziv me categoryDenylist dhe duke përdorur të dyja rezulton në një gabim. | Çdo varg | Nuk është vendosur |
categoryDenylist | Vendos listën opsionale të kodeve të gjuhëve që nuk lejohen. Nëse nuk janë bosh, parashikimet e gjuhës, kodi i gjuhës së të cilave është në këtë grup do të filtrohen. Ky opsion është reciprokisht ekskluziv me categoryAllowlist dhe duke përdorur të dyja rezultatet në një gabim. | Çdo varg | Nuk është vendosur |
Përgatitni të dhënat
Gjuha Detektor punon me tekst ( string
) të dhëna. Detyra trajton parapërpunimin e hyrjes së të dhënave, duke përfshirë parapërpunimin e tokenizimit dhe tensorit. Të gjitha parapërpunimit trajtohen brenda funksionit detect
. Nuk ka nevojë për përpunim shtesë të tekstit të hyrjes paraprakisht.
const inputText = "The input text for the detector.";
Drejtoni detyrën
Detektori i gjuhës përdor funksionin detect
për të nxjerrë përfundime. Për zbulimin e gjuhës, kjo nënkupton kthimin e gjuhëve të mundshme për tekstin hyrës.
Kodi i mëposhtëm tregon se si të ekzekutohet përpunimi me modelin e detyrës:
// Wait to run the function until inner text is set
const detectionResult = languageDetector.detect(inputText);
Trajtoni dhe shfaqni rezultatet
Detyra e "Detektori i gjuhës" nxjerr një Rezultat të LanguageDetectorResult
që përbëhet nga një listë parashikimesh gjuhësore së bashku me probabilitetet për ato parashikime. Më poshtë tregon një shembull të të dhënave dalëse nga kjo detyrë:
LanguageDetectorResult:
LanguagePrediction #0:
language_code: "fr"
probability: 0.999781
Ky rezultat është marrë duke ekzekutuar modelin në tekstin hyrës: "Il ya beaucoup de bouches qui parlent et fort peu de têtes qui pensent."
.
Për një shembull të kodit të kërkuar për të përpunuar dhe vizualizuar rezultatet e kësaj detyre, shihni aplikacionin mostër të Uebit .