Zadanie MediaPipe Language Detector pozwala określić język tekstu. Te instrukcje pokazują, jak używać Wykrywacza języka w aplikacjach internetowych i JavaScript. Przykładowy kod opisany w tych instrukcjach jest dostępny na GitHub
Aby zobaczyć, jak działa to zadanie, wyświetl demo. Więcej informacji o funkcjach, modelach i opcjach konfiguracji zapoznaj się z Przeglądem.
Przykładowy kod
Przykładowy kod Wykrywanie języka zapewnia pełną implementację tego w JavaScripcie. Ten kod pomoże Ci przetestować to zadanie i zacznij tworzyć własną funkcję wykrywania języka. Możesz wyświetlać, uruchamiać i edytuj Przykładowy kod wykrywania języka tylko za pomocą przeglądarki.
Konfiguracja
W tej sekcji opisujemy najważniejsze czynności związane z konfigurowaniem środowiska programistycznego oraz w projektach kodu służących do wykrywania języka. Ogólne informacje na temat: skonfigurować środowisko programistyczne do korzystania z zadań MediaPipe, w tym wymagań wersji platformy, patrz Przewodnik po konfiguracji stron internetowych
Pakiety JavaScript
Kod wzorca do wykrywania języka jest dostępny w
@mediapipe/tasks-text
pakietu SDK. Biblioteki te możesz znaleźć i pobrać za pomocą linków podanych w
platforma
Przewodnik po konfiguracji
Wymagane pakiety możesz zainstalować za pomocą tego kodu lokalnego środowiska przejściowego. za pomocą tego polecenia:
npm install @mediapipe/tasks-text
Jeśli chcesz wdrożyć aplikację na serwerze, możesz skorzystać z narzędzia Dostawy treści z usługi sieciowej (CDN), takiej jak jsDelivr, w dodaj kod bezpośrednio do strony HTML w następujący sposób:
<head>
<script src="https://cdn.jsdelivr.net/npm/@mediapipe/tasks-text@latest/index.js"
crossorigin="anonymous"></script>
</head>
Model
Zadanie wykrywania języka MediaPipe wymaga wytrenowanego modelu zgodnego z tym zadanie. Więcej informacji o dostępnych wytrenowanych modelach z Wykrywaczem języka znajdziesz w sekcji artykułu zapoznaj się z omówieniem zadania sekcją Modele.
Wybierz i pobierz model, a następnie zapisz go w katalogu projektu:
<dev-project-root>/app/shared/models
Określ ścieżkę modelu za pomocą obiektu baseOptions modelAssetPath
Jak poniżej:
baseOptions: {
modelAssetPath: `/app/shared/models/language_detector.tflite`
}
Tworzenie zadania
Użyj jednej z funkcji wykrywania języka LanguageDetector.createFrom...(), aby:
przygotować zadanie do uruchamiania wniosków. Za pomocą usługi createFromModelPath()
ze ścieżką względną lub bezwzględną do pliku wytrenowanego modelu. Kod
poniżej pokazujemy, jak używać funkcji createFromOptions(). Więcej
informacji na temat konfigurowania zadań, zobacz
Opcje konfiguracji:
Poniższy kod pokazuje, jak skompilować i skonfigurować to zadanie.
async function createDetector() {
const textFiles = await FilesetResolver.forTextTasks(
"https://cdn.jsdelivr.net/npm/@mediapipe/tasks-text@latest/wasm/");
languageDetector = await languageDetector.createFromOptions(
textFiles,
{
baseOptions: {
modelAssetPath: `https://storage.googleapis.com/mediapipe-models/language_detector/language_detector/float32/1/language_detector.tflite`
},
}
);
}
createDetector();
Opcje konfiguracji
To zadanie zawiera poniższe opcje konfiguracji dla stron internetowych i JavaScriptu aplikacje:
| Nazwa opcji | Opis | Zakres wartości | Wartość domyślna |
|---|---|---|---|
maxResults |
Ustawia opcjonalną maksymalną liczbę prognoz dotyczących najlepiej ocenianych języków na . Jeśli ta wartość jest mniejsza niż 0, zwracane są wszystkie dostępne wyniki. | Dowolne liczby dodatnie | -1 |
scoreThreshold |
Ustawia próg wyniku prognozy, który zastępuje próg podany w polu metadane modelu (jeśli występują). Wyniki poniżej tej wartości zostały odrzucone. | Dowolna liczba zmiennoprzecinkowa | Nie ustawiono |
categoryAllowlist |
Ustawia opcjonalną listę dozwolonych kodów języków. Jeśli pole nie jest puste,
prognozy dotyczące języka, których kod języka nie znajduje się w tym zestawie, zostaną
zostały odfiltrowane. Ta opcja wyklucza się wzajemnie z:
categoryDenylist i użycie obu spowoduje błąd. |
Dowolne ciągi | Nie ustawiono |
categoryDenylist |
Ustawia opcjonalną listę niedozwolonych kodów języków. Jeśli
niepuste, prognozy dotyczące języka, których kod języka znajduje się w tym zestawie, zostaną odfiltrowane
na zewnątrz. Ta opcja nie działa z: categoryAllowlist i
użycie obydwu spowoduje błąd. |
Dowolne ciągi | Nie ustawiono |
Przygotuj dane
Wykrywanie języka obsługuje dane tekstowe (string). Zadanie obsługuje
wstępne przetwarzanie danych wejściowych, w tym tokenizację i wstępne przetwarzanie Tensor.
Całe wstępne przetwarzanie odbywa się w ramach funkcji detect. Nie ma potrzeby
aby wstępnie przetworzyć tekst wejściowy.
const inputText = "The input text for the detector.";
Uruchamianie zadania
Wykrywanie języka używa funkcji detect do aktywowania wniosków. Język
oznacza zwrócenie możliwych języków do wprowadzania tekstu.
Ten kod pokazuje, jak wykonać przetwarzanie za pomocą zadania model:
// Wait to run the function until inner text is set
const detectionResult = languageDetector.detect(inputText);
Obsługa i wyświetlanie wyników
Zadanie Wykrywacz języka zwraca wynik LanguageDetectorResult składający się z listy
między prognozami językowymi a prawdopodobieństwem.
poniżej znajdziesz przykład danych wyjściowych zadania:
LanguageDetectorResult:
LanguagePrediction #0:
language_code: "fr"
probability: 0.999781
Ten wynik uzyskano przez uruchomienie modelu na tekście wejściowym:
"Il y a beaucoup de bouches qui parlent et fort peu de têtes qui pensent."
Przykład kodu wymaganego do przetwarzania i wizualizacji wyników tego zadania, zobacz Przykładowa aplikacja internetowa –