Zadanie MediaPipe Language Detector umożliwia wykrywanie języka, w jakim napisano tekst. To zadanie działa na danych tekstowych za pomocą modelu uczenia maszynowego (ML) i wyprowadza listę prognoz, z których każda składa się z kodu języka ISO 639-1 i prawdopodobieństwo.
Rozpocznij
Aby zacząć korzystać z tego zadania, postępuj zgodnie z jednym z tych przewodników dotyczących wdrażania na platformie docelowej. Te przewodniki dotyczące poszczególnych platform zawierają podstawowe informacje o wdrażaniu tego zadania, w tym zalecany model i przykład kodu z zalecanymi opcjami konfiguracji:
- Android – przykład kodu – przewodnik
 - Python – przykład kodu – przewodnik
 - Web – przykład kodu – przewodnik
 
Szczegóły działania
W tej sekcji opisano możliwości, dane wejściowe, dane wyjściowe i opcje konfiguracji tego zadania.
Funkcje
- Progień wyniku – filtrowanie wyników na podstawie wyników prognozy.
 - Lista dozwolonych i zablokowanych etykiet – określ wykryte kategorie.
 
| Dane wejściowe zadania | Dane wyjściowe | 
|---|---|
Detector języka obsługuje te typy danych wejściowych:
  | 
      Detector Language zwraca listę prognoz zawierającą:
  | 
    
Opcje konfiguracji
To zadanie ma te opcje konfiguracji:
| Nazwa opcji | Opis | Zakres wartości | Wartość domyślna | 
|---|---|---|---|
max_results | 
      Określa opcjonalną maksymalną liczbę prognoz językowych z najwyższymi wynikami do zwrócenia. Jeśli ta wartość jest mniejsza od 0, zwracane są wszystkie dostępne wyniki. | dowolne liczby dodatnie, | -1 | 
    
score_threshold | 
      Ustawia próg wyniku prognozy, który zastępuje próg podany w metadanych modelu (jeśli takie istnieją). Wyniki poniżej tej wartości są odrzucane. | Dowolna liczba zmiennych typu float | Nie ustawiono | 
category_allowlist | 
      Ustawia opcjonalną listę dozwolonych kodów języków. Jeśli niepuste prognozy języka mają kod języka, którego nie ma na tej liście, zostaną odfiltrowane. Ta opcja jest wzajemnie wykluczająca się z opcją category_denylist. Użycie obu spowoduje błąd. | 
      dowolne ciągi znaków; | Nie ustawiono | 
category_denylist | 
      Ustawia opcjonalną listę kodów języków, które są niedozwolone. Jeśli nie jest pusty, prognozy języka, których kod języka znajduje się w tym zbiorze, zostaną odfiltrowane. Ta opcja jest wzajemnie wykluczająca się z opcją category_allowlist, a użycie obu spowoduje błąd. | 
      dowolne ciągi znaków; | Nie ustawiono | 
Modele
Gdy rozpoczniesz tworzenie tego zadania, otrzymasz domyślny, zalecany model.
Model wykrywania języka (zalecany)
Ten model jest lekki (315 KB) i wykorzystuje architekturę klasyfikacji sieci neuronowych opartą na umieszczaniu. Model rozpoznaje język za pomocą kodu języka ISO 639-1 i może rozpoznać 110 języków. Listę języków obsługiwanych przez model znajdziesz w pliku etykiet, który zawiera języki według kodu ISO 639-1.
| Nazwa modelu | Kształt wejściowy | Typ kwantowania | Karta modelu | Wersje | 
|---|---|---|---|---|
| Language Detector | ciąg znaków UTF-8 | brak (float32) | info | Najnowsze | 
Porównania zadań
Poniżej znajdziesz punkty odniesienia zadań dla całego potoku na podstawie wymienionych powyżej wstępnie wytrenowanych modeli. Wynik opóźnienia to średnie opóźnienie na Pixelu 6 z wykorzystaniem procesora CPU lub GPU.
| Nazwa modelu | Czas oczekiwania procesora | Opóźnienie GPU | 
|---|---|---|
| Detector języka | 0,31 ms | - |