Mit der Aufgabe „MediaPipe Language Detector“ können Sie die Sprache eines Textabschnitts ermitteln. Diese Anweisungen, wie Sie den Sprachdetektor mit Python verwenden. Das Codebeispiel in dieser Anleitung beschrieben wird, ist auf GitHub
Sie können diese Aufgabe in Aktion sehen, indem Sie die demo ansehen. Weitere Informationen zu Funktionen, Modellen und Konfigurationsoptionen Sehen Sie sich die Übersicht an.
Codebeispiel
Der Beispielcode für Language Detector bietet eine vollständige Implementierung dieses in Python. Dieser Code hilft Ihnen, diese Aufgabe zu testen und mit der Entwicklung einer eigenen Spracherkennungsfunktion begonnen. Sie können Daten abrufen, ausführen und Spracherkennung bearbeiten Beispielcode ganz einfach in Ihrem Webbrowser.
Einrichtung
In diesem Abschnitt werden die wichtigsten Schritte zum Einrichten Ihrer Entwicklungsumgebung und Codeprojekte speziell für die Verwendung der Spracherkennung. Allgemeine Informationen zu Einrichten Ihrer Entwicklungsumgebung für die Verwendung von MediaPipe-Aufgaben, einschließlich Plattformversionsanforderungen finden Sie in der Einrichtungsleitfaden für Python
<ph type="x-smartling-placeholder">Pakete
Der Sprachdetektor verwendet das pip-Paket von mediapipe. Sie können die Abhängigkeit Dabei gilt:
$ python -m pip install mediapipe
Importe
Importieren Sie die folgenden Klassen, um auf die Aufgabenfunktionen der Spracherkennung zuzugreifen:
import mediapipe as mp
from mediapipe.tasks import python
from mediapipe.tasks.python import text
Modell
Für die Aufgabe „MediaPipe Language Detector“ ist ein trainiertes Modell erforderlich, das mit dieser . Weitere Informationen zu verfügbaren trainierten Modellen für die Spracherkennung finden Sie unter den Abschnitt Modelle in der Aufgabenübersicht.
Wählen Sie das Modell aus, laden Sie es herunter und speichern Sie es dann in Ihrem Projektverzeichnis:
model_path = '/absolute/path/to/language_detector.tflite'
Geben Sie den Pfad des Modells mit dem BaseOptions
-Objekt model_asset_path
an
wie unten gezeigt:
base_options = BaseOptions(model_asset_path=model_path)
Aufgabe erstellen
In der Aufgabe „MediaPipe Language Detector“ wird die Funktion create_from_options
mit der Funktion „MediaPipe Language Detector“ eingerichtet.
. Die Funktion create_from_options
akzeptiert Werte für die Konfiguration
um die Detektoroptionen festzulegen. Sie können die Aufgabe auch mit
die create_from_model_path
-Factory-Funktion. Das create_from_model_path
akzeptiert einen relativen oder absoluten Pfad zur Datei des trainierten Modells.
Weitere Informationen zum Konfigurieren von Aufgaben finden Sie unter
Konfigurationsoptionen.
Der folgende Code zeigt, wie diese Aufgabe erstellt und konfiguriert wird.
base_options = python.BaseOptions(model_asset_path=model_path)
options = text.LanguageDetectorOptions(base_options=base_options)
Konfigurationsoptionen
Diese Aufgabe bietet die folgenden Konfigurationsoptionen für Python-Anwendungen:
Option | Beschreibung | Wertebereich | Standardwert |
---|---|---|---|
max_results |
Legt die optionale maximale Anzahl der am besten bewerteten Sprachvorhersagen fest auf zurückgeben. Wenn dieser Wert kleiner als null ist, werden alle verfügbaren Ergebnisse zurückgegeben. | Beliebige positive Zahlen | -1 |
score_threshold |
Legt den Schwellenwert für die Vorhersagepunktzahl fest, der den Wert in die Modellmetadaten (falls vorhanden). Ergebnisse unter diesem Wert werden abgelehnt. | Beliebiger Gleitkommawert | Nicht festgelegt |
category_allowlist |
Legt die optionale Liste der zulässigen Sprachcodes fest. Wenn das Feld nicht leer ist,
Sprachvorhersagen, deren Sprachcode nicht in diesem Satz enthalten ist,
herausgefiltert. Diese Option schließt sich mit
category_denylist und die Verwendung beider führt zu einem Fehler. |
Alle Strings | Nicht festgelegt |
category_denylist |
Legt die optionale Liste der unzulässigen Sprachcodes fest. Wenn
nicht leer ist, werden Sprachvorhersagen, deren Sprachcode in diesem Satz enthalten ist, gefiltert
aus. Diese Option schließt sich mit category_allowlist und
führt dies zu einem Fehler. |
Alle Strings | Nicht festgelegt |
Daten vorbereiten
Die Spracherkennung funktioniert mit Textdaten (str
). Die Aufgabe verarbeitet die Dateneingabe
Vorverarbeitung, einschließlich Tokenisierung und Tensor-Vorverarbeitung. Alle
erfolgt die Vorverarbeitung in der Funktion detect
. Es ist nicht nötig,
zusätzliche Vorverarbeitung des Eingabetexts.
input_text = 'The input text to be classified.'
Aufgabe ausführen
Die Spracherkennung verwendet die Funktion detect
, um Inferenzen auszulösen. Für Sprache
Erkennung möglicher Sprachen für den Eingabetext.
Der folgende Code zeigt, wie die Verarbeitung mit der Aufgabe ausgeführt wird. Modell.
with python.text.LanguageDetector.create_from_options(options) as detector:
detection_result = detector.detect(input_text)
Ergebnisse verarbeiten und anzeigen
Die Spracherkennung gibt eine LanguageDetectorResult
aus, die aus einer Liste von
Sprachvorhersagen zusammen mit den Wahrscheinlichkeiten
für diese Vorhersagen abrufen.
Im Folgenden sehen Sie ein Beispiel für die Ausgabedaten dieser Aufgabe:
LanguageDetectorResult:
LanguagePrediction #0:
language_code: "fr"
probability: 0.999781
Dieses Ergebnis wurde erhalten, indem das Modell für den Eingabetext ausgeführt wurde:
"Il y a beaucoup de bouches qui parlent et fort peu de têtes qui pensent."
Beispiel für den Code, der zum Verarbeiten und Visualisieren der Ergebnisse erforderlich ist sehen Sie sich die Python-Beispielanwendung