Google AI Edge Portal: Edge-KI im großen Maßstab benchmarken. Melden Sie sich an, um während der privaten Vorschau Zugriff anzufordern.

Leitfaden zur Spracherkennung für Python

Mit der Aufgabe „MediaPipe Language Detector“ können Sie die Sprache eines Textabschnitts ermitteln. Diese Anweisungen, wie Sie den Sprachdetektor mit Python verwenden. Das Codebeispiel in dieser Anleitung beschrieben wird, ist auf GitHub

Sie können diese Aufgabe in Aktion sehen, indem Sie die Demo ansehen. Weitere Informationen zu Funktionen, Modellen und Konfigurationsoptionen Sehen Sie sich die Übersicht an.

Codebeispiel

Der Beispielcode für Language Detector bietet eine vollständige Implementierung dieses in Python. Dieser Code hilft Ihnen, diese Aufgabe zu testen und mit der Entwicklung einer eigenen Spracherkennungsfunktion begonnen. Sie können Daten abrufen, ausführen und Language Detector bearbeiten Beispielcode ganz einfach in Ihrem Webbrowser.

Einrichtung

In diesem Abschnitt werden die wichtigsten Schritte zum Einrichten Ihrer Entwicklungsumgebung und Codeprojekte speziell für die Verwendung der Spracherkennung. Allgemeine Informationen zu Einrichten Ihrer Entwicklungsumgebung für die Verwendung von MediaPipe-Aufgaben, einschließlich Plattformversionsanforderungen finden Sie in der Einrichtungsleitfaden für Python

Pakete

Der Sprachdetektor verwendet das pip-Paket von mediapipe. Sie können die Abhängigkeit Dabei gilt:

$ python -m pip install mediapipe

Importe

Importieren Sie die folgenden Klassen, um auf die Aufgabenfunktionen der Spracherkennung zuzugreifen:

import mediapipe as mp
from mediapipe.tasks import python
from mediapipe.tasks.python import text

Modell

Für die Aufgabe „MediaPipe Language Detector“ ist ein trainiertes Modell erforderlich, das mit dieser für die Aufgabe. Weitere Informationen zu verfügbaren trainierten Modellen für die Spracherkennung finden Sie unter den Abschnitt Modelle in der Aufgabenübersicht.

Wählen Sie das Modell aus, laden Sie es herunter und speichern Sie es dann in Ihrem Projektverzeichnis:

model_path = '/absolute/path/to/language_detector.tflite'

Geben Sie den Pfad des Modells mit dem BaseOptions-Objekt model_asset_path an wie unten gezeigt:

base_options = BaseOptions(model_asset_path=model_path)

Aufgabe erstellen

In der Aufgabe „MediaPipe Language Detector“ wird die Funktion create_from_options mit der Funktion „MediaPipe Language Detector“ eingerichtet. für die Aufgabe. Die Funktion create_from_options akzeptiert Werte für die Konfiguration um die Detektoroptionen festzulegen. Sie können die Aufgabe auch mit die Factory-Funktion create_from_model_path. Das create_from_model_path akzeptiert einen relativen oder absoluten Pfad zur Datei des trainierten Modells. Weitere Informationen zum Konfigurieren von Aufgaben finden Sie unter Konfigurationsoptionen.

Der folgende Code zeigt, wie diese Aufgabe erstellt und konfiguriert wird.

base_options = python.BaseOptions(model_asset_path=model_path)
options = text.LanguageDetectorOptions(base_options=base_options)

Konfigurationsoptionen

Diese Aufgabe bietet die folgenden Konfigurationsoptionen für Python-Anwendungen:

Option	Beschreibung	Wertebereich	Standardwert
`max_results`	Legt die optionale maximale Anzahl der am besten bewerteten Sprachvorhersagen fest auf zurückgeben. Wenn dieser Wert kleiner als null ist, werden alle verfügbaren Ergebnisse zurückgegeben.	Beliebige positive Zahlen	`-1`
`score_threshold`	Legt den Schwellenwert für die Vorhersagepunktzahl fest, der den Wert in die Modellmetadaten (falls vorhanden). Ergebnisse unter diesem Wert werden abgelehnt.	Beliebiger Gleitkommawert	Nicht festgelegt
`category_allowlist`	Legt die optionale Liste der zulässigen Sprachcodes fest. Wenn das Feld nicht leer ist, Sprachvorhersagen, deren Sprachcode nicht in diesem Satz enthalten ist, herausgefiltert. Diese Option schließt sich mit `category_denylist` und die Verwendung beider führt zu einem Fehler.	Alle Strings	Nicht festgelegt
`category_denylist`	Legt die optionale Liste der unzulässigen Sprachcodes fest. Wenn nicht leer ist, werden Sprachvorhersagen, deren Sprachcode in diesem Satz enthalten ist, gefiltert aus. Diese Option schließt sich mit `category_allowlist` und führt dies zu einem Fehler.	Alle Strings	Nicht festgelegt

Daten vorbereiten

Die Spracherkennung funktioniert mit Textdaten (str). Die Aufgabe verarbeitet die Dateneingabe Vorverarbeitung, einschließlich Tokenisierung und Tensor-Vorverarbeitung. Alle erfolgt die Vorverarbeitung in der Funktion detect. Es ist nicht nötig, zusätzliche Vorverarbeitung des Eingabetexts.

input_text = 'The input text to be classified.'

Aufgabe ausführen

Die Spracherkennung verwendet die Funktion detect, um Inferenzen auszulösen. Für Sprache Erkennung möglicher Sprachen für den Eingabetext.

Der folgende Code zeigt, wie die Verarbeitung mit der Aufgabe ausgeführt wird. modellieren.

with python.text.LanguageDetector.create_from_options(options) as detector:
  detection_result = detector.detect(input_text)

Ergebnisse verarbeiten und anzeigen

Die Spracherkennung gibt eine LanguageDetectorResult aus, die aus einer Liste von Sprachvorhersagen zusammen mit den Wahrscheinlichkeiten für diese Vorhersagen abrufen. Im Folgenden sehen Sie ein Beispiel für die Ausgabedaten dieser Aufgabe:

LanguageDetectorResult:
  LanguagePrediction #0:
    language_code: "fr"
    probability: 0.999781

Dieses Ergebnis wurde erhalten, indem das Modell für den Eingabetext ausgeführt wurde: "Il y a beaucoup de bouches qui parlent et fort peu de têtes qui pensent."

Beispiel für den Code, der zum Verarbeiten und Visualisieren der Ergebnisse erforderlich ist sehen Sie sich die Python-Beispielanwendung