Führt eine Einbettungsextraktion auf Text durch.
Diese API erwartet ein TFLite-Modell mit (optionalen) TFLite-Modellmetadaten.
Für Modelle mit int32-Eingabetensoren sind Metadaten erforderlich, da sie die Eingabeprozesseinheit für den Tokenizer des Modells enthalten. Für Modelle mit Stringeingabetensoren sind keine Metadaten erforderlich.
- Eingabetensoren
- Drei Eingabetensoren (
kTfLiteInt32) der Form[batch_size x bert_max_seq_len], die die Eingabe-IDs, Masken-IDs und Segment-IDs darstellen. Für diese Eingabesignatur ist eine Bert Tokenizer-Prozesseinheit in den Modellmetadaten erforderlich. - Oder ein Eingabetensor (
kTfLiteInt32) der Form[batch_size x max_seq_len], der die Eingabe-IDs darstellt. Diese Eingabesignatur erfordert eine Regex Tokenizer-Prozesseinheit in den Modellmetadaten. - Oder einen Eingabetensor (
kTfLiteString), der formlos ist oder die Form[1]hat, die den Eingabestring enthält.
- Drei Eingabetensoren (
- Mindestens einen Ausgabetensor (
kTfLiteFloat32/kTfLiteUint8) mit der Form[1 x N], wobei N die Anzahl der Dimensionen in den erzeugten Einbettungen ist.
Verschachtelte Klassen
| Klasse | TextEmbedder.TextEmbedderOptions | Optionen zum Einrichten eines TextEmbedder-Objekts. |
|
Public Methods
| void |
close()
Schließt und bereinigt das
TextEmbedder. |
| static Double |
cosineSimilarity(Einbettung u, Einbetten v)
Dienstprogrammfunktion zum Berechnen der Kosinus-Ähnlichkeit zwischen zwei
Embedding-Objekten. |
| Statischer TextEmbedder |
createFromFile(Kontextkontext, String ModelPath)
Erstellt eine
TextEmbedder-Instanz aus einer Modelldatei und der Standard-TextEmbedder.TextEmbedderOptions. |
| Statischer TextEmbedder |
createFromFile(Kontextkontext, File-Modelldatei)
Erstellt eine
TextEmbedder-Instanz aus einer Modelldatei und der Standard-TextEmbedder.TextEmbedderOptions. |
| Statischer TextEmbedder |
createFromOptions(Context context, TextEmbedder.TextEmbedderOptions-Optionen)
Erstellt eine
TextEmbedder-Instanz aus TextEmbedder.TextEmbedderOptions. |
| TextEmbedderResult |
Übernommene Methoden
Public Methods
public static double cosineSimilarity (Embedding u, Embedding v)
Dienstprogrammfunktion zum Berechnen der Kosinus-Ähnlichkeit zwischen zwei Embedding-Objekten.
Parameter
| u | |
|---|---|
| v |
Löst aus
| IllegalArgumentException | die Einbettungen unterschiedlicher Typen (Gleitkommazahl oder quantisiert) sind, unterschiedliche Größen haben oder eine L2-Norm von 0 haben. |
|---|
public static TextEmbedder createFromFile (Kontextkontext, String modelPath)
Erstellt eine TextEmbedder-Instanz aus einer Modelldatei und der Standard-TextEmbedder.TextEmbedderOptions.
Parameter
| context | ein Android-ERROR(/Context). |
|---|---|
| modelPath | Pfad zum Textmodell mit Metadaten in den Assets. |
Löst aus
wenn beim Erstellen von TextEmbedder ein Fehler auftritt.
|
public static TextEmbedder createFromFile (Kontextkontext, Datei Modelldatei)
Erstellt eine TextEmbedder-Instanz aus einer Modelldatei und der Standard-TextEmbedder.TextEmbedderOptions.
Parameter
| context | ein Android-ERROR(/Context). |
|---|---|
| modelFile | Die File-Instanz des Textmodells. |
Löst aus
| IOException | Wenn beim Öffnen der TFlite-Modelldatei ein E/A-Fehler auftritt. |
|---|---|
Wenn beim Erstellen von TextEmbedder ein Fehler auftritt.
|
public static TextEmbedder createFromOptions (Context context, TextEmbedder.TextEmbedderOptions-Optionen)
Erstellt eine TextEmbedder-Instanz aus TextEmbedder.TextEmbedderOptions.
Parameter
| context | ein Android-ERROR(/Context). |
|---|---|
| Optionen | Eine TextEmbedder.TextEmbedderOptions-Instanz. |
Löst aus
Wenn beim Erstellen von TextEmbedder ein Fehler auftritt.
|
public TextEmbedderResult embed (String inputText)
Führt eine Einbettungsextraktion auf den Eingabetext durch.
Parameter
| inputText | String für die Verarbeitung.
|
|---|