TextEmbedder

classe pubblica finale TextEmbedder

Esegue l'estrazione dell'incorporamento sul testo.

Questa API prevede un modello TFLite con metadati del modello TFLite (facoltativi).

I metadati sono obbligatori per i modelli con tensori di input int32 perché contengono l'unità di processo di input per il tokenizzatore del modello. Non sono richiesti metadati per i modelli con tensori di input di stringhe.

  • Tensori di input
    • Tre tensori di input (kTfLiteInt32) di forma [batch_size x bert_max_seq_len] che rappresentano gli ID di input, gli ID maschera e gli ID segmento. Questa firma di input richiede un'unità di processo BERT Tokenizer nei metadati del modello.
    • Oppure un tensore di input (kTfLiteInt32) di forma [batch_size x max_seq_len] che rappresenta gli ID di input. Questa firma di input richiede un'unità di processo Regex Tokenizer nei metadati del modello.
    • Oppure un tensore di input (kTfLiteString) senza forma o con una forma [1] contenente la stringa di input.
  • Almeno un tensore di output (kTfLiteFloat32/kTfLiteUint8) con forma [1 x N], dove N è il numero di dimensioni negli incorporamenti prodotti.

Corsi nidificati

classe TextEmbedder.TextEmbedderOptions Opzioni per configurare un TextEmbedder

Metodi pubblici

void
close()
Chiude e pulisce TextEmbedder.
statico doppio
cosineSimilarity(Embedding u, Embedding v)
Funzione di utilità per calcolare la somiglianza coseno tra due oggetti Embedding.
statico TextEmbedder
createFromFile(Contesto del contesto, Stringa modelPath)
Crea un'istanza TextEmbedder da un file del modello e dal valore predefinito TextEmbedder.TextEmbedderOptions.
statico TextEmbedder
createFromFile(Contesto del contesto, File modelFile)
Crea un'istanza TextEmbedder da un file del modello e dal valore predefinito TextEmbedder.TextEmbedderOptions.
statico TextEmbedder
TextEmbedderResult
embed(Stringa inputText)
Esegue l'estrazione dell'incorporamento sul testo di input.

Metodi ereditati

Metodi pubblici

pubblica void chiudi ()

Chiude e pulisce TextEmbedder.

pubblico statico doppio cosineSimilarity (Embedding u, Embedding v)

Funzione di utilità per calcolare la somiglianza coseno tra due oggetti Embedding.

Parametri
u
v
Lanci
IllegalArgumentException gli incorporamenti sono di tipo diverso (in virgola mobile o quantizzato), hanno dimensioni diverse o hanno una norma L2 pari a 0.

pubblico static TextEmbedder createFromFile (Contesto del contesto, Stringa modelPath)

Crea un'istanza TextEmbedder da un file del modello e dal valore predefinito TextEmbedder.TextEmbedderOptions.

Parametri
context un ERROR(/Context) Android.
modelPath del modello di testo con metadati negli asset.
Lanci
in caso di errore durante la creazione di TextEmbedder.

pubblico statico TextEmbedder createFromFile (Contesto del contesto, File modelFile)

Crea un'istanza TextEmbedder da un file del modello e dal valore predefinito TextEmbedder.TextEmbedderOptions.

Parametri
context un ERROR(/Context) Android.
modelFile l'istanza del modello di testo File.
Lanci
IOException se si verifica un errore I/O all'apertura del file del modello tflite.
in caso di errore durante la creazione di TextEmbedder.

pubblico static TextEmbedder createFromOptions (contesto di contesto, opzioni TextEmbedder.TextEmbedderOptions)

Parametri
context un ERROR(/Context) Android.
opzioni del modello. un'istanza TextEmbedder.TextEmbedderOptions.
Lanci
in caso di errore durante la creazione di TextEmbedder.

pubblici TextEmbedderResult embed (String inputText)

Esegue l'estrazione dell'incorporamento sul testo di input.

Parametri
inputText un String per l'elaborazione.