Melakukan ekstraksi penyematan pada teks.
API ini mengharapkan model TFLite dengan Metadata Model TFLite (opsional).
Metadata diperlukan untuk model dengan tensor input int32 karena berisi unit proses input untuk Tokenizer model. Tidak ada metadata yang diperlukan untuk model dengan tensor input string.
- Tensor input
- Tiga tensor input (
kTfLiteInt32
) dari bentuk[batch_size x bert_max_seq_len]
yang mewakili ID input, ID mask, dan ID segmen. Tanda tangan input ini memerlukan unit proses Tokenizer BERT dalam metadata model. - Atau satu tensor input (
kTfLiteInt32
) dari bentuk[batch_size x max_seq_len]
yang mewakili ID input. Tanda tangan input ini memerlukan unit proses Tokenizer Regex dalam metadata model. - Atau satu tensor input (
kTfLiteString
) yang tidak berbentuk atau memiliki[1]
bentuk yang berisi string input.
- Tiga tensor input (
- Setidaknya satu tensor output (
kTfLiteFloat32
/kTfLiteUint8
) dengan bentuk[1 x N]
dengan N adalah jumlah dimensi dalam embedding yang dihasilkan.
Class Bertingkat
class | TextEmbedder.TextEmbedderOptions | Opsi untuk menyiapkan TextEmbedder . |
Metode Publik
void |
close()
Menutup dan membersihkan
TextEmbedder . |
statis ganda |
cosineSimilarity(Embedding u, Embedding v)
Fungsi utilitas untuk menghitung kesamaan
kosinus antara dua objek
Embedding . |
statis TextEmbedder |
createFromFile(Konteks konteks, String modelPath)
Membuat instance
TextEmbedder dari file model dan TextEmbedder.TextEmbedderOptions default. |
statis TextEmbedder |
createFromFile(Konteks konteks, File modelFile)
Membuat instance
TextEmbedder dari file model dan TextEmbedder.TextEmbedderOptions default. |
statis TextEmbedder |
createFromOptions(Konteks konteks, opsi TextEmbedder.TextEmbedderOptions)
Membuat instance
TextEmbedder dari TextEmbedder.TextEmbedderOptions . |
TextEmbedderResult |
Metode Turunan
Metode Publik
publik statis double cosineSimilarity (Embedding u, Embedding v)
Fungsi utilitas untuk menghitung kesamaan
kosinus antara dua objek Embedding
.
Parameter
u | |
---|---|
v |
Menampilkan
IllegalArgumentException | jika embedding memiliki jenis yang berbeda (float vs. terkuantisasi), memiliki ukuran yang berbeda, atau memiliki norma L2 0. |
---|
publik statis TextEmbedder createFromFile (Konteks konteks, String modelPath)
Membuat instance TextEmbedder
dari file model dan TextEmbedder.TextEmbedderOptions
default.
Parameter
context | ERROR(/Context) Android. |
---|---|
modelPath | ke model teks dengan metadata dalam aset. |
Menampilkan
jika terjadi error selama pembuatan TextEmbedder .
|
publik statis TextEmbedder createFromFile (Context context, File modelFile)
Membuat instance TextEmbedder
dari file model dan TextEmbedder.TextEmbedderOptions
default.
Parameter
context | ERROR(/Context) Android. |
---|---|
modelFile | instance File model teks. |
Menampilkan
IOException | jika terjadi error I/O saat membuka file model tflite. |
---|---|
jika terjadi error selama pembuatan TextEmbedder .
|
public static TextEmbedder createFromOptions (Konteks konteks, TextEmbedder.TextEmbedderOptions)
Membuat instance TextEmbedder
dari TextEmbedder.TextEmbedderOptions
.
Parameter
context | ERROR(/Context) Android. |
---|---|
opsi | instance TextEmbedder.TextEmbedderOptions . |
Menampilkan
jika terjadi error selama pembuatan TextEmbedder .
|
public TextEmbedderResult embed (String inputText)
Melakukan ekstraksi penyematan pada teks input.
Parameter
inputText | String untuk diproses.
|
---|