TextEmbedder

class final public TextEmbedder

Melakukan ekstraksi penyematan pada teks.

API ini mengharapkan model TFLite dengan Metadata Model TFLite (opsional).

Metadata diperlukan untuk model dengan tensor input int32 karena berisi unit proses input untuk Tokenizer model. Tidak ada metadata yang diperlukan untuk model dengan tensor input string.

  • Tensor input
    • Tiga tensor input (kTfLiteInt32) dari bentuk [batch_size x bert_max_seq_len] yang mewakili ID input, ID mask, dan ID segmen. Tanda tangan input ini memerlukan unit proses Tokenizer BERT dalam metadata model.
    • Atau satu tensor input (kTfLiteInt32) dari bentuk [batch_size x max_seq_len] yang mewakili ID input. Tanda tangan input ini memerlukan unit proses Tokenizer Regex dalam metadata model.
    • Atau satu tensor input (kTfLiteString) yang tidak berbentuk atau memiliki [1] bentuk yang berisi string input.
  • Setidaknya satu tensor output (kTfLiteFloat32/kTfLiteUint8) dengan bentuk [1 x N] dengan N adalah jumlah dimensi dalam embedding yang dihasilkan.

Class Bertingkat

class TextEmbedder.TextEmbedderOptions Opsi untuk menyiapkan TextEmbedder

Metode Publik

void
close()
Menutup dan membersihkan TextEmbedder.
statis ganda
cosineSimilarity(Embedding u, Embedding v)
Fungsi utilitas untuk menghitung kesamaan kosinus antara dua objek Embedding.
statis TextEmbedder
createFromFile(Konteks konteks, String modelPath)
Membuat instance TextEmbedder dari file model dan TextEmbedder.TextEmbedderOptions default.
statis TextEmbedder
createFromFile(Konteks konteks, File modelFile)
Membuat instance TextEmbedder dari file model dan TextEmbedder.TextEmbedderOptions default.
statis TextEmbedder
TextEmbedderResult
embed(String inputText)
Melakukan ekstraksi penyematan pada teks input.

Metode Turunan

Metode Publik

public void close ()

Menutup dan membersihkan TextEmbedder.

publik statis double cosineSimilarity (Embedding u, Embedding v)

Fungsi utilitas untuk menghitung kesamaan kosinus antara dua objek Embedding.

Parameter
u
v
Menampilkan
IllegalArgumentException jika embedding memiliki jenis yang berbeda (float vs. terkuantisasi), memiliki ukuran yang berbeda, atau memiliki norma L2 0.

publik statis TextEmbedder createFromFile (Konteks konteks, String modelPath)

Membuat instance TextEmbedder dari file model dan TextEmbedder.TextEmbedderOptions default.

Parameter
context ERROR(/Context) Android.
modelPath ke model teks dengan metadata dalam aset.
Menampilkan
jika terjadi error selama pembuatan TextEmbedder.

publik statis TextEmbedder createFromFile (Context context, File modelFile)

Membuat instance TextEmbedder dari file model dan TextEmbedder.TextEmbedderOptions default.

Parameter
context ERROR(/Context) Android.
modelFile instance File model teks.
Menampilkan
IOException jika terjadi error I/O saat membuka file model tflite.
jika terjadi error selama pembuatan TextEmbedder.

public static TextEmbedder createFromOptions (Konteks konteks, TextEmbedder.TextEmbedderOptions)

Parameter
context ERROR(/Context) Android.
opsi instance TextEmbedder.TextEmbedderOptions.
Menampilkan
jika terjadi error selama pembuatan TextEmbedder.

public TextEmbedderResult embed (String inputText)

Melakukan ekstraksi penyematan pada teks input.

Parameter
inputText String untuk diproses.