TextEmbedder

publiczna klasa końcowego TextEmbedder

Przeprowadza wyodrębnianie osadzone w tekście.

Ten interfejs API wymaga modelu TFLite z (opcjonalnie) metadanymi modelu TFLite.

Metadane są wymagane w przypadku modeli z tensorami wejściowymi int32, ponieważ zawierają one jednostkę procesu wejściowego tokenizatora modelu. W przypadku modeli z tensorami wejściowymi w postaci ciągów znaków nie są wymagane żadne metadane.

  • Tensory wejściowe
    • Trzy tensory wejściowe (kTfLiteInt32) kształtu [batch_size x bert_max_seq_len] reprezentujące identyfikatory wejściowe, maski oraz identyfikatory segmentów. Ten podpis wejściowy wymaga jednostki procesu tokenizatora Berta w metadanych modelu.
    • Lub jeden tensor wejściowy (kTfLiteInt32) kształtu [batch_size x max_seq_len] reprezentujący identyfikatory wejściowe. Ten podpis wejściowy wymaga jednostki procesu tokenizatora wyrażeń regularnych w metadanych modelu.
    • lub jeden tensor wejściowy (kTfLiteString), który nie ma kształtu lub ma kształt [1] zawierający ciąg wejściowy.
  • Co najmniej jeden tensor wyjściowy (kTfLiteFloat32/kTfLiteUint8) o kształcie [1 x N], gdzie N to liczba wymiarów w utworzonych wektorach dystrybucyjnych.

Zagnieżdżone klasy

klasa TextEmbedder.TextEmbedderOptions Opcje konfigurowania: TextEmbedder 

Metody publiczne

void
close()
Zamyka i czyści TextEmbedder.
podwójne statyczne
cosineSimilarity(Umieszczanie u, Umieszczanie v)
Funkcja użytkowa do obliczania podobieństwa cosinusowego między 2 obiektami Embedding.
static TextEmbedder
createFromFile(Kontekst; ciąg znaków modelPath)
Tworzy instancję TextEmbedder z pliku modelu i domyślne TextEmbedder.TextEmbedderOptions.
static TextEmbedder
createFromFile(kontekst; plik modelFile)
Tworzy instancję TextEmbedder z pliku modelu i domyślne TextEmbedder.TextEmbedderOptions.
static TextEmbedder
TextEmbedderResult
embed(String inputText)
Przeprowadza wyodrębnianie osadzone na tekście wejściowym.

Metody dziedziczone

Metody publiczne

public void close ()

Zamyka i czyści TextEmbedder.

public static double cosineSimilarity (Umieszczanie u, Umieszczanie v)

Funkcja użytkowa do obliczania podobieństwa cosinusowego między 2 obiektami Embedding.

Parametry
U
v
Rzuty
IllegalArgumentException gdy wektory dystrybucyjne są różnego typu (zmiennoprzecinkowe lub skwantyzowane), mają różne rozmiary lub normę L2 równą 0.

public static TextEmbedder createFromFile (Kontekst kontekst, String modelPath)

Tworzy instancję TextEmbedder z pliku modelu i domyślne TextEmbedder.TextEmbedderOptions.

Parametry
sytuacja ERROR(/Context) na Androidzie.
modelPath do modelu tekstowego z metadanymi w zasobach.
Rzuty
jeśli podczas tworzenia zbioru danych TextEmbedder wystąpi błąd.

public static TextEmbedder createFromFile (Kontekst kontekst, Plik modelFile)

Tworzy instancję TextEmbedder z pliku modelu i domyślne TextEmbedder.TextEmbedderOptions.

Parametry
sytuacja ERROR(/Context) na Androidzie.
modelFile instancję modelu tekstowego File.
Rzuty
IOException jeśli podczas otwierania pliku modelu tflite wystąpi błąd wejścia-wyjścia.
jeśli podczas tworzenia zbioru danych TextEmbedder wystąpi błąd.

public static TextEmbedder createFromOptions (Kontekst; opcje TextEmbedder.TextEmbedderOptions)

Tworzy instancję TextEmbedder z platformy TextEmbedder.TextEmbedderOptions.

Parametry
sytuacja ERROR(/Context) na Androidzie.
Opcje instancję TextEmbedder.TextEmbedderOptions.
Rzuty
jeśli podczas tworzenia zbioru danych TextEmbedder wystąpi błąd.

public TextEmbedderResult embed (String inputText)

Przeprowadza wyodrębnianie osadzone na tekście wejściowym.

Parametry
inputText String do przetworzenia.