TextEmbedder

classe final pública TextEmbedder

Executa a extração de embedding no texto.

Essa API espera um modelo TFLite com TFLite Model Metadata (opcional).

Os metadados são necessários para modelos com tensores de entrada int32 porque contêm a unidade do processo de entrada para o tokenizador do modelo. Nenhum metadado é necessário para modelos com tensores de entrada de string.

  • Tensores de entrada
    • Três tensores de entrada (kTfLiteInt32) do formato [batch_size x bert_max_seq_len] que representam os IDs de entrada, de máscara e de segmento. Essa assinatura de entrada requer uma unidade de processo do tokenizador Bert nos metadados do modelo.
    • Ou um tensor de entrada (kTfLiteInt32) de forma [batch_size x max_seq_len] que representa os IDs de entrada. Essa assinatura de entrada requer uma unidade de processo tokenizador de regex nos metadados do modelo.
    • Ou um tensor de entrada (kTfLiteString) que não tenha forma ou tenha a forma [1] contendo a string de entrada.
  • Pelo menos um tensor de saída (kTfLiteFloat32/kTfLiteUint8) com a forma [1 x N], em que N é o número de dimensões nos embeddings produzidos.

Classes aninhadas

classe TextEmbedder.TextEmbedderOptions Opções para configurar um TextEmbedder

Métodos públicos

void
close()
Fecha e limpa o TextEmbedder.
estático duplo
cosineSimilarity(Embedding u, Embedding v)
Função de utilitário para calcular a semelhança de cossenos entre dois objetos Embedding.
estático TextEmbedder
createFromFile(contexto de contexto, modelPath String)
Cria uma instância TextEmbedder com base em um arquivo de modelo e o TextEmbedder.TextEmbedderOptions padrão.
estático TextEmbedder
createFromFile(contexto de contexto, File modelFile)
Cria uma instância TextEmbedder com base em um arquivo de modelo e o TextEmbedder.TextEmbedderOptions padrão.
estático TextEmbedder
createFromOptions(Contexto do contexto, opções de TextEmbedder.TextEmbedderOptions)
TextEmbedderResult
embed(inputText String)
Executa a extração de embedding no texto de entrada.

Métodos herdados

Métodos públicos

public void close ()

Fecha e limpa o TextEmbedder.

public Static double cosineSimilarity (Embedding u, Embedding v)

Função de utilitário para calcular a semelhança de cossenos entre dois objetos Embedding.

Parâmetros
u
v
Gera
IllegalArgumentException se os embeddings forem de tipos diferentes (flutuação vs. quantizados), tiverem tamanhos distintos ou uma norma L2 de 0.

público estático TextEmbedder createFromFile (contexto de contexto, String modelPath)

Cria uma instância TextEmbedder com base em um arquivo de modelo e o TextEmbedder.TextEmbedderOptions padrão.

Parâmetros
contexto um ERROR(/Context) do Android.
modelPath caminho para o modelo de texto com metadados nos recursos.
Gera
se houver um erro durante a criação de TextEmbedder.

público estático TextEmbedder createFromFile (contexto de contexto, arquivo modelFile)

Cria uma instância TextEmbedder com base em um arquivo de modelo e o TextEmbedder.TextEmbedderOptions padrão.

Parâmetros
contexto um ERROR(/Context) do Android.
modelFile a instância File do modelo de texto.
Gera
IOException se ocorrer um erro de E/S ao abrir o arquivo do modelo do tflite.
se houver um erro durante a criação de TextEmbedder.

public Static TextEmbedder createFromOptions (contexto de contexto, TextEmbedder.TextEmbedderOptions opções)

Parâmetros
contexto um ERROR(/Context) do Android.
do modelo. uma instância TextEmbedder.TextEmbedderOptions.
Gera
se houver um erro durante a criação de TextEmbedder.

public TextEmbedderResult embed (String inputText)

Executa a extração de embedding no texto de entrada.

Parâmetros
inputText um String para processamento.