TextEmbedder

공개 최종 클래스 TextEmbedder

텍스트에서 임베딩 추출을 수행합니다.

이 API에는 TFLite 모델 메타데이터 (선택사항)가 포함된 TFLite 모델이 필요합니다.

메타데이터는 모델의 Tokenizer에 대한 입력 프로세스 단위를 포함하므로 int32 입력 텐서가 있는 모델에 필요합니다. 문자열 입력 텐서가 있는 모델에는 메타데이터가 필요하지 않습니다.

  • 입력 텐서
    • 입력 ID, 마스크 ID, 세그먼트 ID를 나타내는 [batch_size x bert_max_seq_len] 형태의 입력 텐서 (kTfLiteInt32) 3개 이 입력 서명에는 모델 메타데이터에 Bert Tokenizer 프로세스 단위가 필요합니다.
    • 또는 입력 ID를 나타내는 모양 [batch_size x max_seq_len]의 입력 텐서 (kTfLiteInt32) 1개. 이 입력 서명에는 모델 메타데이터에 Regex Tokenizer 프로세스 단위가 필요합니다.
    • 또는 형태가 없거나 입력 문자열을 포함하는 형태 [1]을 갖는 하나의 입력 텐서 (kTfLiteString)
  • 형태가 [1 x N]인 출력 텐서(kTfLiteFloat32/kTfLiteUint8) 1개 이상(여기서 N은 생성된 임베딩의 차원 수입니다.)

중첩된 클래스

클래스 TextEmbedder.TextEmbedderOptions TextEmbedder 설정 옵션 

공개 메서드

void
close()
TextEmbedder를 닫고 정리합니다.
정적 double
cosineSimilarity(임베딩, 임베딩 v)
Embedding 객체 간의 코사인 유사성을 계산하는 유틸리티 함수입니다.
정적 TextEmbedder
createFromFile(컨텍스트 컨텍스트, String modelPath)
모델 파일과 기본 TextEmbedder.TextEmbedderOptions에서 TextEmbedder 인스턴스를 생성합니다.
정적 TextEmbedder
createFromFile(컨텍스트 컨텍스트, 파일 modelFile)
모델 파일과 기본 TextEmbedder.TextEmbedderOptions에서 TextEmbedder 인스턴스를 생성합니다.
정적 TextEmbedder
createFromOptions(컨텍스트 컨텍스트, TextEmbedder.TextEmbedderOptions 옵션)
TextEmbedder.TextEmbedderOptions에서 TextEmbedder 인스턴스를 만듭니다.
TextEmbedderResult
embed(String inputText)
입력 텍스트에서 임베딩 추출을 수행합니다.

상속된 메서드

공개 메서드

public void close ()

TextEmbedder를 닫고 정리합니다.

public static double cosineSimilarity (임베딩 u, 임베딩 v)

Embedding 객체 간의 코사인 유사성을 계산하는 유틸리티 함수입니다.

매개변수
u
v
생성 값
IllegalArgumentException 임베딩이 다른 유형 (부동 소수점 수와 양자화됨)이거나 크기가 다르거나 L2-norm이 0인 경우입니다.

public static TextEmbedder createFromFile (Context context, String modelPath)

모델 파일과 기본 TextEmbedder.TextEmbedderOptions에서 TextEmbedder 인스턴스를 생성합니다.

매개변수
context Android ERROR(/Context)
modelPath 애셋에 메타데이터가 있는 텍스트 모델의 경로입니다.
생성 값
TextEmbedder 생성 중에 오류가 발생하는 경우

public static TextEmbedder createFromFile (Context context, File modelFile)

모델 파일과 기본 TextEmbedder.TextEmbedderOptions에서 TextEmbedder 인스턴스를 생성합니다.

매개변수
context Android ERROR(/Context)
modelFile 텍스트 모델 File 인스턴스입니다.
생성 값
IOException tflite 모델 파일을 열 때 I/O 오류가 발생하는지 여부
TextEmbedder 생성 중 오류가 발생하는 경우

public static TextEmbedder createFromOptions (Context context, TextEmbedder.TextEmbedderOptions 옵션)

TextEmbedder.TextEmbedderOptions에서 TextEmbedder 인스턴스를 만듭니다.

매개변수
context Android ERROR(/Context)
옵션 TextEmbedder.TextEmbedderOptions 인스턴스
생성 값
TextEmbedder 생성 중 오류가 발생하는 경우

공개 TextEmbedderResult embed (String inputText)

입력 텍스트에서 임베딩 추출을 수행합니다.

매개변수
inputText 처리를 위한 String입니다.