TextEmbedder

публичный финальный класс TextEmbedder

Выполняет встраивание извлечения текста.

Этот API ожидает модель TFLite с (необязательными) метаданными модели TFLite .

Метаданные необходимы для моделей с входными тензорами int32, поскольку они содержат блок входного процесса для токенизатора модели. Для моделей со строковыми входными тензорами метаданные не требуются.

  • Входные тензоры
    • Три входных тензора ( kTfLiteInt32 ) формы [batch_size x bert_max_seq_len] представляющие входные идентификаторы, идентификаторы маски и идентификаторы сегментов. Для этой входной подписи требуется блок процесса Bert Tokenizer в метаданных модели.
    • Или один входной тензор ( kTfLiteInt32 ) формы [batch_size x max_seq_len] представляющий входные идентификаторы. Для этой входной подписи требуется блок процесса Regex Tokenizer в метаданных модели.
    • Или один входной тензор ( kTfLiteString ), который бесформен или имеет форму [1] содержащий входную строку.
  • По крайней мере, один выходной тензор ( kTfLiteFloat32 / kTfLiteUint8 ) формы [1 x N] , где N — количество измерений в созданных вложениях.

Вложенные классы

сорт TextEmbedder.TextEmbedderOptions Варианты настройки TextEmbedder .

Публичные методы

пустота
закрывать ()
Закрывает и очищает TextEmbedder .
статический двойной
cosineSimilarity ( Вложение u, Вложение v)
Служебная функция для вычисления косинусного сходства между двумя объектами Embedding .
статический TextEmbedder
createFromFile (контекстный контекст, String modelPath)
Создает экземпляр TextEmbedder из файла модели и значения TextEmbedder.TextEmbedderOptions по умолчанию.
статический TextEmbedder
createFromFile (контекстный контекст, файл модели файла )
Создает экземпляр TextEmbedder из файла модели и значения TextEmbedder.TextEmbedderOptions по умолчанию.
статический TextEmbedder
createFromOptions (контекст контекста, параметры TextEmbedder.TextEmbedderOptions )
Создает экземпляр TextEmbedder из TextEmbedder.TextEmbedderOptions .
TextEmbedderResult
встроить ( строка inputText)
Выполняет извлечение встраивания входного текста.

Унаследованные методы

Публичные методы

public void закрыть ()

Закрывает и очищает TextEmbedder .

public static double cosineSimilarity ( Embedding u, Embedding v)

Служебная функция для вычисления косинусного сходства между двумя объектами Embedding .

Параметры
ты
в
Броски
IllegalArgumentException если вложения имеют разные типы (с плавающей запятой или квантованные), имеют разные размеры или имеют норму L2, равную 0.

общедоступный статический TextEmbedder createFromFile (контекст контекста, String modelPath)

Создает экземпляр TextEmbedder из файла модели и значения TextEmbedder.TextEmbedderOptions по умолчанию.

Параметры
контекст ERROR(/Context) .
модельпуть путь к текстовой модели с метаданными в ресурсах.
Броски
если при создании TextEmbedder возникла ошибка.

public static TextEmbedder createFromFile (контекст контекста, файл modelFile)

Создает экземпляр TextEmbedder из файла модели и значения TextEmbedder.TextEmbedderOptions по умолчанию.

Параметры
контекст ERROR(/Context) .
МодельФайл экземпляр File текстовой модели.
Броски
Исключение IO если при открытии файла модели tflite возникает ошибка ввода-вывода.
если при создании TextEmbedder произошла ошибка.

общедоступный статический TextEmbedder createFromOptions (контекст контекста, параметры TextEmbedder.TextEmbedderOptions )

Создает экземпляр TextEmbedder из TextEmbedder.TextEmbedderOptions .

Параметры
контекст ERROR(/Context) .
параметры экземпляр TextEmbedder.TextEmbedderOptions .
Броски
если при создании TextEmbedder возникла ошибка.

общедоступная вставка TextEmbedderResult ( String inputText)

Выполняет извлечение встраивания входного текста.

Параметры
входной текст String для обработки.