TextEmbedder

کلاس نهایی عمومی TextEmbedder

استخراج جاسازی روی متن را انجام می دهد.

این API انتظار یک مدل TFLite را با متاداده مدل TFLite (اختیاری) دارد.

ابرداده برای مدل‌های دارای تانسور ورودی int32 مورد نیاز است زیرا شامل واحد فرآیند ورودی برای Tokenizer مدل است. برای مدل‌های دارای تانسور ورودی رشته‌ای، نیازی به ابرداده نیست.

  • تانسورهای ورودی
    • سه تانسور ورودی ( kTfLiteInt32 ) با شکل [batch_size x bert_max_seq_len] که شناسه های ورودی، شناسه های ماسک و شناسه های قطعه را نشان می دهند. این امضای ورودی به یک واحد فرآیند Bert Tokenizer در فراداده مدل نیاز دارد.
    • یا یک تانسور ورودی ( kTfLiteInt32 ) به شکل [batch_size x max_seq_len] که نشان دهنده شناسه های ورودی است. این امضای ورودی به یک واحد فرآیند Regex Tokenizer در فراداده مدل نیاز دارد.
    • یا یک تانسور ورودی ( kTfLiteString ) که بی شکل است یا دارای شکل [1] حاوی رشته ورودی است.
  • حداقل یک تانسور خروجی ( kTfLiteFloat32 / kTfLiteUint8 ) با شکل [1 x N] که در آن N تعداد ابعاد در تعبیه‌های تولید شده است.

کلاس های تو در تو

کلاس TextEmbedder.TextEmbedderOptions گزینه هایی برای راه اندازی TextEmbedder .

روش های عمومی

خالی
بستن ()
TextEmbedder می بندد و پاک می کند.
استاتیک دوبل
cosineSimilarity ( EmbeddingEmbedding v)
تابع ابزار برای محاسبه شباهت کسینوس بین دو شی Embedding .
استاتیک TextEmbedder
createFromFile (زمینه زمینه، رشته modelPath)
یک نمونه TextEmbedder را از یک فایل مدل و پیش فرض TextEmbedder.TextEmbedderOptions ایجاد می کند.
استاتیک TextEmbedder
createFromFile (زمینه زمینه، فایل modelFile)
یک نمونه TextEmbedder را از یک فایل مدل و پیش فرض TextEmbedder.TextEmbedderOptions ایجاد می کند.
استاتیک TextEmbedder
createFromOptions (متن زمینه، گزینه های TextEmbedder.TextEmbedderOptions )
یک نمونه TextEmbedder از TextEmbedder.TextEmbedderOptions ایجاد می کند.
TextEmbedderResult
جاسازی (متن ورودی رشته )
استخراج تعبیه شده روی متن ورودی را انجام می دهد.

روش های ارثی

روش های عمومی

بسته شدن فضای خالی عمومی ()

TextEmbedder می بندد و پاک می کند.

همسانی دوگانه ایستا عمومی ( Embedding u, Embedding v)

تابع ابزار برای محاسبه شباهت کسینوس بین دو شی Embedding .

مولفه های
تو
v
پرتاب می کند
IllegalArgumentException اگر تعبیه‌ها انواع مختلفی داشته باشند (شناور در مقابل کوانتیزه)، اندازه‌های متفاوتی داشته باشند یا دارای L2-norm 0 باشند.

عمومی استاتیک TextEmbedder createFromFile (زمینه زمینه، رشته مدلPath)

یک نمونه TextEmbedder را از یک فایل مدل و پیش فرض TextEmbedder.TextEmbedderOptions ایجاد می کند.

مولفه های
متن نوشته یک ERROR(/Context) .
modelPath مسیر به مدل متنی با ابرداده در دارایی ها.
پرتاب می کند
اگر در حین ایجاد TextEmbedder خطایی وجود داشته باشد.

عمومی استاتیک TextEmbedder createFromFile (زمینه زمینه، فایل modelFile)

یک نمونه TextEmbedder را از یک فایل مدل و پیش فرض TextEmbedder.TextEmbedderOptions ایجاد می کند.

مولفه های
متن نوشته یک ERROR(/Context) .
modelFile مدل متن نمونه File .
پرتاب می کند
IOException اگر هنگام باز کردن فایل مدل tflite خطای I/O رخ دهد.
اگر در حین ایجاد TextEmbedder خطایی وجود داشته باشد.

عمومی استاتیک TextEmbedder createFromOptions (متن زمینه، گزینه های TextEmbedder.TextEmbedderOptions )

یک نمونه TextEmbedder از TextEmbedder.TextEmbedderOptions ایجاد می کند.

مولفه های
متن نوشته یک ERROR(/Context) .
گزینه ها یک نمونه TextEmbedder.TextEmbedderOptions .
پرتاب می کند
اگر در حین ایجاد TextEmbedder خطایی وجود داشته باشد.

جاسازی عمومی TextEmbedderResult (متن ورودی رشته )

استخراج تعبیه شده روی متن ورودی را انجام می دهد.

مولفه های
متن ورودی یک String برای پردازش