استخراج جاسازی روی متن را انجام می دهد.
این API انتظار یک مدل TFLite را با متاداده مدل TFLite (اختیاری) دارد.
ابرداده برای مدلهای دارای تانسور ورودی int32 مورد نیاز است زیرا شامل واحد فرآیند ورودی برای Tokenizer مدل است. برای مدلهای دارای تانسور ورودی رشتهای، نیازی به ابرداده نیست.
- تانسورهای ورودی
- سه تانسور ورودی (
kTfLiteInt32
) با شکل[batch_size x bert_max_seq_len]
که شناسه های ورودی، شناسه های ماسک و شناسه های قطعه را نشان می دهند. این امضای ورودی به یک واحد فرآیند Bert Tokenizer در فراداده مدل نیاز دارد. - یا یک تانسور ورودی (
kTfLiteInt32
) به شکل[batch_size x max_seq_len]
که نشان دهنده شناسه های ورودی است. این امضای ورودی به یک واحد فرآیند Regex Tokenizer در فراداده مدل نیاز دارد. - یا یک تانسور ورودی (
kTfLiteString
) که بی شکل است یا دارای شکل[1]
حاوی رشته ورودی است.
- سه تانسور ورودی (
kTfLiteFloat32
/ kTfLiteUint8
) با شکل [1 x N]
که در آن N تعداد ابعاد در تعبیههای تولید شده است. کلاس های تو در تو
کلاس | TextEmbedder.TextEmbedderOptions | گزینه هایی برای راه اندازی TextEmbedder . |
روش های عمومی
خالی | بستن () TextEmbedder می بندد و پاک می کند. |
استاتیک دوبل | cosineSimilarity ( Embedding u، Embedding v) تابع ابزار برای محاسبه شباهت کسینوس بین دو شی Embedding . |
استاتیک TextEmbedder | createFromFile (زمینه زمینه، رشته modelPath) یک نمونه TextEmbedder را از یک فایل مدل و پیش فرض TextEmbedder.TextEmbedderOptions ایجاد می کند. |
استاتیک TextEmbedder | createFromFile (زمینه زمینه، فایل modelFile) یک نمونه TextEmbedder را از یک فایل مدل و پیش فرض TextEmbedder.TextEmbedderOptions ایجاد می کند. |
استاتیک TextEmbedder | createFromOptions (متن زمینه، گزینه های TextEmbedder.TextEmbedderOptions ) یک نمونه TextEmbedder از TextEmbedder.TextEmbedderOptions ایجاد می کند. |
TextEmbedderResult |
روش های ارثی
روش های عمومی
همسانی دوگانه ایستا عمومی ( Embedding u, Embedding v)
تابع ابزار برای محاسبه شباهت کسینوس بین دو شی Embedding
.
مولفه های
تو | |
---|---|
v |
پرتاب می کند
IllegalArgumentException | اگر تعبیهها انواع مختلفی داشته باشند (شناور در مقابل کوانتیزه)، اندازههای متفاوتی داشته باشند یا دارای L2-norm 0 باشند. |
---|
عمومی استاتیک TextEmbedder createFromFile (زمینه زمینه، رشته مدلPath)
یک نمونه TextEmbedder
را از یک فایل مدل و پیش فرض TextEmbedder.TextEmbedderOptions
ایجاد می کند.
مولفه های
متن نوشته | یک ERROR(/Context) . |
---|---|
modelPath | مسیر به مدل متنی با ابرداده در دارایی ها. |
پرتاب می کند
اگر در حین ایجاد TextEmbedder خطایی وجود داشته باشد. |
عمومی استاتیک TextEmbedder createFromFile (زمینه زمینه، فایل modelFile)
یک نمونه TextEmbedder
را از یک فایل مدل و پیش فرض TextEmbedder.TextEmbedderOptions
ایجاد می کند.
مولفه های
متن نوشته | یک ERROR(/Context) . |
---|---|
modelFile | مدل متن نمونه File . |
پرتاب می کند
IOException | اگر هنگام باز کردن فایل مدل tflite خطای I/O رخ دهد. |
---|---|
اگر در حین ایجاد TextEmbedder خطایی وجود داشته باشد. |
عمومی استاتیک TextEmbedder createFromOptions (متن زمینه، گزینه های TextEmbedder.TextEmbedderOptions )
یک نمونه TextEmbedder
از TextEmbedder.TextEmbedderOptions
ایجاد می کند.
مولفه های
متن نوشته | یک ERROR(/Context) . |
---|---|
گزینه ها | یک نمونه TextEmbedder.TextEmbedderOptions . |
پرتاب می کند
اگر در حین ایجاد TextEmbedder خطایی وجود داشته باشد. |
جاسازی عمومی TextEmbedderResult (متن ورودی رشته )
استخراج تعبیه شده روی متن ورودی را انجام می دهد.
مولفه های
متن ورودی | یک String برای پردازش |
---|