टेक्स्ट पर एम्बेडिंग एक्सट्रैक्ट करता है.
इस एपीआई को TFLite मॉडल मेटाडेटा के साथ TFLite मॉडल की ज़रूरत है. हालांकि, ऐसा करना ज़रूरी नहीं है.
int32 इनपुट टेन्सर वाले मॉडल के लिए मेटाडेटा ज़रूरी है, क्योंकि इसमें मॉडल के टोकनाइज़र के लिए इनपुट प्रोसेस यूनिट होती है. स्ट्रिंग इनपुट टेंसर वाले मॉडल के लिए, किसी मेटाडेटा की ज़रूरत नहीं होती.
- इनपुट टेंसर
[batch_size x bert_max_seq_len]आकार के तीन इनपुट टेंसर (kTfLiteInt32), इनपुट आईडी, मास्क आईडी, और सेगमेंट आईडी को दिखाते हैं. इस इनपुट सिग्नेचर के लिए, मॉडल मेटाडेटा में बर्ट टोकनाइज़र प्रोसेस यूनिट की ज़रूरत होती है.- इसके अलावा,
[batch_size x max_seq_len]आकार का एक इनपुट टेंसर (kTfLiteInt32), इनपुट आईडी को दिखा सकता है. इस इनपुट सिग्नेचर के लिए, मॉडल मेटाडेटा में Regex टोकनाइज़र प्रोसेस यूनिट की ज़रूरत होती है. - इसके अलावा, एक इनपुट डेंसर (
kTfLiteString) है, जो आकार नहीं है या जिसका आकार[1]है, जिसमें इनपुट स्ट्रिंग शामिल है.
[1 x N]आकार वाला कम से कम एक आउटपुट टेंसर (kTfLiteFloat32/kTfLiteUint8) है, जहां N, बनाए गए एम्बेड में मौजूद डाइमेंशन की संख्या है.
नेस्ट की गई क्लास
| क्लास | TextEmbedder.TextEmbedderOptions | TextEmbedder सेट अप करने के विकल्प. |
|
सार्वजनिक तरीके
| void |
close() (बंद करें)
TextEmbedder को बंद करता है और साफ़ करता है. |
| स्टैटिक डबल |
cosineSimilarity(एम्बेड करना u, एम्बेडिंग v)
दो
Embedding ऑब्जेक्ट के बीच कोसाइन
समानता का पता लगाने के लिए यूटिलिटी फ़ंक्शन. |
| स्टैटिक TextEmbedder |
createFromFile(कॉन्टेक्स्ट कॉन्टेक्स्ट, स्ट्रिंग ModelPath)
मॉडल फ़ाइल और डिफ़ॉल्ट
TextEmbedder.TextEmbedderOptions से TextEmbedder इंस्टेंस बनाता है. |
| स्टैटिक TextEmbedder |
createFromFile(कॉन्टेक्स्ट कॉन्टेक्स्ट, फ़ाइल ModelFile)
मॉडल फ़ाइल और डिफ़ॉल्ट
TextEmbedder.TextEmbedderOptions से TextEmbedder इंस्टेंस बनाता है. |
| स्टैटिक TextEmbedder |
createFromOptions(कॉन्टेक्स्ट कॉन्टेक्स्ट, TextEmbedder.TextEmbedderOptions विकल्प)
TextEmbedder.TextEmbedderOptions से TextEmbedder इंस्टेंस बनाता है. |
| TextEmbedderResult |
इनहेरिट किए गए तरीके
सार्वजनिक तरीके
सार्वजनिक स्थिर डबल cosineSimilarity (एम्बेड करना u, एम्बेड करना v)
दो Embedding ऑब्जेक्ट के बीच कोसाइन
समानता का पता लगाने के लिए यूटिलिटी फ़ंक्शन.
पैरामीटर
| u | |
|---|---|
| v |
थ्रो
| IllegalArgumentException | अगर एम्बेड किए गए अलग-अलग टाइप (फ़्लोट बनाम संख्या के हिसाब से) हैं, उनका साइज़ अलग है या उनका L2-नॉर्म 0 है. |
|---|
सार्वजनिक स्टैटिक TextEmbedder createFromFile (कॉन्टेक्स्ट कॉन्टेक्स्ट, स्ट्रिंग ModelPath)
मॉडल फ़ाइल और डिफ़ॉल्ट TextEmbedder.TextEmbedderOptions से TextEmbedder इंस्टेंस बनाता है.
पैरामीटर
| संदर्भ | Android ERROR(/Context). |
|---|---|
| modelPath | पाथ में मौजूद मेटाडेटा को शामिल करें. |
थ्रो
अगर TextEmbedder बनाते समय कोई गड़बड़ी हुई है.
|
सार्वजनिक स्टैटिक TextEmbedder createFromFile (कॉन्टेक्स्ट कॉन्टेक्स्ट, फ़ाइल मॉडलफ़ाइल)
मॉडल फ़ाइल और डिफ़ॉल्ट TextEmbedder.TextEmbedderOptions से TextEmbedder इंस्टेंस बनाता है.
पैरामीटर
| संदर्भ | Android ERROR(/Context). |
|---|---|
| modelFile | टेक्स्ट मॉडल File इंस्टेंस. |
थ्रो
| IOException | अगर tflite मॉडल फ़ाइल को खोलते समय कोई I/O गड़बड़ी होती है. |
|---|---|
अगर TextEmbedder बनाते समय कोई गड़बड़ी होती है.
|
सार्वजनिक स्टैटिक TextEmbedder createFromOptions (कॉन्टेक्स्ट कॉन्टेक्स्ट, TextEmbedder.TextEmbedderOptions विकल्प)
TextEmbedder.TextEmbedderOptions से TextEmbedder इंस्टेंस बनाता है.
पैरामीटर
| संदर्भ | Android ERROR(/Context). |
|---|---|
| विकल्प | TextEmbedder.TextEmbedderOptions इंस्टेंस. |
थ्रो
अगर TextEmbedder बनाते समय कोई गड़बड़ी होती है.
|
सार्वजनिक TextEmbedderResult एम्बेड करें (स्ट्रिंग इनपुट टेक्स्ट)
इनपुट टेक्स्ट पर एम्बेडिंग एक्सट्रैक्ट करता है.
पैरामीटर
| inputText | प्रोसेस के लिए String.
|
|---|