TextEmbedder

पब्लिक फ़ाइनल क्लास TextEmbedder

टेक्स्ट पर एम्बेडिंग एक्सट्रैक्ट करता है.

इस एपीआई को TFLite मॉडल मेटाडेटा के साथ TFLite मॉडल की ज़रूरत है. हालांकि, ऐसा करना ज़रूरी नहीं है.

int32 इनपुट टेन्सर वाले मॉडल के लिए मेटाडेटा ज़रूरी है, क्योंकि इसमें मॉडल के टोकनाइज़र के लिए इनपुट प्रोसेस यूनिट होती है. स्ट्रिंग इनपुट टेंसर वाले मॉडल के लिए, किसी मेटाडेटा की ज़रूरत नहीं होती.

  • इनपुट टेंसर
    • [batch_size x bert_max_seq_len] आकार के तीन इनपुट टेंसर (kTfLiteInt32), इनपुट आईडी, मास्क आईडी, और सेगमेंट आईडी को दिखाते हैं. इस इनपुट सिग्नेचर के लिए, मॉडल मेटाडेटा में बर्ट टोकनाइज़र प्रोसेस यूनिट की ज़रूरत होती है.
    • इसके अलावा, [batch_size x max_seq_len] आकार का एक इनपुट टेंसर (kTfLiteInt32), इनपुट आईडी को दिखा सकता है. इस इनपुट सिग्नेचर के लिए, मॉडल मेटाडेटा में Regex टोकनाइज़र प्रोसेस यूनिट की ज़रूरत होती है.
    • इसके अलावा, एक इनपुट डेंसर (kTfLiteString) है, जो आकार नहीं है या जिसका आकार [1] है, जिसमें इनपुट स्ट्रिंग शामिल है.
  • [1 x N] आकार वाला कम से कम एक आउटपुट टेंसर (kTfLiteFloat32/kTfLiteUint8) है, जहां N, बनाए गए एम्बेड में मौजूद डाइमेंशन की संख्या है.

नेस्ट की गई क्लास

क्लास TextEmbedder.TextEmbedderOptions TextEmbedder सेट अप करने के विकल्प. 

सार्वजनिक तरीके

void
close() (बंद करें)
TextEmbedder को बंद करता है और साफ़ करता है.
स्टैटिक डबल
cosineSimilarity(एम्बेड करना u, एम्बेडिंग v)
दो Embedding ऑब्जेक्ट के बीच कोसाइन समानता का पता लगाने के लिए यूटिलिटी फ़ंक्शन.
स्टैटिक TextEmbedder
createFromFile(कॉन्टेक्स्ट कॉन्टेक्स्ट, स्ट्रिंग ModelPath)
मॉडल फ़ाइल और डिफ़ॉल्ट TextEmbedder.TextEmbedderOptions से TextEmbedder इंस्टेंस बनाता है.
स्टैटिक TextEmbedder
createFromFile(कॉन्टेक्स्ट कॉन्टेक्स्ट, फ़ाइल ModelFile)
मॉडल फ़ाइल और डिफ़ॉल्ट TextEmbedder.TextEmbedderOptions से TextEmbedder इंस्टेंस बनाता है.
स्टैटिक TextEmbedder
createFromOptions(कॉन्टेक्स्ट कॉन्टेक्स्ट, TextEmbedder.TextEmbedderOptions विकल्प)
TextEmbedder.TextEmbedderOptions से TextEmbedder इंस्टेंस बनाता है.
TextEmbedderResult
एम्बेड करें(स्ट्रिंग इनपुट टेक्स्ट)
इनपुट टेक्स्ट पर एम्बेडिंग एक्सट्रैक्ट करता है.

इनहेरिट किए गए तरीके

सार्वजनिक तरीके

सार्वजनिक अमान्य बंद करें ()

TextEmbedder को बंद करता है और साफ़ करता है.

सार्वजनिक स्थिर डबल cosineSimilarity (एम्बेड करना u, एम्बेड करना v)

दो Embedding ऑब्जेक्ट के बीच कोसाइन समानता का पता लगाने के लिए यूटिलिटी फ़ंक्शन.

पैरामीटर
u
v
थ्रो
IllegalArgumentException अगर एम्बेड किए गए अलग-अलग टाइप (फ़्लोट बनाम संख्या के हिसाब से) हैं, उनका साइज़ अलग है या उनका L2-नॉर्म 0 है.

सार्वजनिक स्टैटिक TextEmbedder createFromFile (कॉन्टेक्स्ट कॉन्टेक्स्ट, स्ट्रिंग ModelPath)

मॉडल फ़ाइल और डिफ़ॉल्ट TextEmbedder.TextEmbedderOptions से TextEmbedder इंस्टेंस बनाता है.

पैरामीटर
संदर्भ Android ERROR(/Context).
modelPath पाथ में मौजूद मेटाडेटा को शामिल करें.
थ्रो
अगर TextEmbedder बनाते समय कोई गड़बड़ी हुई है.

सार्वजनिक स्टैटिक TextEmbedder createFromFile (कॉन्टेक्स्ट कॉन्टेक्स्ट, फ़ाइल मॉडलफ़ाइल)

मॉडल फ़ाइल और डिफ़ॉल्ट TextEmbedder.TextEmbedderOptions से TextEmbedder इंस्टेंस बनाता है.

पैरामीटर
संदर्भ Android ERROR(/Context).
modelFile टेक्स्ट मॉडल File इंस्टेंस.
थ्रो
IOException अगर tflite मॉडल फ़ाइल को खोलते समय कोई I/O गड़बड़ी होती है.
अगर TextEmbedder बनाते समय कोई गड़बड़ी होती है.

सार्वजनिक स्टैटिक TextEmbedder createFromOptions (कॉन्टेक्स्ट कॉन्टेक्स्ट, TextEmbedder.TextEmbedderOptions विकल्प)

TextEmbedder.TextEmbedderOptions से TextEmbedder इंस्टेंस बनाता है.

पैरामीटर
संदर्भ Android ERROR(/Context).
विकल्प TextEmbedder.TextEmbedderOptions इंस्टेंस.
थ्रो
अगर TextEmbedder बनाते समय कोई गड़बड़ी होती है.

सार्वजनिक TextEmbedderResult एम्बेड करें (स्ट्रिंग इनपुट टेक्स्ट)

इनपुट टेक्स्ट पर एम्बेडिंग एक्सट्रैक्ट करता है.

पैरामीटर
inputText प्रोसेस के लिए String.