TextEmbedder

الصف النهائي المتاح للجميع TextEmbedder

تتيح هذه الميزة استخراج النص.

تتوقع واجهة برمجة التطبيقات هذه استخدام نموذج TFLite مع البيانات الوصفية لنموذج TFLite (اختياري).

يجب توفير البيانات الوصفية للنماذج التي تتضمّن موترات إدخال int32 لأنّها تحتوي على وحدة عملية الإدخال الخاصة بأداة Tokenizer الخاصة بالنموذج. لا يلزم استخدام بيانات وصفية للنماذج التي تحتوي على مشدّدات إدخال سلسلة.

  • موجات الإدخال
    • ثلاثة ممدّدات إدخال (kTfLiteInt32) للشكل [batch_size x bert_max_seq_len] تمثّل معرّفات الإدخال ومعرّفات الأقنعة وأرقام تعريف الشرائح. يتطلب توقيع الإدخال هذا وحدة معالجة أداة Bert Tokenizer في البيانات الوصفية للنموذج.
    • أو موتر إدخال واحد (kTfLiteInt32) بالشكل [batch_size x max_seq_len] الذي يمثّل أرقام تعريف الإدخال. يتطلّب توقيع الإدخال هذا وحدة معالجة خاصة بأداة Regex Tokenizer في البيانات الوصفية للنموذج.
    • أو موت إدخال واحد (kTfLiteString) بلا شكل أو شكله [1] يحتوي على سلسلة الإدخال.
  • متوتر إخراج واحد على الأقل (kTfLiteFloat32/kTfLiteUint8) بالشكل [1 x N] حيث N هو عدد الأبعاد في التضمينات الناتجة.

الصفوف المتداخلة

صنف TextEmbedder.TextEmbedderOptions خيارات إعداد "TextEmbedder

الطرق العامة

void
Close()
يُستخدم لإغلاق TextEmbedder وتنظيفه.
ثابت مزدوج
cosineSimilarity(تضمين u, تضمين v)
دالة أداة لاحتساب تماثل جيب التمام بين كائنَي Embedding.
ثابت TextEmbedder
createFromFile(سياق السياق، مسار نموذج سلسلة)
تنشئ هذه الدالة مثيل TextEmbedder من ملف نموذج وقيمة TextEmbedder.TextEmbedderOptions التلقائية.
ثابت TextEmbedder
createFromFile(سياق السياق، File modelFile)
تنشئ هذه الدالة مثيل TextEmbedder من ملف نموذج وقيمة TextEmbedder.TextEmbedderOptions التلقائية.
ثابت TextEmbedder
createFromOptions(سياق السياق، خيارات TextEmbedder.TextEmbedderOptions)
تنشئ هذه الدالة TextEmbedder مثيلاً من TextEmbedder.TextEmbedderOptions.
TextEmbedderResult
embed(String enterText)
تتيح هذه الميزة استخراج البيانات في نص الإدخال.

الطرق المكتسَبة

الطرق العامة

عامة باطل إغلاق ()

يُستخدم لإغلاق TextEmbedder وتنظيفه.

public static مزدوج cosineSimilarity (تضمينالتضمين إصدار)

دالة أداة لاحتساب تماثل جيب التمام بين كائنَي Embedding.

المَعلمات
u
v
الرميات
IllegalArgumentException إذا كانت التضمينات من أنواع مختلفة (عدد عائم مقابل الكمية) أو لها أحجام مختلفة أو لها معيار L2 تساوي 0.

public static TextEmbedder createFromFile (سياق السياق، سلسلة formPath)

تنشئ هذه الدالة مثيل TextEmbedder من ملف نموذج وقيمة TextEmbedder.TextEmbedderOptions التلقائية.

المَعلمات
سياق جهاز Android ERROR(/Context)
modelPath إلى النموذج النصي مع بيانات التعريف في مواد العرض.
الرميات
في حال حدوث خطأ أثناء إنشاء "TextEmbedder".

public static TextEmbedder createFromFile (سياق السياق، ملف formFile)

تنشئ هذه الدالة مثيل TextEmbedder من ملف نموذج وقيمة TextEmbedder.TextEmbedderOptions التلقائية.

المَعلمات
سياق جهاز Android ERROR(/Context)
modelFile مثيل النموذج النصي File.
الرميات
IOException في حال حدوث خطأ في وحدات الإدخال والإخراج عند فتح ملف نموذج tflite.
في حال حدوث خطأ أثناء إنشاء "TextEmbedder".

public static TextEmbedder createFromOptions (سياق السياق، TextEmbedder.TextEmbedderOptions)

تنشئ هذه الدالة TextEmbedder مثيلاً من TextEmbedder.TextEmbedderOptions.

المَعلمات
سياق جهاز Android ERROR(/Context)
الخيارات مثيل TextEmbedder.TextEmbedderOptions.
الرميات
في حال حدوث خطأ أثناء إنشاء "TextEmbedder".

public TextEmbedderResult embed (String conversionText)

تتيح هذه الميزة استخراج البيانات في نص الإدخال.

المَعلمات
inputText String للمعالجة.