TextEmbedder

পাবলিক ফাইনাল ক্লাস TextEmbedder

টেক্সট এম্বেডিং নিষ্কাশন সঞ্চালন.

এই API (ঐচ্ছিক) TFLite মডেল মেটাডেটা সহ একটি TFLite মডেল আশা করে।

int32 ইনপুট টেনসর সহ মডেলগুলির জন্য মেটাডেটা প্রয়োজন কারণ এতে মডেলের টোকেনাইজারের জন্য ইনপুট প্রক্রিয়া ইউনিট রয়েছে। স্ট্রিং ইনপুট টেনসর সহ মডেলগুলির জন্য কোনও মেটাডেটার প্রয়োজন নেই৷

  • ইনপুট টেনসর
    • তিনটি ইনপুট টেনসর ( kTfLiteInt32 ) আকারের [batch_size x bert_max_seq_len] ইনপুট আইডি, মাস্ক আইডি এবং সেগমেন্ট আইডি প্রতিনিধিত্ব করে। এই ইনপুট স্বাক্ষরের জন্য মডেল মেটাডেটাতে একটি বার্ট টোকেনাইজার প্রক্রিয়া ইউনিট প্রয়োজন।
    • অথবা একটি ইনপুট টেনসর ( kTfLiteInt32 ) আকারের [batch_size x max_seq_len] ইনপুট আইডি প্রতিনিধিত্ব করে। এই ইনপুট স্বাক্ষরের জন্য মডেল মেটাডেটাতে একটি Regex Tokenizer প্রক্রিয়া ইউনিট প্রয়োজন।
    • অথবা একটি ইনপুট টেনসর ( kTfLiteString ) যা আকারহীন বা ইনপুট স্ট্রিং ধারণকারী আকৃতি [1] আছে।
  • কমপক্ষে একটি আউটপুট টেনসর ( kTfLiteFloat32 / kTfLiteUint8 ) আকৃতি [1 x N] সহ যেখানে N হল উৎপাদিত এমবেডিংয়ের মাত্রার সংখ্যা।

নেস্টেড ক্লাস

ক্লাস TextEmbedder.TextEmbedderOptions একটি TextEmbedder সেট আপ করার জন্য বিকল্প।

পাবলিক পদ্ধতি

অকার্যকর
বন্ধ ()
TextEmbedder বন্ধ করে এবং পরিষ্কার করে।
স্ট্যাটিক ডবল
কোসাইন সাদৃশ্য ( এম্বেডিং u, এম্বেডিং v)
দুটি Embedding বস্তুর মধ্যে কোসাইন সাদৃশ্য গণনা করার জন্য ইউটিলিটি ফাংশন।
স্ট্যাটিক টেক্সট এমবেডার
createFromFile (প্রসঙ্গ প্রসঙ্গ, স্ট্রিং মডেলপথ)
একটি মডেল ফাইল এবং ডিফল্ট TextEmbedder.TextEmbedderOptions থেকে একটি TextEmbedder উদাহরণ তৈরি করে।
স্ট্যাটিক টেক্সট এমবেডার
createFromFile (প্রসঙ্গ প্রসঙ্গ, ফাইল মডেল ফাইল )
একটি মডেল ফাইল এবং ডিফল্ট TextEmbedder.TextEmbedderOptions থেকে একটি TextEmbedder উদাহরণ তৈরি করে।
স্ট্যাটিক টেক্সট এমবেডার
createFromOptions (প্রসঙ্গ প্রসঙ্গ, TextEmbedder.TextEmbedderOptions বিকল্প)
TextEmbedder.TextEmbedderOptions থেকে একটি TextEmbedder উদাহরণ তৈরি করে।
TextEmbedder ফলাফল
এম্বেড ( স্ট্রিং ইনপুট টেক্সট)
ইনপুট টেক্সট এম্বেডিং নিষ্কাশন সঞ্চালন.

উত্তরাধিকারসূত্রে প্রাপ্ত পদ্ধতি

পাবলিক পদ্ধতি

পাবলিক শূন্য বন্ধ ()

TextEmbedder বন্ধ করে এবং পরিষ্কার করে।

পাবলিক স্ট্যাটিক ডাবল কোসাইন সাদৃশ্য ( এম্বেডিং u, এম্বেডিং v)

দুটি Embedding বস্তুর মধ্যে কোসাইন সাদৃশ্য গণনা করার জন্য ইউটিলিটি ফাংশন।

পরামিতি
u
v
নিক্ষেপ করে
অবৈধ আর্গুমেন্ট ব্যতিক্রম যদি এমবেডিংগুলি বিভিন্ন ধরণের হয় (ফ্লোট বনাম কোয়ান্টাইজড), বিভিন্ন আকারের হয়, বা L2-নর্ম 0 থাকে।

পাবলিক স্ট্যাটিক TextEmbedder createFromFile (প্রসঙ্গ প্রসঙ্গ, স্ট্রিং মডেলপথ)

একটি মডেল ফাইল এবং ডিফল্ট TextEmbedder.TextEmbedderOptions থেকে একটি TextEmbedder উদাহরণ তৈরি করে।

পরামিতি
প্রসঙ্গ একটি অ্যান্ড্রয়েড ERROR(/Context)
মডেলপথ সম্পদের মেটাডেটা সহ পাঠ্য মডেলের পথ।
নিক্ষেপ করে
যদি TextEmbedder তৈরির সময় কোনো ত্রুটি থাকে।

পাবলিক স্ট্যাটিক TextEmbedder createFromFile (প্রসঙ্গ প্রসঙ্গ, ফাইল মডেল ফাইল)

একটি মডেল ফাইল এবং ডিফল্ট TextEmbedder.TextEmbedderOptions থেকে একটি TextEmbedder উদাহরণ তৈরি করে।

পরামিতি
প্রসঙ্গ একটি অ্যান্ড্রয়েড ERROR(/Context)
মডেল ফাইল টেক্সট মডেল File উদাহরণ।
নিক্ষেপ করে
IO ব্যতিক্রম tflite মডেল ফাইল খোলার সময় যদি একটি I/O ত্রুটি ঘটে।
TextEmbedder তৈরির সময় যদি কোনো ত্রুটি থাকে।

পাবলিক স্ট্যাটিক TextEmbedder createFromOptions (প্রসঙ্গ প্রসঙ্গ, TextEmbedder.TextEmbedderOptions বিকল্প)

TextEmbedder.TextEmbedderOptions থেকে একটি TextEmbedder উদাহরণ তৈরি করে।

পরামিতি
প্রসঙ্গ একটি অ্যান্ড্রয়েড ERROR(/Context)
বিকল্প একটি TextEmbedder.TextEmbedderOptions উদাহরণ।
নিক্ষেপ করে
TextEmbedder তৈরির সময় যদি কোনো ত্রুটি থাকে।

সর্বজনীন TextEmbedderResult এম্বেড ( স্ট্রিং ইনপুট টেক্সট)

ইনপুট টেক্সট এম্বেডিং নিষ্কাশন সঞ্চালন.

পরামিতি
ইনপুট টেক্সট প্রক্রিয়াকরণের জন্য একটি String