ইমেজ এমবেডাররা ইমেজকে একটি হাই-ডাইমেনশনাল ফিচার ভেক্টরে এমবেড করার অনুমতি দেয় যা একটি ইমেজের সিমেন্টিক অর্থকে উপস্থাপন করে, যেটিকে অন্য ছবির ফিচার ভেক্টরের সাথে তুলনা করা যেতে পারে তাদের শব্দার্থিক সাদৃশ্য মূল্যায়ন করার জন্য।
ইমেজ সার্চের বিপরীতে, ইমেজ এমবেডার ইমেজের একটি কর্পাস থেকে তৈরি একটি পূর্বনির্ধারিত সূচকের মাধ্যমে অনুসন্ধান করার পরিবর্তে অন-দ্য-ফ্লাই চিত্রগুলির মধ্যে সাদৃশ্য গণনা করার অনুমতি দেয়।
আপনার মোবাইল অ্যাপে আপনার কাস্টম ইমেজ এমবেডার স্থাপন করতে টাস্ক লাইব্রেরি ImageEmbedder
API ব্যবহার করুন।
ImageEmbedder API এর মূল বৈশিষ্ট্য
ইনপুট ইমেজ প্রক্রিয়াকরণ, ঘূর্ণন, আকার পরিবর্তন, এবং রঙ স্থান রূপান্তর সহ।
ইনপুট চিত্রের আগ্রহের অঞ্চল।
বৈশিষ্ট্য ভেক্টরের মধ্যে কোসাইন সাদৃশ্য গণনা করার জন্য অন্তর্নির্মিত ইউটিলিটি ফাংশন।
সমর্থিত ইমেজ এমবেডার মডেল
নিম্নলিখিত মডেলগুলি ImageEmbedder
API-এর সাথে সামঞ্জস্যপূর্ণ হওয়ার গ্যারান্টিযুক্ত।
Kaggle মডেলগুলিতে Google ইমেজ মডিউল সংগ্রহ থেকে ভেক্টর মডেলগুলি বৈশিষ্ট্যযুক্ত৷
কাস্টম মডেল যা মডেল সামঞ্জস্যের প্রয়োজনীয়তা পূরণ করে।
C++ এ অনুমান চালান
// Initialization
ImageEmbedderOptions options:
options.mutable_model_file_with_metadata()->set_file_name(model_path);
options.set_l2_normalize(true);
std::unique_ptr<ImageEmbedder> image_embedder = ImageEmbedder::CreateFromOptions(options).value();
// Create input frame_buffer_1 and frame_buffer_2 from your inputs `image_data1`, `image_data2`, `image_dimension1` and `image_dimension2`.
// See more information here: tensorflow_lite_support/cc/task/vision/utils/frame_buffer_common_utils.h
std::unique_ptr<FrameBuffer> frame_buffer_1 = CreateFromRgbRawBuffer(
image_data1, image_dimension1);
std::unique_ptr<FrameBuffer> frame_buffer_2 = CreateFromRgbRawBuffer(
image_data2, image_dimension2);
// Run inference on two images.
const EmbeddingResult result_1 = image_embedder->Embed(*frame_buffer_1);
const EmbeddingResult result_2 = image_embedder->Embed(*frame_buffer_2);
// Compute cosine similarity.
double similarity = ImageEmbedder::CosineSimilarity(
result_1.embeddings[0].feature_vector(),
result_2.embeddings[0].feature_vector());
ImageEmbedder
কনফিগার করার জন্য আরও বিকল্পের জন্য সোর্স কোড দেখুন।
পাইথনে অনুমান চালান
ধাপ 1: TensorFlow Lite সাপোর্ট Pypi প্যাকেজ ইনস্টল করুন।
আপনি নিম্নলিখিত কমান্ড ব্যবহার করে TensorFlow Lite Support Pypi প্যাকেজ ইনস্টল করতে পারেন:
pip install tflite-support
ধাপ 2: মডেল ব্যবহার
from tflite_support.task import vision
# Initialization.
image_embedder = vision.ImageEmbedder.create_from_file(model_path)
# Run inference on two images.
image_1 = vision.TensorImage.create_from_file('/path/to/image1.jpg')
result_1 = image_embedder.embed(image_1)
image_2 = vision.TensorImage.create_from_file('/path/to/image2.jpg')
result_2 = image_embedder.embed(image_2)
# Compute cosine similarity.
feature_vector_1 = result_1.embeddings[0].feature_vector
feature_vector_2 = result_2.embeddings[0].feature_vector
similarity = image_embedder.cosine_similarity(
result_1.embeddings[0].feature_vector, result_2.embeddings[0].feature_vector)
ImageEmbedder
কনফিগার করার জন্য আরও বিকল্পের জন্য সোর্স কোড দেখুন।
উদাহরণ ফলাফল
স্বাভাবিক বৈশিষ্ট্য ভেক্টরের মধ্যে কোসাইন সাদৃশ্য -1 এবং 1 এর মধ্যে একটি স্কোর প্রদান করে। উচ্চতর ভাল, অর্থাৎ 1 এর কোসাইন মিল মানে দুটি ভেক্টর অভিন্ন।
Cosine similarity: 0.954312
আপনার নিজস্ব মডেল এবং পরীক্ষার ডেটা সহ ImageEmbedder-এর জন্য সাধারণ CLI ডেমো টুল ব্যবহার করে দেখুন।
মডেল সামঞ্জস্যের প্রয়োজনীয়তা
ImageEmbedder
API ঐচ্ছিক, কিন্তু দৃঢ়ভাবে সুপারিশকৃত TFLite মডেল মেটাডেটা সহ একটি TFLite মডেল আশা করে।
সামঞ্জস্যপূর্ণ ইমেজ এমবেডার মডেল নিম্নলিখিত প্রয়োজনীয়তা পূরণ করা উচিত:
একটি ইনপুট ইমেজ টেনসর (kTfLiteUInt8/kTfLiteFloat32)
- আকারের ইমেজ ইনপুট
[batch x height x width x channels]
। - ব্যাচ অনুমান সমর্থিত নয় (
batch
1 হতে হবে)। - শুধুমাত্র RGB ইনপুট সমর্থিত (
channels
3 হতে হবে)। - টাইপ kTfLiteFloat32 হলে, ইনপুট স্বাভাবিককরণের জন্য মেটাডেটার সাথে স্বাভাবিককরণ বিকল্পগুলি সংযুক্ত করা প্রয়োজন।
- আকারের ইমেজ ইনপুট
অন্তত একটি আউটপুট টেনসর (kTfLiteUInt8/kTfLiteFloat32)
- এই আউটপুট স্তরের জন্য প্রত্যাবর্তিত বৈশিষ্ট্য ভেক্টরের
N
মাত্রার সাথে সম্পর্কিতN
উপাদানগুলির সাথে। - হয় 2 বা 4 মাত্রা, যেমন
[1 x N]
বা[1 x 1 x 1 x N]
।
- এই আউটপুট স্তরের জন্য প্রত্যাবর্তিত বৈশিষ্ট্য ভেক্টরের