গুগল এআই এজ পোর্টাল পেশ করা হচ্ছে : বেঞ্চমার্ক এজ এআই স্কেলে। ব্যক্তিগত পূর্বরূপের সময় অ্যাক্সেসের অনুরোধ করতে সাইন আপ করুন ৷

এই পৃষ্ঠাটি Cloud Translation API অনুবাদ করেছে।

LiterRT কম্পাইলডমডেল C++ API

LiterRT CompiledModel API C++ এ উপলব্ধ, যা ডেভেলপারদের মেমরি বরাদ্দ এবং নিম্ন-স্তরের ডেভেলপমেন্টের উপর সূক্ষ্ম নিয়ন্ত্রণ প্রদান করে। উদাহরণস্বরূপ, ইমেজ সেগমেন্টেশন C++ অ্যাপ দেখুন।

নিম্নলিখিত নির্দেশিকাটি CompiledModel Kotlin API এর মৌলিক CPU অনুমান দেখায়। উন্নত ত্বরণ বৈশিষ্ট্যগুলির জন্য GPU ত্বরণ এবং NPU ত্বরণ সম্পর্কিত নির্দেশিকা দেখুন।

বিল্ড নির্ভরতা যোগ করুন

আপনার প্রকল্পের সাথে মানানসই পথটি বেছে নিন:

প্রি-বিল্ট লাইব্রেরি (ক্রস-প্ল্যাটফর্ম) ব্যবহার করুন : তাৎক্ষণিক সেটআপের জন্য LiteRT প্রি-বিল্ট লাইব্রেরি ব্যবহার করুন। Android-এ LiteRT Maven প্যাকেজ থেকে প্রি-বিল্ট C++ লাইব্রেরি কীভাবে ব্যবহার করবেন, অথবা Android, iOS, macOS, Linux এবং Windows- এ প্রি-বিল্ট C++ বাইনারি ডাউনলোড/ইন্টিগ্রেট করার পদ্ধতি দেখুন।
উৎস থেকে তৈরি করুন (ক্রস-প্ল্যাটফর্ম) : সম্পূর্ণ নিয়ন্ত্রণ এবং মাল্টি-প্ল্যাটফর্ম সাপোর্টের জন্য CMake দিয়ে উৎস থেকে তৈরি করুন (Android, iOS, macOS, Linux, Windows)। এই নির্দেশিকাটিতে বিস্তারিত দেখুন।

মৌলিক অনুমান

এই অংশটি দেখায় কিভাবে মৌলিক অনুমানটি সম্পাদিত হয়।

পরিবেশ তৈরি করুন

Environment অবজেক্ট একটি রানটাইম এনভায়রনমেন্ট প্রদান করে যার মধ্যে কম্পাইলার প্লাগইনের পাথ এবং GPU কনটেক্সটের মতো উপাদান অন্তর্ভুক্ত থাকে। CompiledModel এবং TensorBuffer তৈরি করার সময় Environment প্রয়োজন। নিম্নলিখিত কোডটি কোনও বিকল্প ছাড়াই CPU এবং GPU এক্সিকিউশনের জন্য একটি Environment তৈরি করে:

LITERT_ASSIGN_OR_RETURN(auto env, Environment::Create({}));

`CompiledModel` তৈরি করুন

LiterRT মডেল পাওয়ার পর, অথবা মডেলটিকে .tflite ফরম্যাটে রূপান্তর করার পর, CompiledModel API ব্যবহার করে মডেল ফাইল দিয়ে রানটাইম শুরু করুন। আপনি এই বিন্দুতে হার্ডওয়্যার ত্বরণ নির্দিষ্ট করতে পারেন ( kLiteRtHwAcceleratorCpu or kLiteRtHwAcceleratorGpu ):

LITERT_ASSIGN_OR_RETURN(auto compiled_model,
  CompiledModel::Create(env, model, kLiteRtHwAcceleratorCpu));

ইনপুট এবং আউটপুট বাফার তৈরি করুন

মডেলটিতে অনুমানের জন্য যে ইনপুট ডেটা ফিড করবেন এবং ইনফারেন্স চালানোর পরে মডেলটি যে আউটপুট ডেটা তৈরি করবে তা ধরে রাখার জন্য প্রয়োজনীয় ডেটা স্ট্রাকচার (বাফার) তৈরি করুন।

LITERT_ASSIGN_OR_RETURN(auto input_buffers, compiled_model.CreateInputBuffers());
LITERT_ASSIGN_OR_RETURN(auto output_buffers, compiled_model.CreateOutputBuffers());

যদি আপনি CPU মেমোরি ব্যবহার করেন, তাহলে প্রথম ইনপুট বাফারে সরাসরি ডেটা লিখে ইনপুটগুলি পূরণ করুন।

input_buffers[0].Write<float>(absl::MakeConstSpan(input_data, input_size));

মডেলটি ডাকুন

ইনপুট এবং আউটপুট বাফার প্রদান করে, পূর্ববর্তী ধাপে উল্লেখিত মডেল এবং হার্ডওয়্যার ত্বরণ সহ কম্পাইলড মডেলটি চালান।

compiled_model.Run(input_buffers, output_buffers);

আউটপুট পুনরুদ্ধার করুন

মেমরি থেকে সরাসরি মডেল আউটপুট পড়ে আউটপুট পুনরুদ্ধার করুন।

std::vector<float> data(output_data_size);
output_buffers[0].Read<float>(absl::MakeSpan(data));
// ... process output data

মূল ধারণা এবং উপাদান

LiterRT CompiledModel API-এর মূল ধারণা এবং উপাদান সম্পর্কে তথ্যের জন্য নিম্নলিখিত বিভাগগুলি দেখুন।

ত্রুটি পরিচালনা

LiterRT litert::Expected ব্যবহার করে absl::StatusOr অথবা std::expected এর মতো একইভাবে মান ফেরত পাঠাতে অথবা ত্রুটি প্রচার করতে পারে। আপনি নিজে নিজে ত্রুটি পরীক্ষা করতে পারেন।

সুবিধার জন্য, LiterRT নিম্নলিখিত ম্যাক্রোগুলি প্রদান করে:

LITERT_ASSIGN_OR_RETURN(lhs, expr) expr এর ফলাফল lhs কে বরাদ্দ করে যদি এটি কোনও ত্রুটি তৈরি না করে এবং অন্যথায় ত্রুটিটি ফেরত দেয়।
এটি নিম্নলিখিত স্নিপেটের মতো কিছুতে প্রসারিত হবে।
```
auto maybe_model = CompiledModel::Create(env, "mymodel.tflite", HwAccelerators::kCpu);
if (!maybe_model) {
  return maybe_model.Error();
}
auto model = std::move(maybe_model.Value());
```
LITERT_ASSIGN_OR_ABORT(lhs, expr) LITERT_ASSIGN_OR_RETURN এর মতোই কাজ করে কিন্তু ত্রুটির ক্ষেত্রে প্রোগ্রামটি বাতিল করে দেয়।
LITERT_RETURN_IF_ERROR(expr) এর মূল্যায়নে ত্রুটি দেখা দিলে expr প্রদান করে।
LITERT_ABORT_IF_ERROR(expr) LITERT_RETURN_IF_ERROR এর মতোই কাজ করে কিন্তু ত্রুটির ক্ষেত্রে প্রোগ্রামটি বাতিল করে দেয়।

LiteRT ম্যাক্রো সম্পর্কে আরও তথ্যের জন্য, litert_macros.h দেখুন।

টেনসর বাফার (টেনসরবাফার)

LiterRT I/O বাফার ইন্টারঅপারেবিলিটির জন্য অন্তর্নির্মিত সমর্থন প্রদান করে, যা সংকলিত মডেলের ভিতরে এবং বাইরে ডেটা প্রবাহ পরিচালনা করার জন্য Tensor Buffer API ( TensorBuffer ) ব্যবহার করে। Tensor Buffer API ( Write<T>() ) লেখা এবং পড়ার ( Read<T>() ) ক্ষমতা প্রদান করে এবং CPU মেমরি লক করে।

TensorBuffer API কীভাবে বাস্তবায়িত হয় তার আরও সম্পূর্ণ দৃশ্যের জন্য, littert_tensor_buffer.h এর সোর্স কোডটি দেখুন।

কোয়েরি মডেল ইনপুট/আউটপুট প্রয়োজনীয়তা

একটি টেনসর বাফার ( TensorBuffer ) বরাদ্দ করার জন্য প্রয়োজনীয়তাগুলি সাধারণত হার্ডওয়্যার অ্যাক্সিলারেটর দ্বারা নির্দিষ্ট করা হয়। ইনপুট এবং আউটপুটের জন্য বাফারগুলির অ্যালাইনমেন্ট, বাফার স্ট্রাইড এবং মেমরির ধরণ সম্পর্কিত প্রয়োজনীয়তা থাকতে পারে। আপনি এই প্রয়োজনীয়তাগুলি স্বয়ংক্রিয়ভাবে পরিচালনা করতে CreateInputBuffers এর মতো সহায়ক ফাংশন ব্যবহার করতে পারেন।

নিম্নলিখিত সরলীকৃত কোড স্নিপেটটি দেখায় যে আপনি কীভাবে ইনপুট ডেটার জন্য বাফার প্রয়োজনীয়তাগুলি পুনরুদ্ধার করতে পারেন:

LITERT_ASSIGN_OR_RETURN(auto reqs, compiled_model.GetInputBufferRequirements(signature_index, input_index));

TensorBufferRequirements API কীভাবে বাস্তবায়িত হয় তার আরও সম্পূর্ণ দৃশ্যের জন্য, littert_tensor_buffer_requirements.h এর সোর্স কোডটি দেখুন।

পরিচালিত টেনসর বাফার (টেনসরবাফার) তৈরি করুন

নিম্নলিখিত সরলীকৃত কোড স্নিপেটটি দেখায় কিভাবে পরিচালিত টেনসর বাফার তৈরি করতে হয়, যেখানে TensorBuffer API সংশ্লিষ্ট বাফারগুলি বরাদ্দ করে:

LITERT_ASSIGN_OR_RETURN(auto tensor_buffer_cpu,
TensorBuffer::CreateManaged(env, /*buffer_type=*/kLiteRtTensorBufferTypeHostMemory,
  ranked_tensor_type, buffer_size));

LITERT_ASSIGN_OR_RETURN(auto tensor_buffer_gl, TensorBuffer::CreateManaged(env,
  /*buffer_type=*/kLiteRtTensorBufferTypeGlBuffer, ranked_tensor_type, buffer_size));

LITERT_ASSIGN_OR_RETURN(auto tensor_buffer_ahwb, TensorBuffer::CreateManaged(env,
  /*buffer_type=*/kLiteRtTensorBufferTypeAhwb, ranked_tensor_type, buffer_size));

জিরো-কপি দিয়ে টেনসর বাফার তৈরি করুন

একটি বিদ্যমান বাফারকে টেনসর বাফার (শূন্য-কপি) হিসেবে মোড়ানোর জন্য, নিম্নলিখিত কোড স্নিপেটটি ব্যবহার করুন:

// Create a TensorBuffer from host memory
LITERT_ASSIGN_OR_RETURN(auto tensor_buffer_from_host,
  TensorBuffer::CreateFromHostMemory(env, ranked_tensor_type,
  ptr_to_host_memory, buffer_size));

// Create a TensorBuffer from GlBuffer
LITERT_ASSIGN_OR_RETURN(auto tensor_buffer_from_gl,
  TensorBuffer::CreateFromGlBuffer(env, ranked_tensor_type, gl_target, gl_id,
  size_bytes, offset));

// Create a TensorBuffer from AHardware Buffer
LITERT_ASSIGN_OR_RETURN(auto tensor_buffer_from_ahwb,
  TensorBuffer::CreateFromAhwb(env, ranked_tensor_type, ahardware_buffer, offset));

টেনসর বাফার থেকে পড়া এবং লেখা

নিম্নলিখিত স্নিপেটটি দেখায় কিভাবে আপনি একটি ইনপুট বাফার থেকে পড়তে পারেন এবং একটি আউটপুট বাফারে লিখতে পারেন:

// Example of reading to input buffer:
std::vector<float> input_tensor_data = {1,2};
LITERT_ASSIGN_OR_RETURN(auto write_success,
  input_tensor_buffer.Write<float>(absl::MakeConstSpan(input_tensor_data)));
if(write_success){
  /* Continue after successful write... */
}

// Example of writing to output buffer:
std::vector<float> data(total_elements);
LITERT_ASSIGN_OR_RETURN(auto read_success,
  output_tensor_buffer.Read<float>(absl::MakeSpan(data)));
if(read_success){
  /* Continue after successful read */
}

উন্নত: বিশেষায়িত হার্ডওয়্যার বাফার ধরণের জন্য জিরো-কপি বাফার ইন্টারঅপ

কিছু নির্দিষ্ট বাফার প্রকার, যেমন AHardwareBuffer , অন্যান্য বাফার প্রকারের সাথে আন্তঃকার্যক্ষমতার সুযোগ করে দেয়। উদাহরণস্বরূপ, শূন্য-অনুলিপি সহ একটি AHardwareBuffer থেকে একটি OpenGL বাফার তৈরি করা যেতে পারে। নিম্নলিখিত কোড-স্নিপেটটি একটি উদাহরণ দেখায়:

LITERT_ASSIGN_OR_RETURN(auto tensor_buffer_ahwb,
  TensorBuffer::CreateManaged(env, kLiteRtTensorBufferTypeAhwb,
  ranked_tensor_type, buffer_size));
// Buffer interop: Get OpenGL buffer from AHWB,
// internally creating an OpenGL buffer backed by AHWB memory.
LITERT_ASSIGN_OR_RETURN(auto gl_buffer, tensor_buffer_ahwb.GetGlBuffer());

AHardwareBuffer থেকেও OpenCL বাফার তৈরি করা যেতে পারে:

LITERT_ASSIGN_OR_RETURN(auto cl_buffer, tensor_buffer_ahwb.GetOpenClMemory());

OpenCL এবং OpenGL এর মধ্যে আন্তঃকার্যকারিতা সমর্থন করে এমন মোবাইল ডিভাইসগুলিতে, GL বাফার থেকে CL বাফার তৈরি করা যেতে পারে:

LITERT_ASSIGN_OR_RETURN(auto tensor_buffer_from_gl,
  TensorBuffer::CreateFromGlBuffer(env, ranked_tensor_type, gl_target, gl_id,
  size_bytes, offset));

// Creates an OpenCL buffer from the OpenGL buffer, zero-copy.
LITERT_ASSIGN_OR_RETURN(auto cl_buffer, tensor_buffer_from_gl.GetOpenClMemory());

উদাহরণ বাস্তবায়ন

C++ এ LiterRT এর নিম্নলিখিত বাস্তবায়নগুলি দেখুন।

মৌলিক অনুমান (CPU)

নিচে "শুরু করুন " বিভাগের কোড স্নিপেটগুলির একটি সংক্ষিপ্ত সংস্করণ দেওয়া হল। এটি LiterRT-এর সাহায্যে অনুমানের সবচেয়ে সহজ বাস্তবায়ন।

// Load model and initialize runtime
LITERT_ASSIGN_OR_RETURN(auto env, Environment::Create({}));
LITERT_ASSIGN_OR_RETURN(auto compiled_model, CompiledModel::Create(env, "mymodel.tflite",
  kLiteRtHwAcceleratorCpu));

// Preallocate input/output buffers
LITERT_ASSIGN_OR_RETURN(auto input_buffers, compiled_model.CreateInputBuffers());
LITERT_ASSIGN_OR_RETURN(auto output_buffers, compiled_model.CreateOutputBuffers());

// Fill the first input
float input_values[] = { /* your data */ };
input_buffers[0].Write<float>(absl::MakeConstSpan(input_values, /*size*/));

// Invoke
compiled_model.Run(input_buffers, output_buffers);

// Read the output
std::vector<float> data(output_data_size);
output_buffers[0].Read<float>(absl::MakeSpan(data));

হোস্ট মেমোরি সহ জিরো-কপি

LiterRT CompiledModel API ইনফারেন্স পাইপলাইনের ঘর্ষণ কমায়, বিশেষ করে যখন একাধিক হার্ডওয়্যার ব্যাকএন্ড এবং জিরো-কপি ফ্লো নিয়ে কাজ করা হয়। ইনপুট বাফার তৈরি করার সময় নিম্নলিখিত কোড স্নিপেটটি CreateFromHostMemory পদ্ধতি ব্যবহার করে, যা হোস্ট মেমরির সাথে জিরো-কপি ব্যবহার করে।

// Define an LiteRT environment to use existing EGL display and context.
const std::vector<Environment::Option> environment_options = {
   {OptionTag::EglDisplay, user_egl_display},
   {OptionTag::EglContext, user_egl_context}};
LITERT_ASSIGN_OR_RETURN(auto env,
   Environment::Create(absl::MakeConstSpan(environment_options)));

// Load model1 and initialize runtime.
LITERT_ASSIGN_OR_RETURN(auto compiled_model1, CompiledModel::Create(env, "model1.tflite", kLiteRtHwAcceleratorGpu));

// Prepare I/O buffers. opengl_buffer is given outside from the producer.
LITERT_ASSIGN_OR_RETURN(auto tensor_type, model.GetInputTensorType("input_name0"));
// Create an input TensorBuffer based on tensor_type that wraps the given OpenGL Buffer.
LITERT_ASSIGN_OR_RETURN(auto tensor_buffer_from_opengl,
    litert::TensorBuffer::CreateFromGlBuffer(env, tensor_type, opengl_buffer));

// Create an input event and attach it to the input buffer. Internally, it creates
// and inserts a fence sync object into the current EGL command queue.
LITERT_ASSIGN_OR_RETURN(auto input_event, Event::CreateManaged(env, LiteRtEventTypeEglSyncFence));
tensor_buffer_from_opengl.SetEvent(std::move(input_event));

std::vector<TensorBuffer> input_buffers;
input_buffers.push_back(std::move(tensor_buffer_from_opengl));

// Create an output TensorBuffer of the model1. It's also used as an input of the model2.
LITERT_ASSIGN_OR_RETURN(auto intermedidate_buffers,  compiled_model1.CreateOutputBuffers());

// Load model2 and initialize runtime.
LITERT_ASSIGN_OR_RETURN(auto compiled_model2, CompiledModel::Create(env, "model2.tflite", kLiteRtHwAcceleratorGpu));
LITERT_ASSIGN_OR_RETURN(auto output_buffers, compiled_model2.CreateOutputBuffers());

compiled_model1.RunAsync(input_buffers, intermedidate_buffers);
compiled_model2.RunAsync(intermedidate_buffers, output_buffers);