LiterRT-LM ওভারভিউ

LiteRT-LM হলো একটি উৎপাদন-উপযোগী, ওপেন-সোর্স ইনফারেন্স ফ্রেমওয়ার্ক, যা এজ ডিভাইসে উচ্চ-পারফরম্যান্স সম্পন্ন ও ক্রস-প্ল্যাটফর্ম LLM ডেপ্লয়মেন্ট প্রদানের জন্য ডিজাইন করা হয়েছে।

  • ক্রস-প্ল্যাটফর্ম সাপোর্ট: অ্যান্ড্রয়েড, আইওএস, ওয়েব, ডেস্কটপ এবং আইওটি (যেমন রাস্পবেরি পাই)-তে চালানো যায়।
  • হার্ডওয়্যার অ্যাক্সিলারেশন: বিভিন্ন হার্ডওয়্যারে GPU এবং NPU অ্যাক্সিলারেটর ব্যবহার করে সর্বোচ্চ পারফরম্যান্স এবং সিস্টেমের স্থিতিশীলতা অর্জন করুন।
  • বহুমুখী ব্যবহার: এমন এলএলএম (LLM) দিয়ে নির্মাণ করুন যেগুলিতে দৃষ্টি ও শ্রবণ সমর্থন রয়েছে।
  • টুলের ব্যবহার: উন্নত নির্ভুলতার জন্য সীমাবদ্ধ ডিকোডিং সহ এজেন্টিক ওয়ার্কফ্লোতে ফাংশন কলিং সমর্থন।
  • ব্যাপক মডেল সমর্থন: Gemma, Llama, Phi-4, Qwen এবং আরও অনেক কিছু চালান।

ডিভাইসে GenAI শোকেস

গুগল এআই এজ গ্যালারি স্ক্রিনশট

গুগল এআই এজ গ্যালারি হলো একটি পরীক্ষামূলক অ্যাপ, যা LiteRT-LM ব্যবহার করে সম্পূর্ণ অফলাইনে চালিত ডিভাইসের জেনারেটিভ এআই সক্ষমতা প্রদর্শনের জন্য ডিজাইন করা হয়েছে।

  • গুগল প্লে : সমর্থিত অ্যান্ড্রয়েড ডিভাইসগুলিতে স্থানীয়ভাবে এলএলএম ব্যবহার করুন।
  • অ্যাপ স্টোর : আপনার iOS ডিভাইসে অন-ডিভাইস এআই-এর অভিজ্ঞতা নিন।
  • গিটহাব সোর্স : আপনার নিজের প্রোজেক্টে কীভাবে LiteRT-LM ইন্টিগ্রেট করবেন তা শিখতে গ্যালারি অ্যাপটির সোর্স কোড দেখুন।
  • মডেলের আকার: ২.৫৮ জিবি
  • অতিরিক্ত প্রযুক্তিগত বিবরণ হাগিংফেস মডেল কার্ডে রয়েছে।

    প্ল্যাটফর্ম (ডিভাইস) ব্যাকএন্ড প্রিফিল (tk/s) ডিকোড (tk/s) প্রথম টোকেন পেতে সময় (সেকেন্ড) সর্বোচ্চ সিপিইউ মেমরি (এমবি)
    অ্যান্ড্রয়েড (এস২৬ আল্ট্রা) সিপিইউ ৫৫৭ ৪৭ ১.৮ ১৭৩৩
    জিপিইউ ৩৮০৮ ৫২ ০.৩ ৬৭৬
    iOS (iPhone 17 Pro) সিপিইউ ৫৩২ ২৫ ১.৯ ৬০৭
    জিপিইউ ২৮৭৮ ৫৬ ০.৩ ১৪৫০
    লিনাক্স (আর্ম ২.৩ ও ২.৮ গিগাহার্টজ, এনভিডিয়া জিফোর্স আরটিএক্স ৪০৯০) সিপিইউ ২৬০ ৩৫ ১৬২৮
    জিপিইউ ১১২৩৪ ১৪৩ ০.১ ৯১৩
    ম্যাকওএস (ম্যাকবুক প্রো এম৪) সিপিইউ ৯০১ ৪২ ১.১ ৭৩৬
    জিপিইউ ৭৮৩৫ ১৬০ ০.১ ১৬২৩
    IoT (রাস্পবেরি পাই ৫ ১৬জিবি) সিপিইউ ১৩৩ ৭.৮ ১৫৪৬

নির্মাণ শুরু করুন

নিম্নলিখিত কোড স্নিপেটগুলিতে দেখানো হয়েছে কীভাবে LiteRT-LM CLI এবং সেইসাথে Python, Kotlin, ও C++ API-গুলি দিয়ে কাজ শুরু করতে হয়।

সিএলআই

litert-lm run model.litertlm --prompt="What is the capital of France?"

পাইথন

engine = litert_lm.Engine("model.litertlm")

with engine.create_conversation() as conversation:
    response = conversation.send_message("What is the capital of France?")
    print(f"Response: {response['content'][0]['text']}")

কোটলিন

val engineConfig = EngineConfig(
    modelPath = "/path/to/your/model.litertlm",
    backend = Backend.CPU(),
)

val engine = Engine(engineConfig)
engine.initialize()

val conversation = engine.createConversation()
print(conversation.sendMessage("What is the capital of France?"))  

সি++

auto model_assets = ModelAssets::Create(model_path);
CHECK_OK(model_assets);

auto engine_settings = EngineSettings::CreateDefault(
    model_assets,
    /*backend=*/litert::lm::Backend::CPU);

absl::StatusOr<std::unique_ptr<Engine>> engine = Engine::CreateEngine(engine_settings);
CHECK_OK(engine);

auto conversation_config = ConversationConfig::CreateDefault(**engine);
CHECK_OK(conversation_config);
absl::StatusOr<std::unique_ptr<Conversation>> conversation = Conversation::Create(**engine, *conversation_config);
CHECK_OK(conversation);

absl::StatusOr<Message> model_message = (*conversation)->SendMessage(
    JsonMessage{
        {"role", "user"},
        {"content", "What is the capital of France?"}
    });
CHECK_OK(model_message);

std::cout << *model_message << std::endl;
ভাষা অবস্থা এর জন্য সেরা... ডকুমেন্টেশন
সিএলআই 🚀
প্রাথমিক প্রিভিউ
১ মিনিটেরও কম সময়ে LiteRT-LM দিয়ে কাজ শুরু করুন। সিএলআই গাইড
পাইথন
স্থিতিশীল
ডেস্কটপ ও রাস্পবেরি পাই-তে দ্রুত প্রোটোটাইপিং ও উন্নয়ন। পাইথন গাইড
কোটলিন
স্থিতিশীল
নেটিভ অ্যান্ড্রয়েড অ্যাপ এবং জেভিএম-ভিত্তিক ডেস্কটপ টুল। কো-রুটিনের জন্য অপ্টিমাইজ করা হয়েছে। অ্যান্ড্রয়েড (কোটলিন) নির্দেশিকা
সি++
স্থিতিশীল
উচ্চ-কর্মক্ষমতাসম্পন্ন, ক্রস-প্ল্যাটফর্ম কোর লজিক এবং এমবেডেড সিস্টেম। সি++ গাইড
সুইফট 🚀
দেবের মধ্যে
বিশেষায়িত মেটাল সাপোর্ট সহ নেটিভ iOS এবং macOS ইন্টিগ্রেশন। শীঘ্রই আসছে

সমর্থিত ব্যাকএন্ড এবং প্ল্যাটফর্ম

ত্বরণ অ্যান্ড্রয়েড আইওএস ম্যাকওএস উইন্ডোজ লিনাক্স আইওটি
সিপিইউ
জিপিইউ -
এনপিইউ - - - - -

সমর্থিত মডেল

নিচের সারণিতে LiteRT-LM দ্বারা সমর্থিত মডেলগুলির তালিকা দেওয়া হলো। আরও বিস্তারিত পারফরম্যান্স তথ্য এবং মডেল কার্ডের জন্য, Hugging Face-এর LiteRT কমিউনিটিতে যান।

মডেল প্রকার আকার (এমবি) বিস্তারিত ডিভাইস সিপিইউ প্রিফিল (tk/s) সিপিইউ ডিকোড (tk/s) জিপিইউ প্রিফিল (tk/s) জিপিইউ ডিকোড (tk/s)
জেমা৪-ই২বি চ্যাট ২৫৮৩ মডেল কার্ড স্যামসাং এস২৬ আল্ট্রা ৫৫৭ ৪৭ ৩৮০৮ ৫২
আইফোন ১৭ প্রো ৫৩২ ২৫ ২৮৭৮ ৫৭
ম্যাকবুক প্রো এম৪ ৯০১ ৪২ ৭৮৩৫ ১৬০
জেমা৪-ই৪বি চ্যাট ৩৬৫৪ মডেল কার্ড স্যামসাং এস২৬ আল্ট্রা ১৯৫ ১৮ ১২৯৩ ২২
আইফোন ১৭ প্রো ১৫৯ ১০ ১১৮৯ ২৫
ম্যাকবুক প্রো এম৪ ২৭৭ ২৭ ২৫৬০ ১০১
জেমা-৩এন-ই২বি চ্যাট ২৯৬৫ মডেল কার্ড ম্যাকবুক প্রো এম৩ ২৩৩ ২৮ - -
স্যামসাং এস২৪ আল্ট্রা ১১১ ১৬ ৮১৬ ১৬
জেমা-৩এন-ই৪বি চ্যাট ৪২৩৫ মডেল কার্ড ম্যাকবুক প্রো এম৩ ১৭০ ২০ - -
স্যামসাং এস২৪ আল্ট্রা ৭৪ ৫৪৮
জেমা৩-১বি চ্যাট ১০০৫ মডেল কার্ড স্যামসাং এস২৪ আল্ট্রা ১৭৭ ৩৩ ১১৯১ ২৪
ফাংশনজেমা ভিত্তি ২৮৯ মডেল কার্ড স্যামসাং এস২৫ আল্ট্রা ২২৩৮ ১৫৪ - -
ফাই-৪-মিনি চ্যাট ৩৯০৬ মডেল কার্ড স্যামসাং এস২৪ আল্ট্রা ৬৭ ৩১৪ ১০
Qwen2.5-1.5B চ্যাট ১৫৯৮ মডেল কার্ড স্যামসাং এস২৫ আল্ট্রা ২৯৮ ৩৪ ১৬৬৮ ৩১
Qwen3-0.6B চ্যাট ৫৮৬ মডেল কার্ড ভিভো এক্স৩০০ প্রো ১৬৫ ৫৮০ ২১
Qwen2.5-0.5B চ্যাট ৫২১ মডেল কার্ড স্যামসাং এস২৪ আল্ট্রা ২৫১ ৩০ - -

সমস্যা রিপোর্ট করা

আপনি যদি কোনো বাগ খুঁজে পান বা কোনো ফিচারের অনুরোধ থাকে, তাহলে LiteRT-LM GitHub Issues- এ রিপোর্ট করুন।