LiterRT-LM ওভারভিউ

LiteRT-LM হলো একটি উৎপাদন-উপযোগী, ওপেন-সোর্স ইনফারেন্স ফ্রেমওয়ার্ক, যা এজ ডিভাইসে উচ্চ-পারফরম্যান্স সম্পন্ন ও ক্রস-প্ল্যাটফর্ম LLM ডেপ্লয়মেন্ট প্রদানের জন্য ডিজাইন করা হয়েছে।

  • ক্রস-প্ল্যাটফর্ম সাপোর্ট: অ্যান্ড্রয়েড, আইওএস, ওয়েব, ডেস্কটপ এবং আইওটি (যেমন রাস্পবেরি পাই)-তে চালানো যায়।
  • হার্ডওয়্যার অ্যাক্সিলারেশন: বিভিন্ন হার্ডওয়্যারে GPU এবং NPU অ্যাক্সিলারেটর ব্যবহার করে সর্বোচ্চ পারফরম্যান্স এবং সিস্টেমের স্থিতিশীলতা অর্জন করুন।
  • বহুমুখী ব্যবহার: এমন এলএলএম (LLM) দিয়ে নির্মাণ করুন যেগুলিতে দৃষ্টি ও শ্রবণ সমর্থন রয়েছে।
  • টুলের ব্যবহার: উন্নত নির্ভুলতার জন্য সীমাবদ্ধ ডিকোডিং সহ এজেন্টিক ওয়ার্কফ্লোতে ফাংশন কলিং সমর্থন।
  • বহু মডেল সমর্থন: Gemma, Llama, Phi-4, Qwen এবং আরও অনেক কিছু চালান।

নতুন কী আছে ( v0.12.0 )

  • সুইফট এপিআই : মেটাল জিপিইউ অ্যাক্সিলারেশন ব্যবহার করে আইওএস অ্যাপ্লিকেশনগুলিতে নেটিভভাবে LiteRT-LM ইন্টিগ্রেট করুন। সুইফট গাইড দেখুন।
  • ওয়েব জাভাস্ক্রিপ্ট এপিআই : ওয়েব জিপিইউ/সিপিইউ ব্যবহার করে উচ্চ পারফরম্যান্সে ওয়েব ব্রাউজারের ভেতরে মডেল চালান। জাভাস্ক্রিপ্ট গাইড দেখুন।
  • LiteRT-LM CLI / পাইথন এপিআই আপডেট : কমান্ড-লাইন ইন্টারফেস এবং পাইথন এপিআই এখন লিনাক্স, ম্যাকওএস এবং উইন্ডোজ জুড়ে সিপিইউ এবং জিপিইউ ব্যাকএন্ডের পাশাপাশি এনপিইউ সমর্থন করে। সিএলআই গাইড দেখুন।
  • কমিউনিটি-পরিচালিত ফ্লাটার এপিআই : কমিউনিটির flutter_gemma প্যাকেজ ব্যবহার করে ক্রস-প্ল্যাটফর্ম ফ্লাটার অ্যাপ্লিকেশন তৈরি করুন। ফ্লাটার গাইড দেখুন।

ডিভাইসে GenAI শোকেস

গুগল এআই এজ গ্যালারি স্ক্রিনশট

গুগল এআই এজ গ্যালারি হলো একটি পরীক্ষামূলক অ্যাপ, যা LiteRT-LM ব্যবহার করে সম্পূর্ণ অফলাইনে চালিত ডিভাইসের জেনারেটিভ এআই সক্ষমতা প্রদর্শনের জন্য ডিজাইন করা হয়েছে।

  • গুগল প্লে : সমর্থিত অ্যান্ড্রয়েড ডিভাইসগুলিতে স্থানীয়ভাবে এলএলএম ব্যবহার করুন।
  • অ্যাপ স্টোর : আপনার iOS ডিভাইসে অন-ডিভাইস এআই-এর অভিজ্ঞতা নিন।
  • গিটহাব সোর্স : আপনার নিজের প্রোজেক্টে কীভাবে LiteRT-LM ইন্টিগ্রেট করবেন তা শিখতে গ্যালারি অ্যাপটির সোর্স কোড দেখুন।
  • মডেলের আকার: ২.৫৮ জিবি
  • অতিরিক্ত প্রযুক্তিগত বিবরণ হাগিংফেস মডেল কার্ডে রয়েছে।

    প্ল্যাটফর্ম (ডিভাইস) ব্যাকএন্ড প্রিফিল (tk/s) ডিকোড (tk/s) প্রথম টোকেন পেতে সময় (সেকেন্ড) সর্বোচ্চ সিপিইউ মেমরি (এমবি)
    অ্যান্ড্রয়েড (এস২৬ আল্ট্রা) সিপিইউ ৫৫৭ ৪৭ ১.৮ ১৭৩৩
    জিপিইউ ৩৮০৮ ৫২ ০.৩ ৬৭৬
    iOS (iPhone 17 Pro) সিপিইউ ৫৩২ ২৫ ১.৯ ৬০৭
    জিপিইউ ২৮৭৮ ৫৬ ০.৩ ১৪৫০
    লিনাক্স (আর্ম ২.৩ ও ২.৮ গিগাহার্টজ, এনভিডিয়া জিফোর্স আরটিএক্স ৪০৯০) সিপিইউ ২৬০ ৩৫ ১৬২৮
    জিপিইউ ১১২৩৪ ১৪৩ ০.১ ৯১৩
    ম্যাকওএস (ম্যাকবুক প্রো এম৪) সিপিইউ ৯০১ ৪২ ১.১ ৭৩৬
    জিপিইউ ৭৮৩৫ ১৬০ ০.১ ১৬২৩
    উইন্ডোজ (ইন্টেল লুনারলেক) সিপিইউ ৪৩৫ ৩০ ২.৪ ৩৫০৫
    জিপিইউ ৩৭৫১ ৪৮ ০.৩ ৩৫৪০
    IoT (রাস্পবেরি পাই ৫ ১৬জিবি) সিপিইউ ১৩৩ ৭.৮ ১৫৪৬

নির্মাণ শুরু করুন

LiteRT-LM আপনাকে দ্রুত ডিভাইসে এআই অ্যাপ্লিকেশন তৈরি করতে সাহায্য করার জন্য বিভিন্ন প্রোগ্রামিং ভাষা এবং প্ল্যাটফর্মের এপিআই (API) প্রদান করে। শুরু করার জন্য নিচে থেকে একটি গাইড নির্বাচন করুন:

ভাষা অবস্থা এর জন্য সেরা... ডকুমেন্টেশন
সিএলআই
স্থিতিশীল
১ মিনিটেরও কম সময়ে LiteRT-LM দিয়ে কাজ শুরু করুন। সিএলআই গাইড
পাইথন
স্থিতিশীল
ডেস্কটপ ও রাস্পবেরি পাই-তে দ্রুত প্রোটোটাইপিং ও উন্নয়ন। পাইথন গাইড
কোটলিন
স্থিতিশীল
নেটিভ অ্যান্ড্রয়েড অ্যাপ এবং জেভিএম-ভিত্তিক ডেস্কটপ টুল। কো-রুটিনের জন্য অপ্টিমাইজ করা হয়েছে। কোটলিন গাইড
সুইফট 🚀
প্রাথমিক প্রিভিউ
বিশেষায়িত মেটাল সাপোর্ট সহ নেটিভ iOS এবং macOS ইন্টিগ্রেশন। দ্রুত গাইড
জাভাস্ক্রিপ্ট (ওয়েব) 🚀
প্রাথমিক প্রিভিউ
উচ্চ কর্মক্ষমতা সহ সরাসরি ওয়েব ব্রাউজারে মডেলগুলি স্থাপন করুন। জাভাস্ক্রিপ্ট গাইড
ফ্লাটার 🚀
সম্প্রদায়
flutter_gemma কমিউনিটি ব্যবহার করে ক্রস-প্ল্যাটফর্ম ফ্লাটার অ্যাপ তৈরি করা হয়। ফ্লাটার গাইড
সি++
স্থিতিশীল
উচ্চ-কর্মক্ষমতাসম্পন্ন, ক্রস-প্ল্যাটফর্ম কোর লজিক এবং এমবেডেড সিস্টেম। সি++ গাইড

উৎস থেকে তৈরি করুন

আপনি যদি LiteRT-LM কাস্টমাইজ করতে চান বা কোনো নির্দিষ্ট হার্ডওয়্যার কনফিগারেশনের জন্য এটি বিল্ড করতে চান, তবে আপনি সরাসরি সোর্স কোড থেকে এটি কম্পাইল করতে পারেন। আপনার এনভায়রনমেন্ট সেট আপ করা এবং ফ্রেমওয়ার্কটি বিল্ড করার ধাপে ধাপে নির্দেশাবলীর জন্য, GitHub-এ থাকা LiteRT-LM Build and Run Guide-টি দেখুন।

সমর্থিত ব্যাকএন্ড এবং প্ল্যাটফর্ম

ত্বরণ অ্যান্ড্রয়েড আইওএস ম্যাকওএস উইন্ডোজ লিনাক্স আইওটি
সিপিইউ
জিপিইউ -
এনপিইউ - - 🚀 - -

সমর্থিত মডেল

নিচের সারণিতে LiteRT-LM দ্বারা সমর্থিত মডেলগুলির তালিকা দেওয়া হলো। আরও বিস্তারিত পারফরম্যান্স তথ্য এবং মডেল কার্ডের জন্য, Hugging Face-এর LiteRT কমিউনিটিতে যান।

মডেল প্রকার আকার (এমবি) বিস্তারিত ডিভাইস সিপিইউ প্রিফিল (tk/s) সিপিইউ ডিকোড (tk/s) জিপিইউ প্রিফিল (tk/s) জিপিইউ ডিকোড (tk/s)
জেমা৪-ই২বি চ্যাট ২৫৮৩ মডেল কার্ড স্যামসাং এস২৬ আল্ট্রা ৫৫৭ ৪৭ ৩৮০৮ ৫২
আইফোন ১৭ প্রো ৫৩২ ২৫ ২৮৭৮ ৫৭
ম্যাকবুক প্রো এম৪ ৯০১ ৪২ ৭৮৩৫ ১৬০
জেমা৪-ই৪বি চ্যাট ৩৬৫৪ মডেল কার্ড স্যামসাং এস২৬ আল্ট্রা ১৯৫ ১৮ ১২৯৩ ২২
আইফোন ১৭ প্রো ১৫৯ ১০ ১১৮৯ ২৫
ম্যাকবুক প্রো এম৪ ২৭৭ ২৭ ২৫৬০ ১০১
জেমা-৩এন-ই২বি চ্যাট ২৯৬৫ মডেল কার্ড ম্যাকবুক প্রো এম৩ ২৩৩ ২৮ - -
স্যামসাং এস২৪ আল্ট্রা ১১১ ১৬ ৮১৬ ১৬
জেমা-৩এন-ই৪বি চ্যাট ৪২৩৫ মডেল কার্ড ম্যাকবুক প্রো এম৩ ১৭০ ২০ - -
স্যামসাং এস২৪ আল্ট্রা ৭৪ ৫৪৮
জেমা৩-১বি চ্যাট ১০০৫ মডেল কার্ড স্যামসাং এস২৪ আল্ট্রা ১৭৭ ৩৩ ১১৯১ ২৪
ফাংশনজেমা ভিত্তি ২৮৯ মডেল কার্ড স্যামসাং এস২৫ আল্ট্রা ২২৩৮ ১৫৪ - -
ফাই-৪-মিনি চ্যাট ৩৯০৬ মডেল কার্ড স্যামসাং এস২৪ আল্ট্রা ৬৭ ৩১৪ ১০
Qwen2.5-1.5B চ্যাট ১৫৯৮ মডেল কার্ড স্যামসাং এস২৫ আল্ট্রা ২৯৮ ৩৪ ১৬৬৮ ৩১
Qwen3-0.6B চ্যাট ৫৮৬ মডেল কার্ড ভিভো এক্স৩০০ প্রো ১৬৫ ৫৮০ ২১
Qwen2.5-0.5B চ্যাট ৫২১ মডেল কার্ড স্যামসাং এস২৪ আল্ট্রা ২৫১ ৩০ - -

রিপোর্ট সমস্যা

আপনি যদি কোনো বাগ খুঁজে পান অথবা কোনো ফিচারের অনুরোধ থাকে, তাহলে LiteRT-LM GitHub Issues- এ রিপোর্ট করুন।