LiterRT-LM ওভারভিউ

LiterRT-LM হল একটি উৎপাদন-প্রস্তুত, ওপেন-সোর্স ইনফারেন্স ফ্রেমওয়ার্ক যা এজ ডিভাইসগুলিতে উচ্চ-কার্যক্ষমতাসম্পন্ন, ক্রস-প্ল্যাটফর্ম LLM স্থাপনা প্রদানের জন্য ডিজাইন করা হয়েছে।

মূল বৈশিষ্ট্য

  • ক্রস-প্ল্যাটফর্ম সাপোর্ট: অ্যান্ড্রয়েড, আইওএস, ওয়েব এবং ডেস্কটপে চালান।
  • হার্ডওয়্যার ত্বরণ:
    • জিপিইউ: এমএল ড্রিফ্ট দ্বারা চালিত, এমএল এবং জেনারেটিভ এআই উভয় মডেলকেই সমর্থন করে।
    • NPU: Qualcomm এবং MediaTek চিপসেট (আর্লি অ্যাক্সেস) সহ ডিভাইসগুলিতে ত্বরিত অনুমান।
  • মাল্টি-মোডালিটি: ভিশন এবং অডিও ইনপুট সাপোর্ট।
  • টুল ব্যবহার: এজেন্টিক ওয়ার্কফ্লোর জন্য ফাংশন কলিং সাপোর্ট।
  • ব্রড মডেল সাপোর্ট: Gemma, Llama, Phi-4, Qwen এবং আরও অনেক কিছু চালান।

সমর্থিত ব্যাকএন্ড এবং প্ল্যাটফর্ম

প্ল্যাটফর্ম সিপিইউ সাপোর্ট জিপিইউ সাপোর্ট এনপিইউ সাপোর্ট
অ্যান্ড্রয়েড
আইওএস -
ম্যাকওএস -
জানালা -
লিনাক্স -
এমবেডেড - -

দ্রুত শুরু

প্রথমে এটি চেষ্টা করে দেখতে চান? সম্পূর্ণ সেটআপ শুরু করার আগে, আপনি ডেস্কটপের জন্য পূর্বে তৈরি বাইনারি অথবা মোবাইলের জন্য Google AI Edge Gallery অ্যাপ ব্যবহার করে LiteRT-LM তাৎক্ষণিকভাবে চালাতে পারেন।

মোবাইল অ্যাপস

গুগল এআই এজ গ্যালারি হল একটি ডেমো অ্যাপ যা LiterRT-LM দ্বারা চালিত অত্যাধুনিক জেনারেটিভ এআই মডেলের শক্তি সরাসরি আপনার হাতে তুলে দেয়।

ডেস্কটপ সিএলআই

lit বাইনারি ডাউনলোড করার পরে, বিকল্পগুলি দেখতে lit চালান।

আপনার প্ল্যাটফর্মটি বেছে নিন

ভাষা অবস্থা এর জন্য সেরা... ডকুমেন্টেশন
কোটলিন
স্থিতিশীল
নেটিভ অ্যান্ড্রয়েড অ্যাপ এবং JVM-ভিত্তিক ডেস্কটপ টুল। Coroutines-এর জন্য অপ্টিমাইজ করা। কোটলিন এপিআই রেফারেন্স
সি++
স্থিতিশীল
উচ্চ-কর্মক্ষমতাসম্পন্ন, ক্রস-প্ল্যাটফর্ম কোর লজিক এবং এমবেডেড সিস্টেম। C++ API রেফারেন্স
সুইফট 🚀
ডেভ-এ
বিশেষায়িত মেটাল সাপোর্ট সহ নেটিভ iOS এবং macOS ইন্টিগ্রেশন। শীঘ্রই আসছে
পাইথন 🚀
ডেভ-এ
দ্রুত প্রোটোটাইপিং, উন্নয়ন, এবং ডেস্কটপ-সাইড স্ক্রিপ্টিং। শীঘ্রই আসছে

সমর্থিত মডেল

নিম্নলিখিত সারণীতে LiteRT-LM দ্বারা সম্পূর্ণরূপে সমর্থিত এবং পরীক্ষিত মডেলগুলির একটি নমুনা দেখানো হয়েছে।

দ্রষ্টব্য: "চ্যাট রেডি" বলতে চ্যাটের জন্য টিউন করা মডেলগুলিকে বোঝায় (নির্দেশনা টিউনিং)। "বেস" মডেলগুলিকে প্রায়শই সর্বোত্তম চ্যাট পারফরম্যান্সের জন্য সূক্ষ্ম-টিউনিংয়ের প্রয়োজন হয় যদি না নির্দিষ্ট সমাপ্তির জন্য ব্যবহার করা হয়।

মডেল আদর্শ পরিমাণ নির্ধারণ প্রসঙ্গ দৈর্ঘ্য আকার (এমবি) ডাউনলোড করুন
জেমা
জেমা৩-১বি চ্যাট রেডি প্রতি চ্যানেলে ৪-বিট ৪০৯৬ ৫৫৭ ডাউনলোড করুন
জেমা-৩এন-ই২বি চ্যাট রেডি প্রতি চ্যানেলে ৪-বিট ৪০৯৬ ২৯৬৫ ডাউনলোড করুন
জেমা-৩এন-ই৪বি চ্যাট রেডি প্রতি চ্যানেলে ৪-বিট ৪০৯৬ ৪২৩৫ ডাউনলোড করুন
ফাংশনGemma-270M বেস (ফাইন-টিউনিং প্রয়োজন) প্রতি চ্যানেলে ৮-বিট ১০২৪ ২৮৮ ফাইন-টিউনিং গাইড
↪ টিনিগার্ডেন-২৭০এম ডেমো প্রতি চ্যানেলে ৮-বিট ১০২৪ ২৮৮ অ্যাপটি ডাউনলোড / ব্যবহার করে দেখুন
লামা
লামা-৩.২-১বি-নির্দেশনা চ্যাট রেডি প্রতি চ্যানেলে ৮-বিট ৮১৯২ ১১৬২ ডাউনলোড করুন
লামা-৩.২-৩বি-নির্দেশনা চ্যাট রেডি প্রতি চ্যানেলে ৮-বিট ৮১৯২ ২৮৯৩ ডাউনলোড করুন
ফাই
ফাই-৪-মিনি চ্যাট রেডি প্রতি চ্যানেলে ৮-বিট ৪০৯৬ ৩৭২৮ ডাউনলোড করুন
কুয়েন
qwen2.5-1.5b সম্পর্কে চ্যাট রেডি প্রতি চ্যানেলে ৮-বিট ৪০৯৬ ১৫২৪ ডাউনলোড করুন

কর্মক্ষমতা

বিভিন্ন ডিভাইসে প্রতিটি মডেল চালানোর পারফরম্যান্স সংখ্যা নিচে দেওয়া হল। মনে রাখবেন যে বেঞ্চমার্কটি 1024 টোকেন প্রিফিল এবং 256 টোকেন ডিকোড (অ্যান্ড্রয়েড ডিভাইসে পারফরম্যান্স লক সহ) দিয়ে পরিমাপ করা হয়।

মডেল যন্ত্র ব্যাকএন্ড প্রিফিল (টোকেন/সেকেন্ড) ডিকোড (টোকেন/সেকেন্ড) প্রসঙ্গ আকার
জেমা৩-১বি ম্যাকবুক প্রো
(২০২৩ এম৩)
সিপিইউ ৪২৩ ৬৭ ৪০৯৬
জেমা৩-১বি স্যামসাং এস২৪
(আল্ট্রা)
সিপিইউ ২৪৩ ৪৪ ৪০৯৬
জেমা৩-১বি স্যামসাং এস২৪
(আল্ট্রা)
জিপিইউ ১৮৭৭ ৪৫ ৪০৯৬
জেমা৩-১বি স্যামসাং এস২৫
(আল্ট্রা)
এনপিইউ ৫৮৩৭ ৮৫ ১২৮০
জেমা-৩এন-ই২বি ম্যাকবুক প্রো
(২০২৩ এম৩)
সিপিইউ ২৩৩ ২৮ ৪০৯৬
জেমা-৩এন-ই২বি স্যামসাং এস২৪
(আল্ট্রা)
সিপিইউ ১১১ ১৬ ৪০৯৬
জেমা-৩এন-ই২বি স্যামসাং এস২৪
(আল্ট্রা)
জিপিইউ ৮১৬ ১৬ ৪০৯৬
জেমা-৩এন-ই৪বি ম্যাকবুক প্রো
(২০২৩ এম৩)
সিপিইউ ১৭০ ২০ ৪০৯৬
জেমা-৩এন-ই৪বি স্যামসাং এস২৪
(আল্ট্রা)
সিপিইউ ৭৪ ৪০৯৬
জেমা-৩এন-ই৪বি স্যামসাং এস২৪
(আল্ট্রা)
জিপিইউ ৫৪৮ ৪০৯৬
ফাংশনজেমা স্যামসাং এস২৫
(আল্ট্রা)
সিপিইউ ১৭১৮ ১২৬ ১০২৪

দ্রষ্টব্য: যখন কোনও নির্দিষ্ট ডিভাইসে কোনও নির্দিষ্ট মডেল প্রথমবার লোড করা হয়, তখন ওজন অপ্টিমাইজ করা হওয়ায় লোড হতে বেশি সময় লাগবে। ক্যাশিংয়ের কারণে পরবর্তী লোডগুলি দ্রুত হবে।

মডেল হোস্টিং এবং স্থাপনা

যখন কোনও মডেল "ওভার-দ্য-এয়ার" ডাউনলোড সীমা অতিক্রম করে (প্রায়শই প্রায় 1.5GB), তখন একটি রিমোট ফেচ কৌশল প্রয়োজন।

সমস্যা রিপোর্ট করা

যদি আপনার কোন বাগের সম্মুখীন হন অথবা কোন ফিচারের অনুরোধ থাকে, তাহলে অনুগ্রহ করে LiteRT-LM GitHub সমস্যা পৃষ্ঠাটি ব্যবহার করুন।