মোবাইল অ্যাকশনের জন্য ফাংশন সূক্ষ্ম-সুরকরণ Gemma 270M

সংক্ষিপ্ত বিবরণ

মোবাইল অ্যাকশনস একটি ডেমো অ্যাপ যেখানে ব্যবহারকারীরা ভয়েস বা টেক্সট ইনপুট থেকে তাদের ডিভাইসে অ্যাকশন ট্রিগার করতে পারেন। এটি সহকারী ইন্টারঅ্যাকশনকে সম্পূর্ণ অফলাইন ক্ষমতা হিসেবে পুনর্কল্পনা করে। "আগামীকালের মধ্যাহ্নভোজের জন্য একটি ক্যালেন্ডার ইভেন্ট তৈরি করুন", "আমার পরিচিতিতে জন যোগ করুন", অথবা "টর্চলাইট চালু করুন" যাই হোক না কেন, মডেলটি প্রাকৃতিক ভাষা বিশ্লেষণ করে এবং কমান্ডটি কার্যকর করার জন্য সঠিক OS টুলটি সনাক্ত করে।

এই নির্দেশিকাটি আপনাকে দেখাবে কিভাবে:

  1. মোবাইল অ্যাকশন ডেটাসেট ব্যবহার করে FunctionGemma 270M মডেলের সূক্ষ্ম-টিউনিং
  2. গুগল এআই এজ গ্যালারিতে কাস্টমাইজড মডেলটি স্থাপন করা হচ্ছে

আপনি একটি মডেলকে সূক্ষ্মভাবে সাজানো থেকে শুরু করে ডিভাইসে এটি স্থাপন করা পর্যন্ত এন্ড-টু-এন্ড শিখতে সক্ষম হবেন।

ধাপ ১: মোবাইল অ্যাকশন ডেটাসেটের সাহায্যে ফাংশনজেমাকে ফাইন-টিউন করা

ফাংশনগেমা হল জেমা ৩ আর্কিটেকচারের উপর ভিত্তি করে তৈরি একটি ২৭০ মিলিয়ন প্যারামিটার মডেল। এটিকে ফাংশন কলিংয়ের জন্য বিশেষভাবে প্রশিক্ষিত করা হয়েছে, যা এটি প্রাকৃতিক ভাষার অনুরোধগুলিকে ফাংশন কলে অনুবাদ করতে সক্ষম করে।

এই মডেলটি ছোট এবং মোবাইল ফোনে চালানোর জন্য যথেষ্ট দক্ষ, তবে এই আকারের মডেলগুলির ক্ষেত্রে যেমনটি সাধারণ, এটি যে কাজটি সম্পাদন করতে চলেছে তার জন্য এটিকে বিশেষায়িত করার জন্য সূক্ষ্ম-টিউনিং প্রয়োজন।

FunctionGemma-কে আরও সুন্দর করে তুলতে, আমরা মোবাইল অ্যাকশন ডেটাসেট ব্যবহার করি, যা Hugging Face-এ সর্বজনীনভাবে উপলব্ধ। এই ডেটাসেটের প্রতিটি এন্ট্রিতে রয়েছে:

  • মডেলটি যে সরঞ্জামগুলির (ফাংশন) ব্যবহার করতে পারে তার সেট:
    1. টর্চলাইট জ্বালায়
    2. টর্চলাইট বন্ধ করে দেয়
    3. ফোনের যোগাযোগ তালিকায় একটি পরিচিতি তৈরি করে
    4. একটি ইমেল পাঠায়
    5. মানচিত্রে একটি অবস্থান দেখায়
    6. ওয়াইফাই সেটিংস খোলে
    7. একটি নতুন ক্যালেন্ডার ইভেন্ট তৈরি করে
  • সিস্টেম প্রম্পট বর্তমান তারিখ এবং সময়ের মতো প্রসঙ্গ প্রদান করে
  • ব্যবহারকারী প্রম্পট করে, যেমন turn on the flashlight
  • উপযুক্ত ফাংশন কল সহ প্রত্যাশিত মডেল প্রতিক্রিয়া।

শো ম্যাপ ফাংশনটি কেমন দেখাচ্ছে তা এখানে:

{
  "function": {
    "name": "show_map",
    "description": "Shows a location on the map.",
    "parameters": {
      "type": "OBJECT",
      "properties": {
        "query": {
          "type": "STRING",
          "description": "The location to search for. May be the name of a place, a business, or an address."
        }
      },
      "required": [
        "query"
      ]
    }
  }
}

কোল্যাব নোটবুকটিতে সমস্ত প্রয়োজনীয় পদক্ষেপ অন্তর্ভুক্ত রয়েছে, যার মধ্যে রয়েছে:

  • পরিবেশ স্থাপন করা
  • মোবাইল অ্যাকশন ডেটাসেট লোড এবং প্রিপ্রসেসিং
  • হাগিং ফেস টিআরএল ব্যবহার করে মডেলটিকে সূক্ষ্ম-টিউন করা
  • স্থাপনের জন্য মডেলটিকে .litertlm ফর্ম্যাটে রূপান্তর করা হচ্ছে

পূর্বশর্ত : ধাপ ১-এ .litertlm ফাইলটি সংরক্ষণ করার জন্য এবং আপনার অ্যান্ড্রয়েড ফোনে এটি দিয়ে সাইন ইন করার জন্য আপনার একই Google অ্যাকাউন্টটি ব্যবহার করতে হবে।

সূক্ষ্ম-টিউনিংয়ের পর, আমরা মডেলের ওজনগুলিকে .litertlm ফর্ম্যাটে রূপান্তর এবং পরিমাণ নির্ধারণ করি।

আপনি Load Model নির্বাচন করে এবং আপনার গুগল ড্রাইভ (অথবা বিতরণের বিকল্প পদ্ধতি) থেকে এটি নির্বাচন করে গুগল এআই এজ গ্যালারি - মোবাইল অ্যাকশনস বিকল্পে মডেলটি স্থাপন করতে পারেন। গুগল এআই এজ গ্যালারি গুগল প্লে স্টোরে উপলব্ধ।

গুগল এআই এজ গ্যালারিতে মোবাইল অ্যাকশন ফাইনটিউন চ্যালেঞ্জগুগল এআই এজ গ্যালারিতে মোবাইল অ্যাকশন টাস্ক

এখন, আপনি একটি ভয়েস কমান্ড দেওয়ার চেষ্টা করতে পারেন অথবা অ্যাপে টাইপ করে দেখতে পারেন যে আপনার নতুন সূক্ষ্ম-টিউন করা মডেলটি এতে উপলব্ধ ফাংশনগুলি কতটা ভালভাবে কল করছে।

পরবর্তী পদক্ষেপ

অভিনন্দন! এখন তুমি জানো কিভাবে Hugging Face দিয়ে একটি মডেলকে সূক্ষ্মভাবে সাজাতে হয় এবং LiteRT-LM দিয়ে ডিভাইসে এটি স্থাপন করতে হয়।