বুঝুন এবং টোকেন গণনা করুন


মিথুন এবং অন্যান্য জেনারেটিভ এআই মডেলগুলি টোকেন নামক গ্রানুলিটিতে ইনপুট এবং আউটপুট প্রক্রিয়া করে।

এই নির্দেশিকাটি ব্যাখ্যা করে যে কীভাবে নির্দিষ্ট মডেলের প্রসঙ্গ উইন্ডোগুলি পেতে হয়, সেইসাথে টেক্সট ইনপুট, চ্যাট, মাল্টিমোডাল ইনপুট এবং সিস্টেম নির্দেশাবলী এবং সরঞ্জামগুলির মতো ব্যবহারের ক্ষেত্রে টোকেনগুলি কীভাবে গণনা করা যায়৷

টোকেন সম্পর্কে

টোকেন z এর মত একক অক্ষর বা cat মত পুরো শব্দ হতে পারে। দীর্ঘ শব্দগুলিকে কয়েকটি টোকেনে বিভক্ত করা হয়েছে। মডেল দ্বারা ব্যবহৃত সমস্ত টোকেনের সেটকে শব্দভাণ্ডার বলা হয় এবং টোকেনে পাঠ্য বিভক্ত করার প্রক্রিয়াটিকে টোকেনাইজেশন বলা হয়।

মিথুন মডেলের জন্য, একটি টোকেন প্রায় 4টি অক্ষরের সমতুল্য। 100 টোকেন প্রায় 60-80 ইংরেজি শব্দের সমান।

যখন বিলিং সক্ষম করা হয়, তখন Gemini API-তে কলের খরচ আংশিকভাবে ইনপুট এবং আউটপুট টোকেনের সংখ্যা দ্বারা নির্ধারিত হয়, তাই টোকেনগুলি কীভাবে গণনা করতে হয় তা জানা সহায়ক হতে পারে।