ইন্টারঅ্যাকশনস এপিআই এখন সর্বসাধারণের জন্য উপলব্ধ। সর্বশেষ সকল ফিচার ও মডেল ব্যবহারের জন্য আমরা এই এপিআইটি ব্যবহারের পরামর্শ দিচ্ছি।

এই পৃষ্ঠাটি Cloud Translation API অনুবাদ করেছে।

প্রসঙ্গ ক্যাশিং

একটি সাধারণ এআই ওয়ার্কফ্লোতে, আপনি একটি মডেলে একই ইনপুট টোকেন বারবার পাঠাতে পারেন। জেমিনি এপিআই পারফরম্যান্স এবং খরচ অপ্টিমাইজ করার জন্য ইমপ্লিসিট ক্যাশিং সুবিধা প্রদান করে।

দ্রষ্টব্য: এই পৃষ্ঠার সংস্করণটি ইন্টারঅ্যাকশনস এপিআই (Interactions API) নিয়ে আলোচনা করে, যা শুধুমাত্র ইমপ্লিসিট ক্যাশিং (implicit caching) সমর্থন করে। এক্সপ্লিসিট ক্যাশিং (Explicit caching) (ম্যানুয়ালি ক্যাশ অবজেক্ট তৈরি এবং পরিচালনা করা) ইন্টারঅ্যাকশনস এপিআই-তে সমর্থিত নয়। আপনি এই পৃষ্ঠার টগলটি ব্যবহার করে এর জেনারেটকন্টেন্ট এপিআই (generateContent API) সংস্করণে যেতে পারেন।

অন্তর্নিহিত ক্যাশিং

সমস্ত জেমিনি ২.৫ এবং নতুন মডেলগুলির জন্য ইমপ্লিসিট ক্যাশিং ডিফল্টরূপে সক্রিয় থাকে। এটি স্টেটফুল ( previous_interaction_id ব্যবহার করে) এবং স্টেটলেস উভয় কনভারসেশন মোডের জন্যই সমর্থিত। আপনার অনুরোধ ক্যাশে পৌঁছালে আমরা স্বয়ংক্রিয়ভাবে সাশ্রয়কৃত খরচ আপনাকে দিয়ে দিই। এটি সক্রিয় করার জন্য আপনাকে কিছু করতে হবে না। প্রতিটি মডেলের জন্য কনটেক্সট ক্যাশিংয়ের ন্যূনতম ইনপুট টোকেন সংখ্যা নিম্নলিখিত সারণীতে তালিকাভুক্ত করা হয়েছে:

মডেল	সর্বনিম্ন টোকেন সীমা
জেমিনি ৩.৫ ফ্ল্যাশ	৪০৯৬
জেমিনি ৩.১ প্রো প্রিভিউ	৪০৯৬
জেমিনি ২.৫ ফ্ল্যাশ	২০৪৮
জেমিনি ২.৫ প্রো	২০৪৮

ইমপ্লিসিট ক্যাশে হিটের সম্ভাবনা বাড়াতে:

আপনার প্রম্পটের শুরুতে বড় এবং সাধারণ বিষয়বস্তু রাখার চেষ্টা করুন।
অল্প সময়ের মধ্যে একই প্রিফিক্স সহ অনুরোধ পাঠানোর চেষ্টা করুন।

রেসপন্স অবজেক্টের usage.total_cached_tokens (পাইথন এবং জাভাস্ক্রিপ্ট) ফিল্ডে আপনি ক্যাশে হিট হওয়া টোকেনগুলোর সংখ্যা দেখতে পারেন।