প্রসঙ্গ ক্যাশিং

একটি সাধারণ এআই ওয়ার্কফ্লোতে, আপনি একটি মডেলে একই ইনপুট টোকেন বারবার পাঠাতে পারেন। জেমিনি এপিআই পারফরম্যান্স এবং খরচ অপ্টিমাইজ করার জন্য ইমপ্লিসিট ক্যাশিং সুবিধা প্রদান করে।

অন্তর্নিহিত ক্যাশিং

সমস্ত জেমিনি ২.৫ এবং নতুন মডেলগুলির জন্য ইমপ্লিসিট ক্যাশিং ডিফল্টরূপে সক্রিয় থাকে। আপনার অনুরোধ ক্যাশে পৌঁছালে আমরা স্বয়ংক্রিয়ভাবে খরচ সাশ্রয়ের সুবিধাটি আপনাকে দিয়ে দিই। এটি সক্রিয় করার জন্য আপনাকে কিছু করতে হবে না। প্রতিটি মডেলের জন্য কনটেক্সট ক্যাশিংয়ের ন্যূনতম ইনপুট টোকেন সংখ্যা নিম্নলিখিত সারণীতে তালিকাভুক্ত করা হয়েছে:

মডেল সর্বনিম্ন টোকেন সীমা
জেমিনি ৩.৫ ফ্ল্যাশ ৪০৯৬
জেমিনি ৩.১ প্রো প্রিভিউ ৪০৯৬
জেমিনি ২.৫ ফ্ল্যাশ ২০৪৮
জেমিনি ২.৫ প্রো ২০৪৮

ইমপ্লিসিট ক্যাশে হিটের সম্ভাবনা বাড়াতে:

  • আপনার প্রম্পটের শুরুতে বড় এবং সাধারণ বিষয়বস্তু রাখার চেষ্টা করুন।
  • অল্প সময়ের মধ্যে একই প্রিফিক্স সহ অনুরোধ পাঠানোর চেষ্টা করুন।

রেসপন্স অবজেক্টের usage_metadata (পাইথন) বা usageMetadata (জাভাস্ক্রিপ্ট) ফিল্ডে আপনি ক্যাশে হিট হওয়া টোকেনগুলোর সংখ্যা দেখতে পারেন।