API تعاملات اکنون به طور عمومی در دسترس است. توصیه می‌کنیم برای دسترسی به جدیدترین ویژگی‌ها و مدل‌ها از این API استفاده کنید.

این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.

ذخیره‌سازی متن، ذخیره‌سازی متن

در یک گردش کار معمولی هوش مصنوعی، ممکن است توکن‌های ورودی یکسانی را بارها و بارها به یک مدل ارسال کنید. API Gemini برای بهینه‌سازی عملکرد و هزینه‌ها، ذخیره‌سازی ضمنی (implicit caching) را ارائه می‌دهد.

ذخیره سازی ضمنی

ذخیره‌سازی ضمنی (implicit caching) به طور پیش‌فرض برای همه مدل‌های Gemini 2.5 و جدیدتر فعال است. اگر درخواست شما به حافظه‌های پنهان (cache) برسد، ما به طور خودکار صرفه‌جویی در هزینه را اعمال می‌کنیم. برای فعال کردن این قابلیت، نیازی به انجام کاری از سوی شما نیست. حداقل تعداد توکن ورودی برای ذخیره‌سازی زمینه (context caching) برای هر مدل در جدول زیر ذکر شده است:

مدل	حداقل محدودیت توکن
فلش جمینی ۳.۵	۴۰۹۶ عدد
پیش‌نمایش Gemini 3.1 Pro	۴۰۹۶ عدد
فلش جمینی ۲.۵	۲۰۴۸
جمینی ۲.۵ پرو	۲۰۴۸

برای افزایش احتمال برخورد با حافظه پنهان ضمنی:

سعی کنید مطالب بزرگ و رایج را در ابتدای درخواست خود قرار دهید.
سعی کنید درخواست‌هایی با پیشوند مشابه را در مدت زمان کوتاهی ارسال کنید

می‌توانید تعداد توکن‌هایی که در حافظه پنهان (cache hits) بوده‌اند را در فیلد usage_metadata (پایتون) یا usageMetadata (جاوااسکریپت) شیء پاسخ مشاهده کنید.