‫Interactions API זמין עכשיו לכלל המשתמשים. מומלץ להשתמש ב-API הזה כדי לקבל גישה לכל התכונות והמודלים העדכניים.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

שמירה במטמון של הקשר

בתהליך עבודה טיפוסי של AI, יכול להיות שתעבירו את אותם אסימוני קלט שוב ושוב למודל. ‫Gemini API מציע שמירה מרומזת במטמון כדי לשפר את הביצועים ולצמצם את העלויות.

שמירה מרומזת במטמון

האפשרות 'שמירת נתונים במטמון באופן מרומז' מופעלת כברירת מחדל בכל המודלים של Gemini 2.5 ומעלה. הוא תומך גם במצב שיחה עם שמירת מצב (באמצעות previous_interaction_id) וגם במצב שיחה ללא שמירת מצב. אם הבקשה שלכם מגיעה למטמון, אנחנו מעבירים לכם באופן אוטומטי את החיסכון בעלויות. לא צריך לעשות שום דבר כדי להפעיל את התכונה הזו. בטבלה הבאה מפורט מספר האסימונים המינימלי של הקלט לכל מודל שנדרש כדי להשתמש במטמון ההקשר:

מודל	מגבלת טוקנים מינימלית
Gemini 3.5 Flash	4096
‫Gemini 3.1 Pro Preview	4096
Gemini ‎2.5 Flash	2048
Gemini ‎2.5 Pro	2048

כדי להגדיל את הסיכוי לפגיעה במטמון משתמע:

כדאי לנסות להוסיף בתחילת ההנחיה תוכן גדול ונפוץ
ניסיון לשלוח בקשות עם קידומת דומה בפרק זמן קצר

אפשר לראות את מספר הטוקנים שהיו פגיעות במטמון בשדה usage.total_cached_tokens (Python ו-JavaScript) של אובייקט התגובה.