הגבלות על קצב יצירת הבקשות קובעות את מספר הבקשות שאפשר לשלוח ל-Gemini API בפרק זמן נתון. ההגבלות האלה עוזרות לנו לשמור על שימוש הוגן, להגן מפני שימוש לרעה ולשמור על ביצועי המערכת לכל המשתמשים.
איך רואים את מכסות התעריפים הפעילות ב-AI Studio
איך פועלות מגבלות הקצב
מגבלות קצב שליחת בקשות נמדדות בדרך כלל בשלושה ממדים:
- בקשות לדקה (RPM)
- טוקנים לדקה (קלט) (TPM)
- בקשות ביום (RPD)
השימוש שלכם נבדק מול כל מגבלה, ואם תחרגו מאחת מהן, תוצג שגיאה של הגבלת קצב. לדוגמה, אם מגבלת ה-RPM שלכם היא 20, שליחת 21 בקשות בתוך דקה תוביל לשגיאה, גם אם לא חרגתם ממגבלת ה-TPM או ממגבלות אחרות.
המגבלות על קצב יצירת הבקשות חלות על כל פרויקט ולא על כל מפתח API. המכסות של בקשות ביום (RPD) מתאפסות בחצות, לפי שעון החוף המערבי של ארה"ב.
המגבלות משתנות בהתאם למודל הספציפי שבו משתמשים, וחלק מהמגבלות חלות רק על מודלים ספציפיים. לדוגמה, המדד 'תמונות לדקה' (IPM) מחושב רק עבור מודלים שיכולים ליצור תמונות (Nano Banana), אבל הוא דומה מבחינה רעיונית למדד 'אסימונים לדקה' (TPM). יכול להיות שלמודלים אחרים תהיה מגבלה של טוקנים ליום (TPD).
המכסות ליצירת בקשות במודלים ניסיוניים ובמודלים בגרסת טרום-השקה (Preview) מוגבלות יותר.
רמות שימוש
הגבלות הקצב קשורות לרמת השימוש בפרויקט. ככל שהשימוש ב-API וההוצאות גדלים, המינוי שלכם ישודרג אוטומטית לרמה גבוהה יותר עם מכסות גדולות יותר.
הקריטריונים לרמות 2 ו-3 מבוססים על סך ההוצאות המצטברות על שירותי Google Cloud (כולל, בין היתר, Gemini API) בחשבון לחיוב שמקושר לפרויקט.
| רמת שימוש | מוקדמות | מגבלת שכבת החיוב |
|---|---|---|
| Free | פרויקט פעיל או תקופת ניסיון בחינם | לא רלוונטי |
| רמה 1 | הגדרה וקישור של חשבון לחיוב פעיל | $250 |
| רמה 2 | התשלום בוצע בסך 100 $+ 3 ימים מהתשלום הראשון שבוצע בהצלחה | 2,000 $ |
| רמה 3 | התשלום בוצע בסך 1,000 $+ 30 ימים מהתשלום הראשון שבוצע בהצלחה | 20,000$ – 100,000$ ומעלה |
בדרך כלל, אם אתם עומדים בקריטריונים שצוינו, הבקשה שלכם תאושר. עם זאת, במקרים נדירים, יכול להיות שנאשר בקשת שדרוג רק אחרי שנבדוק גורמים אחרים בתהליך הבדיקה.
המערכת הזו עוזרת לשמור על האבטחה והיושרה של פלטפורמת Gemini API לכל המשתמשים.
מגבלות קצב ב-Gemini API
מגבלות הקצב תלויות במגוון גורמים (כמו רמת השימוש שלכם) ואפשר לראות אותן ב-Google AI Studio. ככל שהרמה והסטטוס של החשבון משתנים לאורך זמן, מגבלות הקצב מתעדכנות באופן אוטומטי.
איך רואים את מכסות התעריפים הפעילות ב-AI Studio
המגבלות על קצב הבקשות שצוינו לא מובטחות, והקיבולת בפועל עשויה להשתנות.
מגבלות קצב של היקש בעדיפות גבוהה
לצריכה עדיפות יש מגבלות קצב משלה, למרות שהצריכה נספרת במגבלות הקצב הכוללות של תעבורה אינטראקטיבית. מגבלות ברירת המחדל על קצב הבקשות הן: 0.3x ממגבלת הקצב הרגילה לכל מודל ורמת שירות
מגבלות קצב ליצירת בקשות (Rate Limits) של Batch API
בקשות Batch API כפופות למגבלות קצב משלהן, בנפרד מקריאות API שאינן מקובצות.
- בקשות באצווה במקביל: 100
- המגבלה על גודל קובץ הקלט: 2GB
- מגבלת אחסון הקבצים: 20GB
- טוקנים בתור לכל מודל: בטבלה טוקנים בתור לעיבוד באצווה מפורט המספר המקסימלי של טוקנים שאפשר להוסיף לתור לעיבוד באצווה בכל המשימות הפעילות לעיבוד באצווה עבור מודל נתון.
שכבה 1
| מודל | Batch enqueued tokens | |||
|---|---|---|---|---|
| מודלים של טקסט | ||||
| Gemini 3.1 Pro Preview | 5,000,000 | |||
| Gemini 3.1 Flash-Lite | 10,000,000 | |||
| גרסת טרום-השקה (Preview) של Gemini 3.1 Flash-Lite | 10,000,000 | |||
| Gemini 3.5 Flash | 3,000,000 | |||
| Gemini 3.5 Flash | 3,000,000 | |||
| Gemini 2.5 Pro | 5,000,000 | |||
| Gemini 2.5 Pro TTS | 25,000 | |||
| Gemini 2.5 Flash | 3,000,000 | |||
| גרסת טרום-השקה (Preview) של Gemini 2.5 Flash | 3,000,000 | |||
| תצוגה מקדימה של תמונה ב-Gemini 2.5 Flash | 3,000,000 | |||
| Gemini 2.5 Flash TTS | 100,000 | |||
| Gemini 2.5 Flash-Lite | 10,000,000 | |||
| גרסת טרום-השקה (Preview) של Gemini 2.5 Flash-Lite | 10,000,000 | |||
| Gemini 2.0 Flash | 10,000,000 | |||
| תמונה של Gemini 2.0 Flash | 3,000,000 | |||
| Gemini 2.0 Flash-Lite | 10,000,000 | |||
| מודלים גנרטיביים מרובי-מוֹדָלִים | ||||
| תצוגה מקדימה של תמונות ב-Gemini 3.1 Flash 🍌 | 1,000,000 | |||
| תצוגה מקדימה של תמונה ב-Gemini 3 Pro 🍌 | 2,000,000 | |||
| מודלים להטמעה | ||||
| Gemini Embedding | 500,000 | |||
שכבה 2
| מודל | Batch enqueued tokens | |||
|---|---|---|---|---|
| מודלים של טקסט | ||||
| Gemini 3.1 Pro Preview | 500,000,000 | |||
| Gemini 3.1 Flash-Lite | 500,000,000 | |||
| גרסת טרום-השקה (Preview) של Gemini 3.1 Flash-Lite | 500,000,000 | |||
| Gemini 3.5 Flash | 400,000,000 | |||
| Gemini 3.5 Flash | 400,000,000 | |||
| Gemini 2.5 Pro | 500,000,000 | |||
| Gemini 2.5 Pro TTS | 100,000 | |||
| Gemini 2.5 Flash | 400,000,000 | |||
| גרסת טרום-השקה (Preview) של Gemini 2.5 Flash | 400,000,000 | |||
| תצוגה מקדימה של תמונה ב-Gemini 2.5 Flash | 400,000,000 | |||
| Gemini 2.5 Flash TTS | 100,000 | |||
| Gemini 2.5 Flash-Lite | 500,000,000 | |||
| גרסת טרום-השקה (Preview) של Gemini 2.5 Flash-Lite | 500,000,000 | |||
| Gemini 2.0 Flash | 1,000,000,000 | |||
| תמונה של Gemini 2.0 Flash | 400,000,000 | |||
| Gemini 2.0 Flash-Lite | 1,000,000,000 | |||
| מודלים גנרטיביים מרובי-מוֹדָלִים | ||||
| תצוגה מקדימה של תמונות ב-Gemini 3.1 Flash 🍌 | 250,000,000 | |||
| תצוגה מקדימה של תמונה ב-Gemini 3 Pro 🍌 | 270,000,000 | |||
| מודלים להטמעה | ||||
| Gemini Embedding | 5,000,000 | |||
שכבה 3
| מודל | Batch enqueued tokens | |||
|---|---|---|---|---|
| מודלים של טקסט | ||||
| Gemini 3.1 Pro Preview | 1,000,000,000 | |||
| Gemini 3.1 Flash-Lite | 1,000,000,000 | |||
| גרסת טרום-השקה (Preview) של Gemini 3.1 Flash-Lite | 1,000,000,000 | |||
| Gemini 3.5 Flash | 1,000,000,000 | |||
| Gemini 3.5 Flash | 1,000,000,000 | |||
| Gemini 2.5 Pro | 1,000,000,000 | |||
| Gemini 2.5 Pro TTS | 1,000,000 | |||
| Gemini 2.5 Flash | 1,000,000,000 | |||
| גרסת טרום-השקה (Preview) של Gemini 2.5 Flash | 1,000,000,000 | |||
| תצוגה מקדימה של תמונה ב-Gemini 2.5 Flash | 1,000,000,000 | |||
| Gemini 2.5 Flash TTS | 4,000,000 | |||
| Gemini 2.5 Flash-Lite | 1,000,000,000 | |||
| גרסת טרום-השקה (Preview) של Gemini 2.5 Flash-Lite | 1,000,000,000 | |||
| Gemini 2.0 Flash | 5,000,000,000 | |||
| תמונה של Gemini 2.0 Flash | 1,000,000,000 | |||
| Gemini 2.0 Flash-Lite | 5,000,000,000 | |||
| מודלים גנרטיביים מרובי-מוֹדָלִים | ||||
| תצוגה מקדימה של תמונות ב-Gemini 3.1 Flash 🍌 | 750,000,000 | |||
| תצוגה מקדימה של תמונה ב-Gemini 3 Pro 🍌 | 1,000,000,000 | |||
| מודלים להטמעה | ||||
| Gemini Embedding | 10,000,000 | |||
איך משדרגים לרמה הבאה
כדי לעבור מהתוכנית בחינם לתוכנית בתשלום, קודם צריך להגדיר חיוב ב-AI Studio.
אחרי שהפרויקט יעמוד בקריטריונים שצוינו, הוא ישודרג אוטומטית לרמה הבאה. שדרוגים של רמת השירות מחינם לרמה 1 בדרך כלל נכנסים לתוקף באופן מיידי, ושדרוגים לרמות שירות גבוהות יותר נכנסים לתוקף תוך 10 דקות. עוברים אל דף הפרויקטים ב-AI Studio כדי לבדוק את הרמות.
בקשה להגדלת מגבלת קצב הבקשות
לכל וריאציה של מודל יש מגבלת קצב משויכת (בקשות לדקה, RPM). פרטים על מגבלות הקצב האלה זמינים בדף מגבלת הקצב של AI Studio.
בקשה להגדלת מגבלת קצב הבקשות בתוכנית בתשלום
אנחנו לא יכולים להבטיח שנרחיב את מכסת קצב הבקשות, אבל נעשה כמיטב יכולתנו כדי לבדוק את הבקשה.