הגבלות על קצב יצירת הבקשות קובעות את מספר הבקשות שאפשר לשלוח ל-Gemini API בפרק זמן נתון. ההגבלות האלה עוזרות לשמור על שימוש הוגן, להגן מפני ניצול לרעה ולשמור על ביצועי המערכת לכל המשתמשים.
הצגת מגבלות התעריפים הפעילות ב-AI Studio
איך פועלות מגבלות הקצב
מגבלות הקצב נמדדות בדרך כלל לפי שלושה מאפיינים:
- בקשות לדקה (RPM)
- טוקנים לדקה (קלט) (TPM)
- בקשות ביום (RPD)
השימוש שלכם נבדק מול כל מגבלה, וחריגה מאחת מהן תגרום לשגיאה של הגבלת קצב. לדוגמה, אם מגבלת הבקשות לדקה היא 20, שליחת 21 בקשות בתוך דקה תוביל לשגיאה, גם אם לא חרגתם ממגבלת הטוקנים לדקה או ממגבלות אחרות.
הגבלות על קצב יצירת הבקשות חלות על כל פרויקט ולא על כל מפתח API.
המכסות של בקשות ביום (RPD) מתאפסות בחצות, לפי שעון החוף המערבי של ארה"ב.
המגבלות משתנות בהתאם למודל הספציפי שבו משתמשים, וחלק מהמגבלות חלות רק על מודלים ספציפיים. לדוגמה, תמונות לדקה (IPM) מחושבות רק עבור מודלים שיכולים ליצור תמונות (Imagen 3), אבל הן דומות מבחינה רעיונית לטוקנים לדקה (TPM). במודלים אחרים יכולה להיות מגבלה של טוקנים ליום (TPD).
מגבלות הקצב במודלים ניסיוניים ובמודלים בגרסת טרום-השקה (Preview) הן מחמירות יותר.
רמות שימוש
הגבלות הקצב קשורות לרמת השימוש בפרויקט. ככל שהשימוש ב-API וההוצאות גדלים, יש אפשרות לשדרג לרמה גבוהה יותר עם מגבלות קצב גבוהות יותר.
הקריטריונים לרמות 2 ו-3 מבוססים על סך ההוצאות המצטברות על שירותי Google Cloud (כולל, בין היתר, Gemini API) בחשבון לחיוב שמקושר לפרויקט.
| שכבה | דרישות |
|---|---|
| חינם | משתמשים במדינות שבהן התכונה זמינה |
| שכבה 1 | החשבון לחיוב שמקושר לפרויקט |
| שכבה 2 | ההוצאה הכוללת: מעל 250$ ועברו לפחות 30 ימים מאז התשלום האחרון שבוצע בהצלחה |
| שכבה 3 | ההוצאה הכוללת: מעל 1,000$ ועברו לפחות 30 ימים מאז התשלום האחרון שבוצע בהצלחה |
כשאתם מבקשים לשדרג את החשבון, מערכת ההגנה האוטומטית שלנו מפני ניצול לרעה מבצעת בדיקות נוספות. בדרך כלל, אם אתם עומדים בקריטריונים שצוינו, הבקשה שלכם תאושר. עם זאת, במקרים נדירים, יכול להיות שנאשר את הבקשה שלכם לשדרוג על סמך גורמים אחרים שזיהינו במהלך תהליך הבדיקה.
המערכת הזו עוזרת לשמור על האבטחה והיושרה של פלטפורמת Gemini API לכל המשתמשים.
מגבלות קצב סטנדרטיות של בקשות API
בטבלה הבאה מפורטות מגבלות הקצב של כל הקריאות הרגילות ל-Gemini API.
תוכנית ללא תשלום
| דגם | הכנסה לאלף צפיות (RPM) | TPM | RPD |
|---|---|---|---|
| מודלים של טקסט לטקסט | |||
| Gemini 2.5 Pro | 2 | 125,000 | 50 |
| Gemini 2.5 Flash | 10 | 250,000 | 250 |
| גרסת טרום-השקה של Gemini 2.5 Flash | 10 | 250,000 | 250 |
| Gemini 2.5 Flash-Lite | 15 | 250,000 | 1,000 |
| גרסת טרום-השקה (Preview) של Gemini 2.5 Flash-Lite | 15 | 250,000 | 1,000 |
| Gemini 2.0 Flash | 15 | 1,000,000 | 200 |
| Gemini 2.0 Flash-Lite | 30 | 1,000,000 | 200 |
| Live API | |||
| Gemini 2.5 Flash Live | * | 1,000,000 | * |
| גרסת טרום-השקה (Preview) של Gemini 2.5 Flash עם אודיו מקורי | * | 500,000 | * |
| Gemini 2.0 Flash Live | * | 1,000,000 | * |
| מודלים גנרטיביים מרובי-מוֹדָלִים | |||
| Gemini 2.5 Flash Preview TTS | 3 | 10,000 | 15 |
| גרסת טרום-השקה (Preview) של Gemini 2.0 Flash ליצירת תמונות | 10 | 200,000 | 100 |
| מודלים אחרים | |||
| Gemma 3 ו-Gemma 3n | 30 | 15,000 | 14,400 |
| Gemini Embedding | 100 | 30,000 | 1,000 |
| Gemini Robotics-ER 1.5 Preview | 10 | 250,000 | 250 |
| מודלים שהוצאו משימוש | |||
| Gemini 1.5 Flash (יצא משימוש) | 15 | 250,000 | 50 |
| Gemini 1.5 Flash-8B (הוצא משימוש) | 15 | 250,000 | 50 |
שכבה 1
| דגם | הכנסה לאלף צפיות (RPM) | TPM | RPD | טוקנים שהוכנסו לתור באצווה |
|---|---|---|---|---|
| מודלים של טקסט לטקסט | ||||
| Gemini 3 Pro Preview | 50 | 1,000,000 | 1,000 | 50,000,000 |
| Gemini 2.5 Pro | 150 | 2,000,000 | 10,000 | 5,000,000 |
| Gemini 2.5 Flash | 1,000 | 1,000,000 | 10,000 | 3,000,000 |
| גרסת טרום-השקה של Gemini 2.5 Flash | 1,000 | 1,000,000 | 10,000 | 3,000,000 |
| Gemini 2.5 Flash-Lite | 4,000 | 4,000,000 | * | 10,000,000 |
| גרסת טרום-השקה (Preview) של Gemini 2.5 Flash-Lite | 4,000 | 4,000,000 | * | 10,000,000 |
| Gemini 2.0 Flash | 2,000 | 4,000,000 | * | 10,000,000 |
| Gemini 2.0 Flash-Lite | 4,000 | 4,000,000 | * | 10,000,000 |
| Live API | ||||
| Gemini 2.5 Flash Live | 50 ביקורים | 4,000,000 | * | * |
| גרסת טרום-השקה (Preview) של Gemini 2.5 Flash עם אודיו מקורי | * | 1,000,000 | * | * |
| Gemini 2.0 Flash Live | 50 ביקורים | 4,000,000 | * | * |
| מודלים גנרטיביים מרובי-מוֹדָלִים | ||||
| Gemini 2.5 Flash Preview TTS | 10 | 10,000 | 100 | * |
| Gemini 2.5 Pro Preview TTS | 10 | 10,000 | 50 | * |
| תמונה של בננה שנוצרה באמצעות Gemini 2.5 Flash 🍌 | 500 | 500,000 | 2,000 | * |
| גרסת טרום-השקה (Preview) של Gemini 2.0 Flash ליצירת תמונות | 1,000 | 1,000,000 | 10,000 | * |
| Imagen 4 Standard/Fast | 10 | * | 70 | * |
| Imagen 4 Ultra | 5 | * | 30 | * |
| Imagen 3 | 20 | * | * | * |
| Veo 3.1 | 2 | * | 10 | * |
| Veo 3.1 Fast | 2 | * | 10 | * |
| Veo 3 | 2 | * | 10 | * |
| Veo 3 Fast | 2 | * | 10 | * |
| Veo 2 | 2 | * | 50 | * |
| מודלים אחרים | ||||
| Gemma 3 ו-Gemma 3n | 30 | 15,000 | 14,400 | * |
| Gemini Embedding | 3,000 | 1,000,000 | * | * |
| Gemini Robotics-ER 1.5 Preview | 300 | 1,000,000 | 10,000 | * |
| גרסת טרום-השקה של Gemini 2.5 לשימוש במחשב | 150 | 2,000,000 | 10,000 | * |
| מודלים שהוצאו משימוש | ||||
| Gemini 1.5 Flash (יצא משימוש) | 2,000 | 4,000,000 | * | * |
| Gemini 1.5 Flash-8B (הוצא משימוש) | 4,000 | 4,000,000 | * | * |
| Gemini 1.5 Pro (יצא משימוש) | 1,000 | 4,000,000 | * | * |
שכבה 2
| דגם | הכנסה לאלף צפיות (RPM) | TPM | RPD | טוקנים שהוכנסו לתור באצווה |
|---|---|---|---|---|
| מודלים של טקסט לטקסט | ||||
| Gemini 3 Pro Preview | 1,000 | 5,000,000 | 50,000 | 500,000,000 |
| Gemini 2.5 Pro | 1,000 | 5,000,000 | 50,000 | 500,000,000 |
| Gemini 2.5 Flash | 2,000 | 3,000,000 | 100,000 | 400,000,000 |
| גרסת טרום-השקה של Gemini 2.5 Flash | 2,000 | 3,000,000 | 100,000 | 400,000,000 |
| Gemini 2.5 Flash-Lite | 10,000 | 10,000,000 | * | 500,000,000 |
| גרסת טרום-השקה (Preview) של Gemini 2.5 Flash-Lite | 10,000 | 10,000,000 | * | 500,000,000 |
| Gemini 2.0 Flash | 10,000 | 10,000,000 | * | 1,000,000,000 |
| Gemini 2.0 Flash-Lite | 20,000 | 10,000,000 | * | 1,000,000,000 |
| Live API | ||||
| Gemini 2.5 Flash Live | 1,000 ביקורים | 10,000,000 | * | * |
| גרסת טרום-השקה (Preview) של Gemini 2.5 Flash עם אודיו מקורי | * | 10,000,000 | * | * |
| Gemini 2.0 Flash Live | 1,000 ביקורים | 10,000,000 | * | * |
| מודלים גנרטיביים מרובי-מוֹדָלִים | ||||
| Gemini 2.5 Flash Preview TTS | 1,000 | 100,000 | 10,000 | * |
| Gemini 2.5 Pro Preview TTS | 100 | 25,000 | 1,000 | * |
| תמונה של בננה שנוצרה באמצעות Gemini 2.5 Flash 🍌 | 2,000 | 1,500,000 | 50,000 | * |
| גרסת טרום-השקה (Preview) של Gemini 2.0 Flash ליצירת תמונות | 2,000 | 3,000,000 | 100,000 | * |
| Imagen 4 Standard/Fast | 15 | * | 1000 | * |
| Imagen 4 Ultra | 10 | * | 400 | * |
| Imagen 3 | 20 | * | * | * |
| Veo 3.1 | 4 | * | 50 | * |
| Veo 3.1 Fast | 4 | * | 50 | * |
| Veo 3 | 4 | * | 50 | * |
| Veo 3 Fast | 4 | * | 50 | * |
| Veo 2 | 2 | * | 50 | * |
| מודלים אחרים | ||||
| Gemma 3 ו-Gemma 3n | 30 | 15,000 | 14,400 | * |
| Gemini Embedding | 5,000 | 5,000,000 | * | * |
| Gemini Robotics-ER 1.5 Preview | 400 | 3,000,000 | 100,000 | * |
| גרסת טרום-השקה של Gemini 2.5 לשימוש במחשב | 1,000 | 5,000,000 | 50,000 | * |
| מודלים שהוצאו משימוש | ||||
| Gemini 1.5 Flash (יצא משימוש) | 2,000 | 4,000,000 | * | * |
| Gemini 1.5 Flash-8B (הוצא משימוש) | 4,000 | 4,000,000 | * | * |
| Gemini 1.5 Pro (יצא משימוש) | 1,000 | 4,000,000 | * | * |
שכבה 3
| דגם | הכנסה לאלף צפיות (RPM) | TPM | RPD | טוקנים שהוכנסו לתור באצווה |
|---|---|---|---|---|
| מודלים של טקסט לטקסט | ||||
| Gemini 3 Pro Preview | 2,000 | 8,000,000 | * | 1,000,000,000 |
| Gemini 2.5 Pro | 2,000 | 8,000,000 | * | 1,000,000,000 |
| Gemini 2.5 Flash | 10,000 | 8,000,000 | * | 1,000,000,000 |
| גרסת טרום-השקה של Gemini 2.5 Flash | 10,000 | 8,000,000 | * | 1,000,000,000 |
| Gemini 2.5 Flash-Lite | 30,000 | 30,000,000 | * | 1,000,000,000 |
| גרסת טרום-השקה (Preview) של Gemini 2.5 Flash-Lite | 30,000 | 30,000,000 | * | 1,000,000,000 |
| Gemini 2.0 Flash | 30,000 | 30,000,000 | * | 5,000,000,000 |
| Gemini 2.0 Flash-Lite | 30,000 | 30,000,000 | * | 5,000,000,000 |
| Live API | ||||
| Gemini 2.5 Flash Live | 1,000 ביקורים | 10,000,000 | * | * |
| גרסת טרום-השקה (Preview) של Gemini 2.5 Flash עם אודיו מקורי | * | 10,000,000 | * | * |
| Gemini 2.0 Flash Live | 1,000 ביקורים | 10,000,000 | * | * |
| מודלים גנרטיביים מרובי-מוֹדָלִים | ||||
| Gemini 2.5 Flash Preview TTS | 1,000 | 1,000,000 | * | * |
| Gemini 2.5 Pro Preview TTS | 100 | 1,000,000 | * | * |
| תמונה של בננה שנוצרה באמצעות Gemini 2.5 Flash 🍌 | 5,000 | 5,000,000 | * | * |
| גרסת טרום-השקה (Preview) של Gemini 2.0 Flash ליצירת תמונות | 5,000 | 5,000,000 | * | * |
| Imagen 4 Standard/Fast | 20 | * | 15,000 | * |
| Imagen 4 Ultra | 15 | * | 5,000 | * |
| Imagen 3 | 20 | * | * | * |
| Veo 3.1 | 10 | * | 500 | * |
| Veo 3.1 Fast | 10 | * | 500 | * |
| Veo 3 | 10 | * | 500 | * |
| Veo 3 Fast | 10 | * | 500 | * |
| Veo 2 | 2 | * | 50 | * |
| מודלים אחרים | ||||
| Gemma 3 ו-Gemma 3n | 30 | 15,000 | 14,400 | * |
| Gemini Embedding | 10,000 | 10,000,000 | * | * |
| Gemini Robotics-ER 1.5 Preview | 600 | 8,000,000 | * | *1,000,000,000* |
| גרסת טרום-השקה של Gemini 2.5 לשימוש במחשב | 2,000 | 8,000,000 | * | * |
| מודלים שהוצאו משימוש | ||||
| Gemini 1.5 Flash (יצא משימוש) | 2,000 | 4,000,000 | * | * |
| Gemini 1.5 Flash-8B (הוצא משימוש) | 4,000 | 4,000,000 | * | * |
| Gemini 1.5 Pro (יצא משימוש) | 1,000 | 4,000,000 | * | * |
המגבלות שצוינו על קצב הבקשות לא מובטחות, והקיבולת בפועל עשויה להשתנות.
מגבלות קצב ליצירת בקשות (Rate Limits) של Batch API
בקשות Batch API כפופות למגבלות קצב משלהן, בנפרד מקריאות API שלא מקובצות.
- בקשות באצווה במקביל: 100
- הגודל המקסימלי של קובץ הקלט: 2GB
- מגבלת אחסון הקבצים: 20GB
- אסימונים בתור לכל מודל: בעמודה Batch Enqueued Tokens בטבלת מגבלות הקצב מפורט המספר המקסימלי של אסימונים שאפשר להוסיף לתור לעיבוד באצווה בכל המשימות הפעילות לעיבוד באצווה עבור מודל נתון. אפשר לעיין בטבלת מגבלות הקצב הרגילות של API.
איך משדרגים לרמה הבאה
ב-Gemini API נעשה שימוש בחיוב ב-Cloud לכל שירותי החיוב. כדי לעבור מהתוכנית החינמית לתוכנית בתשלום, קודם צריך להפעיל את החיוב ב-Cloud בפרויקט Google Cloud.
אחרי שהפרויקט יעמוד בקריטריונים שצוינו, הוא יעמוד בדרישות לשדרוג לרמה הבאה. כדי לבקש שדרוג, פועלים לפי השלבים הבאים:
- עוברים אל הדף API keys ב-AI Studio.
- מאתרים את הפרויקט שרוצים לשדרג ולוחצים על 'שדרוג'. האפשרות 'שדרוג' תופיע רק בפרויקטים שעומדים בדרישות של הרמה הבאה.
אחרי אימות מהיר, הפרויקט ישודרג לרמה הבאה.
בקשה להגדלת מגבלת קצב הבקשות
לכל וריאציה של מודל יש מגבלת קצב משויכת (בקשות לדקה, RPM). פרטים על מגבלות הקצב האלה זמינים במאמר בנושא מודלים של Gemini.
בקשה להגדלת מגבלת קצב הבקשות בתוכנית בתשלום
אנחנו לא יכולים להבטיח שנרחיב את מכסת קצב הבקשות, אבל נעשה כמיטב יכולתנו כדי לבדוק את הבקשה.