מגבלות קצב קובעות את מספר הבקשות שאפשר לשלוח ל-Gemini API בפרק זמן נתון. ההגבלות האלה עוזרות לשמור על שימוש הוגן, להגן מפני ניצול לרעה ולשמור על ביצועי המערכת לכל המשתמשים.
איך רואים את מגבלות הקצב הפעילות ב-AI Studio
איך פועלות מגבלות הקצב
בדרך כלל מגבלות הקצב נמדדות בשלושה ממדים:
- בקשות לדקה (RPM)
- טוקנים לדקה (קלט) (TPM)
- בקשות ביום (RPD)
השימוש שלכם נבדק מול כל מגבלה, וחריגה מאחת מהן תגרום לשגיאה של הגבלת קצב. לדוגמה, אם מגבלת הבקשות לדקה היא 20, שליחת 21 בקשות בתוך דקה תגרום לשגיאה, גם אם לא חרגתם ממגבלת הטוקנים לדקה או ממגבלות אחרות.
הגבלות על קצב יצירת הבקשות חלות על כל פרויקט ולא על כל מפתח API. המכסות של בקשות ביום (RPD) מתאפסות בחצות, לפי שעון החוף המערבי של ארה"ב.
המגבלות משתנות בהתאם למודל הספציפי שבו משתמשים, וחלק מהמגבלות חלות רק על מודלים ספציפיים. לדוגמה, המדד 'תמונות לדקה' (IPM) מחושב רק עבור מודלים שיכולים ליצור תמונות (Nano Banana), אבל הוא דומה מבחינה רעיונית למדד 'אסימונים לדקה' (TPM). במודלים אחרים יכולה להיות מגבלה של טוקנים ליום (TPD).
מגבלות הקצב במודלים ניסיוניים ובגרסת טרום-השקה (Preview) הן מחמירות יותר.
רמות שימוש
הגבלות הקצב קשורות לרמת השימוש בפרויקט. ככל שהשימוש שלכם ב-API וההוצאות שלכם יגדלו, תוכלו לשדרג לדרגה גבוהה יותר עם מגבלות קצב גבוהות יותר.
הקריטריונים לרמות 2 ו-3 מבוססים על סך ההוצאות המצטברות על שירותי Google Cloud (כולל, בין היתר, Gemini API) בחשבון לחיוב שמקושר לפרויקט.
| שכבה | דרישות |
|---|---|
| חינם | משתמשים במדינות שבהן התכונה זמינה |
| שכבה 1 | חשבון לחיוב בתשלום מלא שמקושר לפרויקט |
| שכבה 2 | ההוצאה הכוללת: מעל 250$ ועברו לפחות 30 ימים מאז התשלום האחרון שבוצע בהצלחה |
| שכבה 3 | ההוצאה הכוללת: מעל 1,000$ ועברו לפחות 30 ימים מאז התשלום האחרון שבוצע בהצלחה |
כשאתם מבקשים לשדרג, מערכת ההגנה האוטומטית שלנו מפני ניצול לרעה מבצעת בדיקות נוספות. בדרך כלל, אם אתם עומדים בקריטריונים שצוינו, הבקשה שלכם תאושר. עם זאת, במקרים נדירים, יכול להיות שנאשר את הבקשה שלכם לשדרוג על סמך גורמים אחרים שזיהינו במהלך תהליך הבדיקה.
המערכת הזו עוזרת לשמור על האבטחה והיושרה של פלטפורמת Gemini API לכל המשתמשים.
מגבלות קצב ב-Gemini API
מגבלות הקצב תלויות במגוון גורמים (כמו רמת המכסה שלכם) ואפשר לראות אותן ב-Google AI Studio. ככל שהרמה והסטטוס של החשבון משתנים לאורך זמן, מגבלות הקצב מתעדכנות באופן אוטומטי.
איך רואים את מגבלות הקצב הפעילות ב-AI Studio
המגבלות על קצב הבקשות שצוינו לא מובטחות, והקיבולת בפועל עשויה להשתנות.
מגבלות קצב ליצירת בקשות (Rate Limits) של Batch API
בקשות Batch API כפופות למגבלות קצב משלהן, בנפרד מקריאות API שאינן מקובצות.
- בקשות באצווה במקביל: 100
- הגודל המקסימלי של קובץ הקלט: 2GB
- מגבלת אחסון הקבצים: 20GB
- אסימונים בתור לכל מודל: בטבלה Batch enqueued tokens מפורט המספר המקסימלי של אסימונים שאפשר להוסיף לתור לעיבוד באצווה בכל המשימות הפעילות לעיבוד באצווה של מודל נתון.
שכבה 1
| דגם | Batch enqueued tokens | |||
|---|---|---|---|---|
| מודלים של טקסט לטקסט | ||||
| Gemini 3 Pro Preview | 5,000,000 | |||
| Gemini 3 Flash Preview | 3,000,000 | |||
| Gemini 2.5 Pro | 5,000,000 | |||
| Gemini 2.5 Pro TTS | 25,000 | |||
| Gemini 2.5 Flash | 3,000,000 | |||
| גרסת טרום-השקה של Gemini 2.5 Flash | 3,000,000 | |||
| תצוגה מקדימה של תמונות ב-Gemini 2.5 Flash | 3,000,000 | |||
| Gemini 2.5 Flash TTS | 100,000 | |||
| Gemini 2.5 Flash-Lite | 10,000,000 | |||
| גרסת טרום-השקה (Preview) של Gemini 2.5 Flash-Lite | 10,000,000 | |||
| Gemini 2.0 Flash | 10,000,000 | |||
| תמונה של Gemini 2.0 Flash | 3,000,000 | |||
| Gemini 2.0 Flash-Lite | 10,000,000 | |||
| מודלים גנרטיביים מרובי-מוֹדָלִים | ||||
| תצוגה מקדימה של תמונה ב-Gemini 3 Pro 🍌 | 2,000,000 | |||
שכבה 2
| דגם | Batch enqueued tokens | |||
|---|---|---|---|---|
| מודלים של טקסט לטקסט | ||||
| Gemini 3 Pro Preview | 500,000,000 | |||
| Gemini 3 Flash Preview | 400,000,000 | |||
| Gemini 2.5 Pro | 500,000,000 | |||
| Gemini 2.5 Pro TTS | 100,000 | |||
| Gemini 2.5 Flash | 400,000,000 | |||
| גרסת טרום-השקה של Gemini 2.5 Flash | 400,000,000 | |||
| תצוגה מקדימה של תמונות ב-Gemini 2.5 Flash | 400,000,000 | |||
| Gemini 2.5 Flash TTS | 100,000 | |||
| Gemini 2.5 Flash-Lite | 500,000,000 | |||
| גרסת טרום-השקה (Preview) של Gemini 2.5 Flash-Lite | 500,000,000 | |||
| Gemini 2.0 Flash | 1,000,000,000 | |||
| תמונה של Gemini 2.0 Flash | 400,000,000 | |||
| Gemini 2.0 Flash-Lite | 1,000,000,000 | |||
| מודלים גנרטיביים מרובי-מוֹדָלִים | ||||
| תצוגה מקדימה של תמונה ב-Gemini 3 Pro 🍌 | 270,000,000 | |||
שכבה 3
| דגם | Batch enqueued tokens | |||
|---|---|---|---|---|
| מודלים של טקסט לטקסט | ||||
| Gemini 3 Pro Preview | 1,000,000,000 | |||
| Gemini 3 Flash Preview | 1,000,000,000 | |||
| Gemini 2.5 Pro | 1,000,000,000 | |||
| Gemini 2.5 Pro TTS | 1,000,000 | |||
| Gemini 2.5 Flash | 1,000,000,000 | |||
| גרסת טרום-השקה של Gemini 2.5 Flash | 1,000,000,000 | |||
| תצוגה מקדימה של תמונות ב-Gemini 2.5 Flash | 1,000,000,000 | |||
| Gemini 2.5 Flash TTS | 4,000,000 | |||
| Gemini 2.5 Flash-Lite | 1,000,000,000 | |||
| גרסת טרום-השקה (Preview) של Gemini 2.5 Flash-Lite | 1,000,000,000 | |||
| Gemini 2.0 Flash | 5,000,000,000 | |||
| תמונה של Gemini 2.0 Flash | 1,000,000,000 | |||
| Gemini 2.0 Flash-Lite | 5,000,000,000 | |||
| מודלים גנרטיביים מרובי-מוֹדָלִים | ||||
| תצוגה מקדימה של תמונה ב-Gemini 3 Pro 🍌 | 1,000,000,000 | |||
איך משדרגים לרמה הבאה
ב-Gemini API נעשה שימוש בחיוב ב-Cloud לכל שירותי החיוב. כדי לעבור מהתוכנית החינמית לתוכנית בתשלום, קודם צריך להפעיל את החיוב ב-Cloud בפרויקט Google Cloud.
אחרי שהפרויקט שלכם יעמוד בקריטריונים שצוינו, הוא יעמוד בדרישות לשדרוג לרמה הבאה. כדי לבקש שדרוג, פועלים לפי השלבים הבאים:
- עוברים אל הדף API keys ב-AI Studio.
- מאתרים את הפרויקט שרוצים לשדרג ולוחצים על 'שדרוג'. האפשרות 'שדרוג' תופיע רק בפרויקטים שעומדים בדרישות של הרמה הבאה.
אחרי אימות מהיר, הפרויקט ישודרג לרמה הבאה.
בקשה להגדלת מגבלת קצב הבקשות
לכל וריאציה של מודל יש מגבלת קצב משויכת (בקשות לדקה, RPM). פרטים על מגבלות הקצב האלה זמינים במאמר בנושא מודלים של Gemini.
בקשה להגדלת מגבלת קצב הבקשות בתוכנית בתשלום
אנחנו לא יכולים להבטיח שנרחיב את מכסת קצב הבקשות, אבל נעשה כמיטב יכולתנו כדי לבדוק את הבקשה.