הגבלות קצב של יצירת בקשות

הגבלות על קצב יצירת הבקשות קובעות את מספר הבקשות שאפשר לשלוח ל-Gemini API בפרק זמן נתון. ההגבלות האלה עוזרות לשמור על שימוש הוגן, להגן מפני ניצול לרעה ולשמור על ביצועי המערכת לכל המשתמשים.

הצגת מגבלות התעריפים הפעילות ב-AI Studio

איך פועלות מגבלות הקצב

מגבלות הקצב נמדדות בדרך כלל לפי שלושה מאפיינים:

  • בקשות לדקה (RPM)
  • טוקנים לדקה (קלט) (TPM)
  • בקשות ביום (RPD)

השימוש שלכם נבדק מול כל מגבלה, וחריגה מאחת מהן תגרום לשגיאה של הגבלת קצב. לדוגמה, אם מגבלת הבקשות לדקה היא 20, שליחת 21 בקשות בתוך דקה תוביל לשגיאה, גם אם לא חרגתם ממגבלת הטוקנים לדקה או ממגבלות אחרות.

הגבלות על קצב יצירת הבקשות חלות על כל פרויקט ולא על כל מפתח API.

המכסות של בקשות ביום (RPD) מתאפסות בחצות, לפי שעון החוף המערבי של ארה"ב.

המגבלות משתנות בהתאם למודל הספציפי שבו משתמשים, וחלק מהמגבלות חלות רק על מודלים ספציפיים. לדוגמה, תמונות לדקה (IPM) מחושבות רק עבור מודלים שיכולים ליצור תמונות (Imagen 3), אבל הן דומות מבחינה רעיונית לטוקנים לדקה (TPM). במודלים אחרים יכולה להיות מגבלה של טוקנים ליום (TPD).

מגבלות הקצב במודלים ניסיוניים ובמודלים בגרסת טרום-השקה (Preview) הן מחמירות יותר.

רמות שימוש

הגבלות הקצב קשורות לרמת השימוש בפרויקט. ככל שהשימוש ב-API וההוצאות גדלים, יש אפשרות לשדרג לרמה גבוהה יותר עם מגבלות קצב גבוהות יותר.

הקריטריונים לרמות 2 ו-3 מבוססים על סך ההוצאות המצטברות על שירותי Google Cloud (כולל, בין היתר, Gemini API) בחשבון לחיוב שמקושר לפרויקט.

שכבה דרישות
חינם משתמשים במדינות שבהן התכונה זמינה
שכבה 1 החשבון לחיוב שמקושר לפרויקט
שכבה 2 ההוצאה הכוללת: מעל 250$ ועברו לפחות 30 ימים מאז התשלום האחרון שבוצע בהצלחה
שכבה 3 ההוצאה הכוללת: מעל 1,000$ ועברו לפחות 30 ימים מאז התשלום האחרון שבוצע בהצלחה

כשאתם מבקשים לשדרג את החשבון, מערכת ההגנה האוטומטית שלנו מפני ניצול לרעה מבצעת בדיקות נוספות. בדרך כלל, אם אתם עומדים בקריטריונים שצוינו, הבקשה שלכם תאושר. עם זאת, במקרים נדירים, יכול להיות שנאשר את הבקשה שלכם לשדרוג על סמך גורמים אחרים שזיהינו במהלך תהליך הבדיקה.

המערכת הזו עוזרת לשמור על האבטחה והיושרה של פלטפורמת Gemini API לכל המשתמשים.

מגבלות קצב סטנדרטיות של בקשות API

בטבלה הבאה מפורטות מגבלות הקצב של כל הקריאות הרגילות ל-Gemini API.

תוכנית ללא תשלום

דגם הכנסה לאלף צפיות (RPM) TPM RPD
מודלים של טקסט לטקסט
Gemini ‎2.5 Pro 2 ‫125,000 50
Gemini ‎2.5 Flash 10 250,000 250
גרסת טרום-השקה של Gemini 2.5 Flash 10 250,000 250
‫Gemini ‎2.5 Flash-Lite 15 250,000 1,000
גרסת טרום-השקה (Preview) של Gemini 2.5 Flash-Lite 15 250,000 1,000
Gemini ‎2.0 Flash 15 1,000,000 200
Gemini 2.0 Flash-Lite 30 1,000,000 200
Live API
‫Gemini ‎2.5 Flash Live * 1,000,000 *
גרסת טרום-השקה (Preview) של Gemini 2.5 Flash עם אודיו מקורי * 500,000 *
‫Gemini 2.0 Flash Live * 1,000,000 *
מודלים גנרטיביים מרובי-מוֹדָלִים
‫Gemini 2.5 Flash Preview TTS 3 10,000 15
גרסת טרום-השקה (Preview) של Gemini 2.0 Flash ליצירת תמונות 10 200,000 100
מודלים אחרים
‫Gemma 3 ו-Gemma 3n 30 15,000 14,400
Gemini Embedding 100 30,000 1,000
‫Gemini Robotics-ER 1.5 Preview 10 250,000 250
מודלים שהוצאו משימוש
‫Gemini 1.5 Flash (יצא משימוש) 15 250,000 50
‫Gemini 1.5 Flash-8B (הוצא משימוש) 15 250,000 50

שכבה 1

דגם הכנסה לאלף צפיות (RPM) TPM RPD טוקנים שהוכנסו לתור באצווה
מודלים של טקסט לטקסט
‫Gemini 3 Pro Preview 50 1,000,000 1,000 ‫50,000,000
Gemini ‎2.5 Pro 150 ‫2,000,000 10,000 5,000,000
Gemini ‎2.5 Flash 1,000 1,000,000 10,000 ‫3,000,000
גרסת טרום-השקה של Gemini 2.5 Flash 1,000 1,000,000 10,000 ‫3,000,000
‫Gemini ‎2.5 Flash-Lite 4,000 4,000,000 * ‫10,000,000
גרסת טרום-השקה (Preview) של Gemini 2.5 Flash-Lite 4,000 4,000,000 * ‫10,000,000
Gemini ‎2.0 Flash 2,000 4,000,000 * ‫10,000,000
Gemini 2.0 Flash-Lite 4,000 4,000,000 * ‫10,000,000
Live API
‫Gemini ‎2.5 Flash Live ‫50 ביקורים 4,000,000 * *
גרסת טרום-השקה (Preview) של Gemini 2.5 Flash עם אודיו מקורי * 1,000,000 * *
‫Gemini 2.0 Flash Live ‫50 ביקורים 4,000,000 * *
מודלים גנרטיביים מרובי-מוֹדָלִים
‫Gemini 2.5 Flash Preview TTS 10 10,000 100 *
‫Gemini 2.5 Pro Preview TTS 10 10,000 50 *
תמונה של בננה שנוצרה באמצעות Gemini ‎2.5 Flash 🍌 500 500,000 2,000 *
גרסת טרום-השקה (Preview) של Gemini 2.0 Flash ליצירת תמונות 1,000 1,000,000 10,000 *
‫Imagen 4 Standard/Fast 10 * 70 *
Imagen 4 Ultra 5 * 30 *
Imagen 3 20 * * *
Veo 3.1 2 * 10 *
Veo 3.1 Fast 2 * 10 *
Veo 3 2 * 10 *
Veo 3 Fast 2 * 10 *
Veo 2 2 * 50 *
מודלים אחרים
‫Gemma 3 ו-Gemma 3n 30 15,000 14,400 *
Gemini Embedding 3,000 1,000,000 * *
‫Gemini Robotics-ER 1.5 Preview 300 1,000,000 10,000 *
גרסת טרום-השקה של Gemini 2.5 לשימוש במחשב 150 ‫2,000,000 10,000 *
מודלים שהוצאו משימוש
‫Gemini 1.5 Flash (יצא משימוש) 2,000 4,000,000 * *
‫Gemini 1.5 Flash-8B (הוצא משימוש) 4,000 4,000,000 * *
‫Gemini 1.5 Pro (יצא משימוש) 1,000 4,000,000 * *

שכבה 2

דגם הכנסה לאלף צפיות (RPM) TPM RPD טוקנים שהוכנסו לתור באצווה
מודלים של טקסט לטקסט
‫Gemini 3 Pro Preview 1,000 5,000,000 50,000 ‫500,000,000
Gemini ‎2.5 Pro 1,000 5,000,000 50,000 ‫500,000,000
Gemini ‎2.5 Flash 2,000 ‫3,000,000 100,000 ‫400,000,000
גרסת טרום-השקה של Gemini 2.5 Flash 2,000 ‫3,000,000 100,000 ‫400,000,000
‫Gemini ‎2.5 Flash-Lite 10,000 ‫10,000,000 * ‫500,000,000
גרסת טרום-השקה (Preview) של Gemini 2.5 Flash-Lite 10,000 ‫10,000,000 * ‫500,000,000
Gemini ‎2.0 Flash 10,000 ‫10,000,000 * 1,000,000,000
Gemini 2.0 Flash-Lite 20,000 ‫10,000,000 * 1,000,000,000
Live API
‫Gemini ‎2.5 Flash Live 1,000 ביקורים ‫10,000,000 * *
גרסת טרום-השקה (Preview) של Gemini 2.5 Flash עם אודיו מקורי * ‫10,000,000 * *
‫Gemini 2.0 Flash Live 1,000 ביקורים ‫10,000,000 * *
מודלים גנרטיביים מרובי-מוֹדָלִים
‫Gemini 2.5 Flash Preview TTS 1,000 100,000 10,000 *
‫Gemini 2.5 Pro Preview TTS 100 25,000 1,000 *
תמונה של בננה שנוצרה באמצעות Gemini ‎2.5 Flash 🍌 2,000 1,500,000 50,000 *
גרסת טרום-השקה (Preview) של Gemini 2.0 Flash ליצירת תמונות 2,000 ‫3,000,000 100,000 *
‫Imagen 4 Standard/Fast 15 * 1000 *
Imagen 4 Ultra 10 * 400 *
Imagen 3 20 * * *
Veo 3.1 4 * 50 *
Veo 3.1 Fast 4 * 50 *
Veo 3 4 * 50 *
Veo 3 Fast 4 * 50 *
Veo 2 2 * 50 *
מודלים אחרים
‫Gemma 3 ו-Gemma 3n 30 15,000 14,400 *
Gemini Embedding 5,000 5,000,000 * *
‫Gemini Robotics-ER 1.5 Preview 400 ‫3,000,000 100,000 *
גרסת טרום-השקה של Gemini 2.5 לשימוש במחשב 1,000 5,000,000 50,000 *
מודלים שהוצאו משימוש
‫Gemini 1.5 Flash (יצא משימוש) 2,000 4,000,000 * *
‫Gemini 1.5 Flash-8B (הוצא משימוש) 4,000 4,000,000 * *
‫Gemini 1.5 Pro (יצא משימוש) 1,000 4,000,000 * *

שכבה 3

דגם הכנסה לאלף צפיות (RPM) TPM RPD טוקנים שהוכנסו לתור באצווה
מודלים של טקסט לטקסט
‫Gemini 3 Pro Preview 2,000 ‫8,000,000 * 1,000,000,000
Gemini ‎2.5 Pro 2,000 ‫8,000,000 * 1,000,000,000
Gemini ‎2.5 Flash 10,000 ‫8,000,000 * 1,000,000,000
גרסת טרום-השקה של Gemini 2.5 Flash 10,000 ‫8,000,000 * 1,000,000,000
‫Gemini ‎2.5 Flash-Lite 30,000 30,000,000 * 1,000,000,000
גרסת טרום-השקה (Preview) של Gemini 2.5 Flash-Lite 30,000 30,000,000 * 1,000,000,000
Gemini ‎2.0 Flash 30,000 30,000,000 * ‫5,000,000,000
Gemini 2.0 Flash-Lite 30,000 30,000,000 * ‫5,000,000,000
Live API
‫Gemini ‎2.5 Flash Live 1,000 ביקורים ‫10,000,000 * *
גרסת טרום-השקה (Preview) של Gemini 2.5 Flash עם אודיו מקורי * ‫10,000,000 * *
‫Gemini 2.0 Flash Live 1,000 ביקורים ‫10,000,000 * *
מודלים גנרטיביים מרובי-מוֹדָלִים
‫Gemini 2.5 Flash Preview TTS 1,000 1,000,000 * *
‫Gemini 2.5 Pro Preview TTS 100 1,000,000 * *
תמונה של בננה שנוצרה באמצעות Gemini ‎2.5 Flash 🍌 5,000 5,000,000 * *
גרסת טרום-השקה (Preview) של Gemini 2.0 Flash ליצירת תמונות 5,000 5,000,000 * *
‫Imagen 4 Standard/Fast 20 * 15,000 *
Imagen 4 Ultra 15 * 5,000 *
Imagen 3 20 * * *
Veo 3.1 10 * 500 *
Veo 3.1 Fast 10 * 500 *
Veo 3 10 * 500 *
Veo 3 Fast 10 * 500 *
Veo 2 2 * 50 *
מודלים אחרים
‫Gemma 3 ו-Gemma 3n 30 15,000 14,400 *
Gemini Embedding 10,000 ‫10,000,000 * *
‫Gemini Robotics-ER 1.5 Preview 600 ‫8,000,000 * ‫*1,000,000,000*
גרסת טרום-השקה של Gemini 2.5 לשימוש במחשב 2,000 ‫8,000,000 * *
מודלים שהוצאו משימוש
‫Gemini 1.5 Flash (יצא משימוש) 2,000 4,000,000 * *
‫Gemini 1.5 Flash-8B (הוצא משימוש) 4,000 4,000,000 * *
‫Gemini 1.5 Pro (יצא משימוש) 1,000 4,000,000 * *

המגבלות שצוינו על קצב הבקשות לא מובטחות, והקיבולת בפועל עשויה להשתנות.

מגבלות קצב ליצירת בקשות (Rate Limits) של Batch API

בקשות Batch API כפופות למגבלות קצב משלהן, בנפרד מקריאות API שלא מקובצות.

  • בקשות באצווה במקביל: 100
  • הגודל המקסימלי של קובץ הקלט: 2GB
  • מגבלת אחסון הקבצים: 20GB
  • אסימונים בתור לכל מודל: בעמודה Batch Enqueued Tokens בטבלת מגבלות הקצב מפורט המספר המקסימלי של אסימונים שאפשר להוסיף לתור לעיבוד באצווה בכל המשימות הפעילות לעיבוד באצווה עבור מודל נתון. אפשר לעיין בטבלת מגבלות הקצב הרגילות של API.

איך משדרגים לרמה הבאה

ב-Gemini API נעשה שימוש בחיוב ב-Cloud לכל שירותי החיוב. כדי לעבור מהתוכנית החינמית לתוכנית בתשלום, קודם צריך להפעיל את החיוב ב-Cloud בפרויקט Google Cloud.

אחרי שהפרויקט יעמוד בקריטריונים שצוינו, הוא יעמוד בדרישות לשדרוג לרמה הבאה. כדי לבקש שדרוג, פועלים לפי השלבים הבאים:

אחרי אימות מהיר, הפרויקט ישודרג לרמה הבאה.

בקשה להגדלת מגבלת קצב הבקשות

לכל וריאציה של מודל יש מגבלת קצב משויכת (בקשות לדקה, RPM). פרטים על מגבלות הקצב האלה זמינים במאמר בנושא מודלים של Gemini.

בקשה להגדלת מגבלת קצב הבקשות בתוכנית בתשלום

אנחנו לא יכולים להבטיח שנרחיב את מכסת קצב הבקשות, אבל נעשה כמיטב יכולתנו כדי לבדוק את הבקשה.