הגבלות קצב של יצירת בקשות

מגבלות הקצב קובעות את מספר הבקשות שאפשר לשלוח ל-Gemini API בזמן נתון. ההגבלות האלה עוזרות להבטיח שימוש הוגן, להגן מפני ניצול לרעה ולשמור על ביצועי המערכת לכל המשתמשים.

איך פועלות מגבלות הקצב

מגבלות הקצב נמדדות לפי ארבעה מאפיינים:

  • בקשות לדקה (RPM)
  • בקשות ביום (RPD)
  • טוקנים לדקה (TPM)
  • טוקנים ליום (TPD)

השימוש שלכם נבדק כנגד כל אחת מהמגבלות, חריגה מכל אחת מהן תגרום לשגיאה של הגבלת קצב שליחת הבקשות. לדוגמה, אם המגבלה של בקשות לשעה היא 20, שליחת 21 בקשות בדקה תוביל לשגיאה, גם אם לא חרגתם ממגבלת הבקשות לשעה או ממגבלות אחרות.

מגבלות הקצב חלות לכל פרויקט, ולא לכל מפתח API.

המגבלות משתנות בהתאם לדגם הספציפי שבו נעשה שימוש, וחלק מהמגבלות חלות רק על דגמים ספציפיים. לדוגמה, מספר התמונות לדקה (IPM) מחושב רק למודלים שיכולים ליצור תמונות (Imagen 3), אבל הוא דומה מבחינה מושגית למספר הבקשות לדקה (TPM).

המגבלות על קצב שליחת הבקשות מחמירות יותר במודלים ניסיוניים ובמודלים בתצוגה מקדימה.

רמות שימוש

מגבלות הקצב של יצירת הבקשות מקושרות לרמת השימוש בפרויקט. ככל שהשימוש ב-API וההוצאות שלכם יגברו, תוכלו לשדרג לרמה גבוהה יותר עם מגבלות קצב גבוהות יותר.

שכבה דרישות
חינם משתמשים במדינות שעומדות בדרישות
שכבה 1 החשבון לחיוב המקושר לפרויקט
שכבה 2 סה"כ הוצאות: 250$ + לפחות 30 יום מאז התשלום המוצלח
שכבה 3 סה"כ הוצאות: 1,000$ + לפחות 30 ימים מאז התשלום המוצלח

כששולחים בקשה לשדרוג, מערכת ההגנה האוטומטית שלנו מפני ניצול לרעה מבצעת בדיקות נוספות. בדרך כלל, עמידה בקריטריונים המפורטים מספיקה לאישור, אבל במקרים נדירים יכול להיות שנדחה בקשת שדרוג על סמך גורמים אחרים שזוהו במהלך תהליך הבדיקה.

המערכת הזו עוזרת להבטיח את האבטחה והשלמות של פלטפורמת Gemini API לכל המשתמשים.

הגבלות הקצב הנוכחיות

דגם הכנסה לאלף צפיות (RPM) TPM RPD
תצוגה מקדימה של Flash ב-Gemini 2.5 04-17 10 250,000 500
Gemini 2.5 Pro Experimental 03-25 5 250,000 TPM
1,000,000 TPD
25
Gemini 2.5 Pro Preview 03-25 -- -- --
Gemini 2.0 Flash 15 1,000,000 1,500
ניסוי Flash ב-Gemini 2.0 (כולל יצירת תמונה) 10 1,000,000 1,500
Gemini 2.0 Flash-Lite 30 1,000,000 1,500
Gemini 1.5 Flash 15 1,000,000 1,500
Gemini 1.5 Flash-8B 15 1,000,000 1,500
Gemini 1.5 Pro 2 32,000 50
Veo 2 -- -- --
Imagen 3 -- -- --
Gemma 3 30 15,000 14,400
Gemini Embedding Experimental 03-07 5 -- 100
דגם הכנסה לאלף צפיות (RPM) TPM RPD
תצוגה מקדימה של Flash ב-Gemini 2.5 04-17 1,000 1,000,000 10,000
Gemini 2.5 Pro Preview 03-25 150 2,000,000 1,000
Gemini 2.5 Pro Experimental 03-25 -- -- --
Gemini 2.0 Flash 2,000 4,000,000 --
ניסוי Flash ב-Gemini 2.0 (כולל יצירת תמונה) 10 4,000,000 --
Gemini 2.0 Flash-Lite 4,000 4,000,000 --
Gemini 1.5 Flash 2,000 4,000,000 --
Gemini 1.5 Flash-8B 4,000 4,000,000 --
Gemini 1.5 Pro 1,000 4,000,000 --
Imagen 3 -- 20 תמונות לדקה (IPM) --
Veo 2 2 סרטונים לדקה (VPM) -- 50 סרטונים ביום (VPD)
Gemma 3 30 15,000 14,400
Gemini Embedding Experimental 03-07 10 -- 1,000
דגם הכנסה לאלף צפיות (RPM) TPM RPD
תצוגה מקדימה של Flash ב-Gemini 2.5 04-17 2,000 3,000,000 100,000
Gemini 2.5 Pro Experimental 03-25 -- -- --
Gemini 2.5 Pro Preview 03-25 1,000 5,000,000 50,000
Gemini 2.0 Flash 10,000 10,000,000 --
ניסוי Flash ב-Gemini 2.0 (כולל יצירת תמונה) 10 4,000,000 --
Gemini 2.0 Flash-Lite 20,000 10,000,000 --
Gemini 1.5 Flash 2,000 4,000,000 --
Gemini 1.5 Flash-8B 4,000 4,000,000 --
Gemini 1.5 Pro 1,000 4,000,000 --
Imagen 3 -- 20 תמונות לדקה (IPM) --
Veo 2 -- -- --
Gemma 3 30 15,000 14,400
Gemini Embedding Experimental 03-07 10 -- 1,000
דגם הכנסה לאלף צפיות (RPM) TPM RPD
תצוגה מקדימה של Flash ב-Gemini 2.5 04-17 10,000 8,000,000 --
Gemini 2.5 Pro Preview 03-25 2,000 8,000,000 --
Gemini 2.0 Flash 30,000 30,000,000 --
Gemini 2.0 Flash-Lite 30,000 30,000,000 --

המגבלות על קצב שליחת הבקשות שצוינו לא מובטחות, והקיבולת בפועל עשויה להשתנות.

מגבלות קצב ליצירת בקשות של ממשק API בזמן אמת

מספר הסשנים בו-זמנית TPM
3 1,000,000
מספר הסשנים בו-זמנית TPM
50 4,000,000
מספר הסשנים בו-זמנית TPM
1000 10,000,000
מספר הסשנים בו-זמנית TPM
לא זמין עדיין לא זמין עדיין

המגבלות על קצב שליחת הבקשות שצוינו לא מובטחות, והקיבולת בפועל עשויה להשתנות.

איך משדרגים לרמה הבאה

ב-Gemini API נעשה שימוש בחיוב ב-Cloud לכל שירותי החיוב. כדי לעבור מרמה ללא תשלום לרמה בתשלום, צריך קודם להפעיל את החיוב ב-Cloud בפרויקט ב-Google Cloud.

ברגע שהפרויקט עומד בקריטריונים שצוינו, הוא עומד בדרישות לשדרוג לרמה הבאה. כדי לבקש שדרוג, פועלים לפי השלבים הבאים:

לאחר אימות מהיר, הפרויקט ישודרג לרמה הבאה.

בקשה להגדלת מגבלת הקצב

לכל וריאנט של מודל יש מגבלת קצב משויך (בקשות לדקה, הכנסה לאלף חשיפות). פרטים על מגבלות הקצב האלה זמינים במאמר מודלים של Gemini.

איך מגישים בקשה להגדלת מגבלת הקצב ברמות בתשלום

אנחנו לא מתחייבים להגדיל את המגבלה על קצב שליחת הבקשות, אבל נעשה כמיטב יכולתנו כדי לבדוק את הבקשה שלך ונודיע לך אם נוכל לענות על הצרכים שלך מבחינת קיבולת.