מגבלות הקצב קובעות את מספר הבקשות שאפשר לשלוח ל-Gemini API בזמן נתון. ההגבלות האלה עוזרות להבטיח שימוש הוגן, להגן מפני ניצול לרעה ולשמור על ביצועי המערכת לכל המשתמשים.
איך פועלות מגבלות הקצב
הגבלות הקצב נמדדות בשלושה מאפיינים:
- בקשות לדקה (RPM)
- בקשות ביום (RPD)
- טוקנים לדקה (TPM)
השימוש שלכם נבדק כנגד כל אחת מהמגבלות, חריגה מכל אחת מהן תגרום לשגיאה של הגבלת קצב שליחת הבקשות. לדוגמה, אם המגבלה שלכם היא 20 בקשות לשעה, שליחת 21 בקשות בדקה תגרום לשגיאה, גם אם לא חרגתם ממגבלת הבקשות לשעה או ממגבלות אחרות.
מגבלות הקצב חלות לכל פרויקט, ולא לכל מפתח API.
המגבלות משתנות בהתאם לדגם הספציפי שבו נעשה שימוש, וחלק מהמגבלות חלות רק על דגמים ספציפיים. לדוגמה, הנתון 'תמונות לדקה' (IPM) מחושב רק לגבי מודלים שיכולים ליצור תמונות (תמונה 3), אבל הוא דומה מבחינה מושגית ל-TPM.
רמות שימוש
מגבלות הקצב קשורות לרמת השימוש בפרויקטים (שאנחנו נשיק בקרוב). ככל שהשימוש ב-API וההוצאות יגברו, תוכלו לשדרג לרמה גבוהה יותר עם מגבלות קצב גבוהות יותר.
שכבה | דרישות |
---|---|
חינם | משתמשים במדינות שעומדות בדרישות |
שכבה 1 | החשבון לחיוב המקושר לפרויקט |
שכבה 2 | סה"כ הוצאות: 250$ + לפחות 30 יום מאז התשלום המוצלח |
שכבה 3 | עדיין לא זמין, בקרוב. |
כששולחים בקשה לשדרוג, מערכת ההגנה האוטומטית שלנו מפני ניצול לרעה מבצעת בדיקות נוספות. בדרך כלל, עמידה בקריטריונים המפורטים מספיקה לאישור, אבל במקרים נדירים יכול להיות שנדחה בקשת שדרוג על סמך גורמים אחרים שזוהו במהלך תהליך הבדיקה.
המערכת הזו עוזרת להבטיח את האבטחה והשלמות של פלטפורמת Gemini API לכל המשתמשים.
הגבלות הקצב הנוכחיות
דגם | הכנסה לאלף צפיות (RPM) | TPM | RPD |
---|---|---|---|
Gemini 2.0 Flash | 15 | 1,000,000 | 1,500 |
Gemini 2.0 Flash Experimental | 10 | 1,000,000 | 1,500 |
Gemini 2.0 Flash-Lite | 30 | 1,000,000 | 1,500 |
Gemini 2.0 Pro Experimental 02-05 | 2 | 1,000,000 | 50 |
Gemini 2.0 Flash Thinking Experimental 01-21 | 10 | 4,000,000 | 1,500 |
Gemini 1.5 Flash | 15 | 1,000,000 | 1,500 |
Gemini 1.5 Flash-8B | 15 | 1,000,000 | 1,500 |
Gemini 1.5 Pro | 2 | 32,000 | 50 |
Imagen 3 | -- | -- | -- |
Gemma 3 | 30 | 15,000 | 14,400 |
Gemini Embedding Experimental 03-07 | 5 | -- | 100 |
דגם | הכנסה לאלף צפיות (RPM) | TPM | RPD |
---|---|---|---|
Gemini 2.0 Flash | 2,000 | 4,000,000 | -- |
Gemini 2.0 Flash Experimental | 10 | 4,000,000 | -- |
Gemini 2.0 Flash-Lite | 4,000 | 4,000,000 | -- |
Gemini 2.0 Pro Experimental 02-05 | 5 | 1,000,000 | -- |
Gemini 2.0 Flash Thinking Experimental 01-21 | 10 | 4,000,000 | -- |
Gemini 1.5 Flash | 2,000 | 4,000,000 | -- |
Gemini 1.5 Flash-8B | 4,000 | 4,000,000 | -- |
Gemini 1.5 Pro | 1,000 | 4,000,000 | -- |
Imagen 3 | -- | 20 תמונות לדקה (IPM) | -- |
Gemma 3 | -- | -- | -- |
Gemini Embedding Experimental 03-07 | 10 | -- | 1,000 |
דגם | הכנסה לאלף צפיות (RPM) | TPM | RPD |
---|---|---|---|
Gemini 2.0 Flash | 10,000 | 10,000,000 | -- |
Gemini 2.0 Flash-Lite | 4,000 | 4,000,000 | -- |
Gemini 2.0 Pro Experimental 02-05 | 5 | 1,000,000 | -- |
Gemini 2.0 Flash Thinking Experimental 01-21 | 10 | 4,000,000 | -- |
Gemini 1.5 Flash | 2,000 | 4,000,000 | -- |
Gemini 1.5 Flash-8B | 4,000 | 4,000,000 | -- |
Gemini 1.5 Pro | 1,000 | 4,000,000 | -- |
Imagen 3 | -- | 20 תמונות לדקה (IPM) | -- |
Gemini Embedding Experimental 03-07 | 10 | -- | 1,000 |
מגבלות הקצב שצוינו לא מובטחות, והקיבולת בפועל עשויה להשתנות.
איך משדרגים לרמה הבאה
ב-Gemini API נעשה שימוש בחיוב ב-Cloud לכל שירותי החיוב. כדי לעבור מרמה ללא תשלום לרמה בתשלום, צריך קודם להפעיל את החיוב ב-Cloud בפרויקט ב-Google Cloud.
ברגע שהפרויקט עומד בקריטריונים שצוינו, הוא עומד בדרישות לשדרוג לרמה הבאה. כדי לבקש שדרוג, פועלים לפי השלבים הבאים:
- עוברים אל דף מפתחות ה-API ב-AI Studio.
- מאתרים את הפרויקט שרוצים לשדרג ולוחצים על 'שדרוג'. האפשרות 'שדרוג' תוצג רק לפרויקטים שעומדים בדרישות לקבלת רמה גבוהה יותר.
לאחר אימות מהיר, הפרויקט ישודרג לרמה הבאה.
בקשה להגדלת מגבלת הקצב
לכל וריאנט של מודל יש מגבלת קצב משויך (בקשות לדקה, הכנסה לאלף חשיפות). פרטים על מגבלות הקצב האלה זמינים במאמר מודלים של Gemini.
איך מגישים בקשה להגדלת מגבלת הקצב ברמות בתשלום
אנחנו לא מתחייבים להגדיל את המגבלה על קצב שליחת הבקשות, אבל נעשה כמיטב יכולתנו כדי לבדוק את הבקשה שלך ונודיע לך אם נוכל לענות על הצרכים שלך מבחינת קיבולת.