הגבלות על קצב שליחת בקשות מווסתות את מספר הבקשות שאפשר לשלוח ל-Gemini API בפרק זמן נתון. ההגבלות האלה עוזרות לנו לשמור על שימוש הוגן, להגן מפני ניצול לרעה ולשמור על ביצועי המערכת לכל המשתמשים.
איך פועלות מגבלות הקצב
מגבלות הקצב נמדדות בדרך כלל בשלושה ממדים:
- בקשות לדקה (RPM)
- בקשות ביום (RPD)
- טוקנים לדקה (קלט) (TPM)
השימוש שלכם נבדק מול כל מגבלה, וחריגה מאחת מהן תגרום לשגיאה של הגבלת קצב. לדוגמה, אם מגבלת הבקשות לדקה היא 20, שליחת 21 בקשות בתוך דקה תוביל לשגיאה, גם אם לא חרגתם ממגבלת הטוקנים לדקה או ממגבלות אחרות.
המגבלות על קצב יצירת הבקשות חלות על כל פרויקט ולא על כל מפתח API.
ההגבלות משתנות בהתאם למודל הספציפי שבו משתמשים, וחלק מההגבלות חלות רק על מודלים ספציפיים. לדוגמה, תמונות לדקה (IPM) מחושבות רק למודלים שיכולים ליצור תמונות (Imagen 3), אבל הן דומות מבחינה רעיונית לטוקנים לדקה (TPM). במודלים אחרים יכולה להיות מגבלה של טוקנים ליום (TPD).
מגבלות הקצב במודלים ניסיוניים ובמודלים בגרסת טרום-השקה הן מחמירות יותר.
רמות שימוש
הגבלות הקצב קשורות לרמת השימוש בפרויקט. ככל שהשימוש ב-API וההוצאות גדלים, יש לכם אפשרות לשדרג לדרגה גבוהה יותר עם מגבלות קצב גבוהות יותר.
הקריטריונים לרמות 2 ו-3 מבוססים על סך ההוצאות המצטברות על שירותי Google Cloud (כולל, בין היתר, Gemini API) בחשבון לחיוב שמקושר לפרויקט.
שכבה | דרישות |
---|---|
חינם | משתמשים במדינות שעומדות בדרישות |
שכבה 1 | החשבון לחיוב שמקושר לפרויקט |
שכבה 2 | ההוצאה הכוללת: מעל 250$ ועברו לפחות 30 ימים מאז התשלום האחרון שבוצע בהצלחה |
שכבה 3 | ההוצאה הכוללת: מעל 1,000$ ועברו לפחות 30 ימים מאז התשלום האחרון שבוצע בהצלחה |
כשמבקשים לשדרג, מערכת ההגנה האוטומטית שלנו מפני ניצול לרעה מבצעת בדיקות נוספות. לרוב, עמידה בקריטריונים שצוינו מספיקה לאישור, אבל במקרים נדירים יכול להיות שנאשר בקשת שדרוג על סמך גורמים אחרים שמזוהים במהלך תהליך הבדיקה.
המערכת הזו עוזרת לשמור על האבטחה והיושרה של פלטפורמת Gemini API לכל המשתמשים.
מגבלות קצב סטנדרטיות של בקשות API
בטבלה הבאה מפורטות מגבלות הקצב לכל הקריאות הרגילות ל-Gemini API.
תוכנית ללא תשלום
דגם | הכנסה לאלף צפיות (RPM) | TPM | RPD |
---|---|---|---|
מודלים של טקסט לטקסט | |||
Gemini 2.5 Pro | 5 | 250,000 | 100 |
Gemini 2.5 Flash | 10 | 250,000 | 250 |
Gemini 2.5 Flash-Lite Preview 06-17 | 15 | 250,000 | 1,000 |
Gemini 2.0 Flash | 15 | 1,000,000 | 200 |
Gemini 2.0 Flash-Lite | 30 | 1,000,000 | 200 |
Live API | |||
Gemini 2.5 Flash Live | 3 ביקורים | 1,000,000 | |
גרסת טרום-השקה (Preview) של תיבת דו-שיח מקורית של אודיו ב-Gemini 2.5 Flash | סשן אחד | 25,000 | 5 |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | סשן אחד | 10,000 | 5 |
Gemini 2.0 Flash Live | 3 ביקורים | 1,000,000 | |
מודלים גנרטיביים מרובי-מוֹדָלִים | |||
Gemini 2.5 Flash Preview TTS | 3 | 10,000 | 15 |
Gemini 2.5 Pro Preview TTS | |||
גרסת טרום-השקה (Preview) של Gemini 2.0 Flash ליצירת תמונות | 10 | 200,000 | 100 |
Imagen 3 | |||
Veo 2 | |||
מודלים אחרים | |||
Gemma 3 ו-3n | 30 | 15,000 | 14,400 |
Gemini Embedding | 100 | 30,000 | 1,000 |
מודלים שהוצאו משימוש | |||
Gemini 1.5 Flash (יצא משימוש) | 15 | 250,000 | 50 |
Gemini 1.5 Flash-8B (יצא משימוש) | 15 | 250,000 | 50 |
Gemini 1.5 Pro (יצא משימוש) |
שכבה 1
דגם | הכנסה לאלף צפיות (RPM) | TPM | RPD | טוקנים שהוכנסו לתור באצווה |
---|---|---|---|---|
מודלים של טקסט לטקסט | ||||
Gemini 2.5 Pro | 150 | 2,000,000 | 10,000 | 5,000,000 |
Gemini 2.5 Flash | 1,000 | 1,000,000 | 10,000 | 3,000,000 |
Gemini 2.5 Flash-Lite Preview 06-17 | 4,000 | 4,000,000 | ||
Gemini 2.0 Flash | 2,000 | 4,000,000 | 10,000,000 | |
Gemini 2.0 Flash-Lite | 4,000 | 4,000,000 | 10,000,000 | |
Live API | ||||
Gemini 2.5 Flash Live | 50 ביקורים | 4,000,000 | ||
גרסת טרום-השקה (Preview) של תיבת דו-שיח מקורית של אודיו ב-Gemini 2.5 Flash | 3 ביקורים | 50,000 | 50 | |
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | סשן אחד | 25,000 | 50 | |
Gemini 2.0 Flash Live | 50 ביקורים | 4,000,000 | ||
מודלים גנרטיביים מרובי-מוֹדָלִים | ||||
Gemini 2.5 Flash Preview TTS | 10 | 10,000 | 100 | |
Gemini 2.5 Pro Preview TTS | 10 | 10,000 | 50 | |
גרסת טרום-השקה (Preview) של Gemini 2.0 Flash ליצירת תמונות | 1,000 | 1,000,000 | 10,000 | |
Imagen 4 Standard | 10 | 70 | ||
Imagen 4 Ultra | 5 | 30 | ||
Imagen 3 | 20 | |||
Veo 3 | 2 | 10 | ||
Veo 2 | 2 | 50 | ||
מודלים אחרים | ||||
Gemma 3 ו-3n | 30 | 15,000 | 14,400 | |
Gemini Embedding | 3,000 | 1,000,000 | ||
מודלים שהוצאו משימוש | ||||
Gemini 1.5 Flash (יצא משימוש) | 2,000 | 4,000,000 | ||
Gemini 1.5 Flash-8B (יצא משימוש) | 4,000 | 4,000,000 | ||
Gemini 1.5 Pro (יצא משימוש) | 1,000 | 4,000,000 |
שכבה 2
דגם | הכנסה לאלף צפיות (RPM) | TPM | RPD | טוקנים שהוכנסו לתור באצווה |
---|---|---|---|---|
מודלים של טקסט לטקסט | ||||
Gemini 2.5 Pro | 1,000 | 5,000,000 | 50,000 | 500,000,000 |
Gemini 2.5 Flash | 2,000 | 3,000,000 | 100,000 | 400,000,000 |
Gemini 2.5 Flash-Lite Preview 06-17 | 10,000 | 10,000,000 | 100,000 | |
Gemini 2.0 Flash | 10,000 | 10,000,000 | 1,000,000,000 | |
Gemini 2.0 Flash-Lite | 20,000 | 10,000,000 | 1,000,000,000 | |
Live API | ||||
Gemini 2.5 Flash Live | 1,000 ביקורים | 10,000,000 | ||
גרסת טרום-השקה (Preview) של תיבת דו-שיח מקורית של אודיו ב-Gemini 2.5 Flash | 100 ביקורים | 1,000,000 | ||
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | סשן אחד | 25,000 | 50 | |
Gemini 2.0 Flash Live | 1,000 ביקורים | 10,000,000 | ||
מודלים גנרטיביים מרובי-מוֹדָלִים | ||||
Gemini 2.5 Flash Preview TTS | 1,000 | 100,000 | 10,000 | |
Gemini 2.5 Pro Preview TTS | 100 | 25,000 | 1,000 | |
גרסת טרום-השקה (Preview) של Gemini 2.0 Flash ליצירת תמונות | 2,000 | 3,000,000 | 100,000 | |
Imagen 4 Standard | 15 | 1000 | ||
Imagen 4 Ultra | 10 | 400 | ||
Imagen 3 | 20 | |||
Veo 3 | 4 | 50 | ||
Veo 2 | 2 | 50 | ||
מודלים אחרים | ||||
Gemma 3 ו-3n | 30 | 15,000 | 14,400 | |
Gemini Embedding | 5,000 | 5,000,000 | -- | -- |
מודלים שהוצאו משימוש | ||||
Gemini 1.5 Flash (יצא משימוש) | 2,000 | 4,000,000 | ||
Gemini 1.5 Flash-8B (יצא משימוש) | 4,000 | 4,000,000 | ||
Gemini 1.5 Pro (יצא משימוש) | 1,000 | 4,000,000 |
שכבה 3
דגם | הכנסה לאלף צפיות (RPM) | TPM | RPD | טוקנים שהוכנסו לתור באצווה |
---|---|---|---|---|
מודלים של טקסט לטקסט | ||||
Gemini 2.5 Pro | 2,000 | 8,000,000 | 1,000,000,000 | |
Gemini 2.5 Flash | 10,000 | 8,000,000 | 1,000,000,000 | |
Gemini 2.5 Flash-Lite Preview 06-17 | 30,000 | 30,000,000 | ||
Gemini 2.0 Flash | 30,000 | 30,000,000 | 5,000,000,000 | |
Gemini 2.0 Flash-Lite | 30,000 | 30,000,000 | 5,000,000,000 | |
Live API | ||||
Gemini 2.5 Flash Live | 1,000 ביקורים | 10,000,000 | ||
גרסת טרום-השקה (Preview) של תיבת דו-שיח מקורית של אודיו ב-Gemini 2.5 Flash | 100 ביקורים | 1,000,000 | ||
Gemini 2.5 Flash Experimental Native Audio Thinking Dialog | סשן אחד | 25,000 | 50 | |
Gemini 2.0 Flash Live | 1,000 ביקורים | 10,000,000 | ||
מודלים גנרטיביים מרובי-מוֹדָלִים | ||||
Gemini 2.5 Flash Preview TTS | 1,000 | 1,000,000 | ||
Gemini 2.5 Pro Preview TTS | 100 | 1,000,000 | ||
גרסת טרום-השקה (Preview) של Gemini 2.0 Flash ליצירת תמונות | 5,000 | 5,000,000 | ||
Imagen 4 Standard | 20 | 15,000 | ||
Imagen 4 Ultra | 15 | 5,000 | ||
Imagen 3 | 20 | |||
Veo 3 | 10 | 500 | ||
Veo 2 | 2 | 50 | ||
מודלים אחרים | ||||
Gemma 3 ו-3n | 30 | 15,000 | 14,400 | |
Gemini Embedding | 10,000 | 10,000,000 | -- | -- |
מודלים שהוצאו משימוש | ||||
Gemini 1.5 Flash (יצא משימוש) | 2,000 | 4,000,000 | ||
Gemini 1.5 Flash-8B (יצא משימוש) | 4,000 | 4,000,000 | ||
Gemini 1.5 Pro (יצא משימוש) | 1,000 | 4,000,000 |
המגבלות שצוינו על קצב הבקשות לא מובטחות, והקיבולת בפועל עשויה להשתנות.
מגבלות קצב ליצירת בקשות במצב אצווה
בקשות במצב אצווה כפופות למגבלות קצב משלהן, בנפרד מקריאות ה-API במצב שאינו אצווה.
- בקשות באצווה במקביל: 100
- הגודל המקסימלי של קובץ קלט: 2GB
- מגבלת אחסון הקבצים: 20GB
- אסימונים בתור לכל מודל: בטבלה הבאה מפורט המספר המקסימלי של אסימונים שאפשר להוסיף לתור לעיבוד באצווה בכל המשימות הפעילות לעיבוד באצווה שלכם עבור מודל נתון.
איך משדרגים לרמה הבאה
ב-Gemini API נעשה שימוש בחיוב ב-Cloud לכל שירותי החיוב. כדי לעבור מהרמה החינמית לרמה בתשלום, קודם צריך להפעיל את החיוב ב-Cloud בפרויקט שלכם ב-Google Cloud.
אחרי שהפרויקט יעמוד בקריטריונים שצוינו, הוא יעמוד בדרישות לשדרוג לרמה הבאה. כדי לבקש שדרוג, פועלים לפי השלבים הבאים:
- עוברים אל הדף API keys ב-AI Studio.
- מאתרים את הפרויקט שרוצים לשדרג ולוחצים על 'שדרוג'. האפשרות 'שדרוג' תופיע רק בפרויקטים שעומדים בדרישות של הרמה הבאה.
אחרי אימות מהיר, הפרויקט ישודרג לרמה הבאה.
בקשה להגדלת מגבלת קצב הבקשות
לכל וריאציה של מודל יש מגבלת קצב משויכת (בקשות לדקה, RPM). פרטים על מגבלות הקצב האלה זמינים במאמר בנושא מודלים של Gemini.
בקשה להגדלת מגבלת קצב הבקשות בתוכנית בתשלום
אנחנו לא יכולים להבטיח שנרחיב את מגבלת הקצב, אבל נעשה כמיטב יכולתנו כדי לבדוק את הבקשה.