הגבלות קצב של יצירת בקשות

מגבלות קצב קובעות את מספר הבקשות שאפשר לשלוח ל-Gemini API בפרק זמן נתון. ההגבלות האלה עוזרות לשמור על שימוש הוגן, להגן מפני ניצול לרעה ולשמור על ביצועי המערכת לכל המשתמשים.

איך רואים את מגבלות הקצב הפעילות ב-AI Studio

איך פועלות מגבלות הקצב

מגבלות הקצב נמדדות בדרך כלל בשלושה ממדים:

  • בקשות לדקה (RPM)
  • טוקנים לדקה (קלט) (TPM)
  • בקשות ביום (RPD)

השימוש שלכם נבדק מול כל מגבלה, וחריגה מאחת מהן תגרום לשגיאה של הגבלת קצב. לדוגמה, אם מגבלת הבקשות לדקה היא 20, שליחת 21 בקשות בתוך דקה תגרום לשגיאה, גם אם לא חרגתם ממגבלת הטוקנים לדקה או ממגבלות אחרות.

הגבלות על קצב יצירת הבקשות חלות על כל פרויקט ולא על כל מפתח API. המכסות של בקשות ביום (RPD) מתאפסות בחצות, לפי שעון החוף המערבי של ארה"ב.

המגבלות משתנות בהתאם למודל הספציפי שבו משתמשים, וחלק מהמגבלות חלות רק על מודלים ספציפיים. לדוגמה, תמונות לדקה (IPM) מחושבות רק עבור מודלים שיכולים ליצור תמונות (Imagen 3), אבל הן דומות מבחינה רעיונית לטוקנים לדקה (TPM). במודלים אחרים יכולה להיות מגבלה של טוקנים ליום (TPD).

מגבלות הקצב במודלים ניסיוניים ובמודלים בגרסת טרום-השקה (Preview) הן מחמירות יותר.

רמות שימוש

הגבלות הקצב קשורות לרמת השימוש בפרויקט. ככל שהשימוש ב-API וההוצאות גדלים, יש אפשרות לשדרג לרמה גבוהה יותר עם מגבלות קצב גבוהות יותר.

הקריטריונים לרמות 2 ו-3 מבוססים על סך ההוצאות המצטברות על שירותי Google Cloud (כולל, בין היתר, Gemini API) בחשבון לחיוב שמקושר לפרויקט.

שכבה דרישות
חינם משתמשים במדינות שבהן התכונה זמינה
שכבה 1 חשבון לחיוב בתשלום מלא שמקושר לפרויקט
שכבה 2 ההוצאה הכוללת: מעל 250$ ועברו לפחות 30 ימים מאז התשלום האחרון שבוצע בהצלחה
שכבה 3 ההוצאה הכוללת: מעל 1,000$ ועברו לפחות 30 ימים מאז התשלום האחרון שבוצע בהצלחה

כשאתם מבקשים לשדרג את החשבון, מערכת ההגנה האוטומטית שלנו מפני התנהלות פוגעת מבצעת בדיקות נוספות. בדרך כלל, אם אתם עומדים בקריטריונים שצוינו, הבקשה שלכם תאושר. עם זאת, במקרים נדירים, יכול להיות שנאשר בקשת שדרוג רק אחרי שנבדוק גורמים אחרים בתהליך הבדיקה.

המערכת הזו עוזרת לשמור על האבטחה והיושרה של פלטפורמת Gemini API לכל המשתמשים.

מגבלות קצב ב-Gemini API

מגבלות הקצב תלויות במגוון גורמים (כמו רמת המכסה שלכם) ואפשר לראות אותן ב-Google AI Studio. ככל שהרמה והסטטוס של החשבון משתנים לאורך זמן, מגבלות הקצב מתעדכנות באופן אוטומטי.

איך רואים את מגבלות הקצב הפעילות ב-AI Studio

המגבלות שצוינו על קצב הבקשות לא מובטחות, והקיבולת בפועל עשויה להשתנות.

מגבלות קצב ליצירת בקשות (Rate Limits) של Batch API

בקשות ל-Batch API כפופות למגבלות קצב משלהן, בנפרד מקריאות ל-API שאינן מקובצות.

  • בקשות באצווה במקביל: 100
  • הגודל המקסימלי של קובץ הקלט: 2GB
  • מגבלת אחסון הקבצים: 20GB
  • אסימונים בתור לכל מודל: בעמודה Batch Enqueued Tokens בטבלת מגבלות הקצב מפורט המספר המקסימלי של אסימונים שאפשר להוסיף לתור לעיבוד באצווה בכל המשימות הפעילות לעיבוד באצווה עבור מודל נתון. אפשר לעיין בטבלת מגבלות הקצב הרגילות של API.

שכבה 1

דגם טוקנים שהוכנסו לתור באצווה
מודלים של טקסט
‫Gemini 3 Pro Preview ‫50,000,000
Gemini ‎2.5 Pro 5,000,000
Gemini ‎2.5 Flash ‫3,000,000
גרסת טרום-השקה של Gemini 2.5 Flash ‫3,000,000
‫Gemini ‎2.5 Flash-Lite ‫10,000,000
גרסת טרום-השקה (Preview) של Gemini 2.5 Flash-Lite ‫10,000,000
Gemini ‎2.0 Flash ‫10,000,000
Gemini 2.0 Flash-Lite ‫10,000,000
מודלים גנרטיביים מרובי-מוֹדָלִים
תצוגה מקדימה של תמונה ב-Gemini 3 Pro 🍌 ‫2,000,000

שכבה 2

דגם טוקנים שהוכנסו לתור באצווה
מודלים של טקסט
‫Gemini 3 Pro Preview ‫500,000,000
Gemini ‎2.5 Pro ‫500,000,000
Gemini ‎2.5 Flash ‫400,000,000
‫Gemini 2.5 Flash Preview ‫400,000,000
‫Gemini ‎2.5 Flash-Lite ‫500,000,000
גרסת טרום-השקה (Preview) של Gemini 2.5 Flash-Lite ‫500,000,000
Gemini ‎2.0 Flash 1,000,000,000
Gemini 2.0 Flash-Lite 1,000,000,000
מודלים גנרטיביים מרובי-מוֹדָלִים
תצוגה מקדימה של תמונה ב-Gemini 3 Pro 🍌 270,000,000

שכבה 3

טוקנים שהוכנסו לתור באצווה
מודלים של טקסט
‫Gemini 3 Pro Preview 1,000,000,000
Gemini ‎2.5 Pro 1,000,000,000
Gemini ‎2.5 Flash 1,000,000,000
‫Gemini 2.5 Flash Preview 1,000,000,000
‫Gemini ‎2.5 Flash-Lite 1,000,000,000
גרסת טרום-השקה (Preview) של Gemini 2.5 Flash-Lite 1,000,000,000
Gemini ‎2.0 Flash 5,000,000,000
Gemini 2.0 Flash-Lite 5,000,000,000
מודלים גנרטיביים מרובי-מוֹדָלִים
תצוגה מקדימה של תמונה ב-Gemini 3 Pro 🍌 5,000 5,000,000 * 1,000,000,000

איך משדרגים לרמה הבאה

ב-Gemini API נעשה שימוש בחיוב ב-Cloud לכל שירותי החיוב. כדי לעבור מהתוכנית החינמית לתוכנית בתשלום, קודם צריך להפעיל את החיוב ב-Cloud בפרויקט Google Cloud.

אחרי שהפרויקט יעמוד בקריטריונים שצוינו, הוא יעמוד בדרישות לשדרוג לרמה הבאה. כדי לבקש שדרוג, פועלים לפי השלבים הבאים:

אחרי אימות מהיר, הפרויקט ישודרג לרמה הבאה.

בקשה להגדלת מגבלת קצב הבקשות

לכל וריאציה של מודל יש מגבלת קצב משויכת (בקשות לדקה, RPM). פרטים על מגבלות הקצב האלה זמינים במאמר בנושא מודלים של Gemini.

בקשה להגדלת מגבלת קצב הבקשות בתוכנית בתשלום

אנחנו לא יכולים להבטיח שנרחיב את מגבלת הקצב, אבל נעשה כמיטב יכולתנו כדי לבדוק את הבקשה.