מגבלות קצב

הגבלות על קצב יצירת הבקשות קובעות את מספר הבקשות שאפשר לשלוח ל-Gemini API בפרק זמן נתון. ההגבלות האלה עוזרות לנו לשמור על שימוש הוגן, להגן מפני ניצול לרעה ולשמור על ביצועי המערכת לכל המשתמשים.

איך רואים את מכסות השימוש הפעילות ב-AI Studio

איך פועלות מגבלות הקצב

מגבלות הקצב נמדדות בדרך כלל בשלושה ממדים:

  • בקשות לדקה (RPM)
  • טוקנים לדקה (קלט) (TPM)
  • בקשות ביום (RPD)

השימוש שלכם נבדק מול כל מגבלה, ואם תחרגו מאחת מהן, תוצג שגיאה של הגבלת קצב. לדוגמה, אם מגבלת הבקשות לדקה היא 20, שליחת 21 בקשות בתוך דקה תגרום לשגיאה, גם אם לא חרגתם ממגבלת הטוקנים לדקה או ממגבלות אחרות.

המגבלות על קצב יצירת הבקשות חלות על כל פרויקט ולא על כל מפתח API. המכסות של בקשות ביום (RPD) מתאפסות בחצות, לפי שעון החוף המערבי של ארה"ב.

המגבלות משתנות בהתאם למודל הספציפי שבו משתמשים, וחלק מהמגבלות חלות רק על מודלים ספציפיים. לדוגמה, המדד 'תמונות לדקה' (IPM) מחושב רק למודלים שיכולים ליצור תמונות (Nano Banana), אבל הוא דומה מבחינה רעיונית למדד 'אסימונים לדקה' (TPM). במודלים אחרים יכולה להיות מגבלה של טוקנים ליום (TPD).

מגבלות הקצב מחמירות יותר במודלים ניסיוניים ובמודלים בגרסת טרום-השקה (Preview).

רמות שימוש

הגבלות הקצב קשורות לרמת השימוש בפרויקט. ככל שהשימוש ב-API וההוצאות שלכם יגדלו, המינוי שלכם ישודרג אוטומטית לרמה גבוהה יותר עם מכסות גבוהות יותר.

הקריטריונים לרמות 2 ו-3 מבוססים על סך ההוצאות המצטברות על שירותי Google Cloud (כולל, בין היתר, Gemini API) בחשבון לחיוב שמקושר לפרויקט.

רמת שימוש דרישות
חינם פרויקט פעיל או תקופת ניסיון בחינם
שכבה 1 הגדרה וקישור של חשבון לחיוב פעיל
שכבה 2 שילמת 100 $לחשבון לחיוב, ועברו לפחות 3 ימים מאז התשלום המוצלח הראשון
שכבה 3 שילמתם 1,000 $לחשבון לחיוב, ועברו לפחות 30 ימים מאז התשלום המוצלח הראשון

בדרך כלל, אם אתם עומדים בקריטריונים שצוינו, הבקשה שלכם תאושר. עם זאת, במקרים נדירים, יכול להיות שנאשר בקשת שדרוג רק אחרי שנבדוק גורמים אחרים בתהליך הבדיקה.

המערכת הזו עוזרת לשמור על האבטחה והיושרה של פלטפורמת Gemini API לכל המשתמשים.

מגבלות קצב ב-Gemini API

מגבלות הקצב תלויות במגוון גורמים (כמו רמת השימוש שלכם) ואפשר לראות אותן ב-Google AI Studio. ככל שהרמה והסטטוס של החשבון משתנים לאורך זמן, מגבלות הקצב מתעדכנות באופן אוטומטי.

איך רואים את מכסות השימוש הפעילות ב-AI Studio

המגבלות על קצב הבקשות שצוינו לא מובטחות, והקיבולת בפועל עשויה להשתנות.

מגבלות קצב ליצירת בקשות (Rate Limits) של Batch API

בקשות Batch API כפופות למגבלות קצב משלהן, בנפרד מקריאות API שאינן מקובצות.

  • בקשות באצווה במקביל: 100
  • הגודל המקסימלי של קובץ קלט: 2GB
  • מכסת אחסון הקבצים: 20GB
  • אסימונים בתור לכל מודל: בטבלה Batch enqueued tokens מפורט המספר המקסימלי של אסימונים שאפשר להוסיף לתור לעיבוד באצווה בכל המשימות הפעילות לעיבוד באצווה עבור מודל נתון.

שכבה 1

דגם Batch enqueued tokens
מודלים של טקסט
‫Gemini 3.1 Pro Preview 5,000,000
‫Gemini 3.1 Flash-Lite (גרסת טרום-השקה) ‫10,000,000
‫Gemini 3 Flash Preview ‫3,000,000
Gemini ‎2.5 Pro 5,000,000
Gemini ‎2.5 Pro TTS 25,000
Gemini ‎2.5 Flash ‫3,000,000
גרסת טרום-השקה (Preview) של Gemini 2.5 Flash ‫3,000,000
תצוגה מקדימה של תמונה ב-Gemini 2.5 Flash ‫3,000,000
Gemini ‎2.5 Flash TTS 100,000
Gemini ‎2.5 Flash-Lite ‫10,000,000
גרסת טרום-השקה (Preview) של Gemini 2.5 Flash-Lite ‫10,000,000
Gemini ‎2.0 Flash ‫10,000,000
תמונה של Gemini 2.0 Flash ‫3,000,000
Gemini 2.0 Flash-Lite ‫10,000,000
מודלים גנרטיביים מרובי-מוֹדָלִים
תצוגה מקדימה של Gemini 3.1 Flash Image 🍌 1,000,000
תצוגה מקדימה של תמונה ב-Gemini 3 Pro 🍌 ‫2,000,000
מודלים להטמעה
Gemini Embedding 500,000

שכבה 2

דגם Batch enqueued tokens
מודלים של טקסט
‫Gemini 3.1 Pro Preview ‫500,000,000
‫Gemini 3.1 Flash-Lite (גרסת טרום-השקה) ‫500,000,000
‫Gemini 3.1 Flash Preview ‫400,000,000
Gemini ‎2.5 Pro ‫500,000,000
Gemini ‎2.5 Pro TTS 100,000
Gemini ‎2.5 Flash ‫400,000,000
גרסת טרום-השקה (Preview) של Gemini 2.5 Flash ‫400,000,000
תצוגה מקדימה של תמונה ב-Gemini 2.5 Flash ‫400,000,000
Gemini ‎2.5 Flash TTS 100,000
Gemini ‎2.5 Flash-Lite ‫500,000,000
גרסת טרום-השקה (Preview) של Gemini 2.5 Flash-Lite ‫500,000,000
Gemini ‎2.0 Flash 1,000,000,000
תמונה של Gemini 2.0 Flash ‫400,000,000
Gemini 2.0 Flash-Lite 1,000,000,000
מודלים גנרטיביים מרובי-מוֹדָלִים
תצוגה מקדימה של Gemini 3.1 Flash Image 🍌 250,000,000
תצוגה מקדימה של תמונה ב-Gemini 3 Pro 🍌 ‫270,000,000
מודלים להטמעה
Gemini Embedding 5,000,000

שכבה 3

דגם Batch enqueued tokens
מודלים של טקסט
‫Gemini 3.1 Pro Preview 1,000,000,000
‫Gemini 3.1 Flash-Lite (גרסת טרום-השקה) 1,000,000,000
‫Gemini 3.1 Flash Preview 1,000,000,000
Gemini ‎2.5 Pro 1,000,000,000
Gemini ‎2.5 Pro TTS 1,000,000
Gemini ‎2.5 Flash 1,000,000,000
גרסת טרום-השקה (Preview) של Gemini 2.5 Flash 1,000,000,000
תצוגה מקדימה של תמונה ב-Gemini 2.5 Flash 1,000,000,000
Gemini ‎2.5 Flash TTS 4,000,000
Gemini ‎2.5 Flash-Lite 1,000,000,000
גרסת טרום-השקה (Preview) של Gemini 2.5 Flash-Lite 1,000,000,000
Gemini ‎2.0 Flash 5,000,000,000
תמונה של Gemini 2.0 Flash 1,000,000,000
Gemini 2.0 Flash-Lite 5,000,000,000
מודלים גנרטיביים מרובי-מוֹדָלִים
תצוגה מקדימה של Gemini 3.1 Flash Image 🍌 750,000,000
תצוגה מקדימה של תמונה ב-Gemini 3 Pro 🍌 1,000,000,000
מודלים להטמעה
Gemini Embedding ‫10,000,000

איך משדרגים לרמה הבאה

כדי לעבור מהתוכנית בחינם לתוכנית בתשלום, קודם צריך להגדיר חיוב ב-AI Studio.

אחרי שהפרויקט יעמוד בקריטריונים שצוינו, הוא ישודרג אוטומטית לרמה הבאה. שדרוגים של רמת השירות מחינם לרמה 1 בדרך כלל נכנסים לתוקף באופן מיידי, ושדרוגים לרמות שירות גבוהות יותר נכנסים לתוקף תוך 10 דקות. עוברים אל דף הפרויקטים ב-AI Studio כדי לבדוק את הרמות.

בקשה להגדלת מגבלת קצב הבקשות

לכל וריאציה של מודל יש מגבלת קצב משויכת (בקשות לדקה, RPM). פרטים על מגבלות הקצב האלה זמינים בדף מגבלת הקצב של AI Studio.

בקשה להגדלת מגבלת קצב הבקשות בתוכנית בתשלום

אנחנו לא יכולים להבטיח שנרחיב את מכסת קצב הבקשות, אבל נעשה כמיטב יכולתנו כדי לבדוק את הבקשה.