חיוב

במדריך הזה נספק סקירה כללית על אפשרויות החיוב השונות ב-Gemini API, נסביר איך מפעילים את החיוב ומעקב אחרי השימוש, ונענה על שאלות נפוצות בנושא חיוב.

מידע על חיוב

החיוב על Gemini API מבוסס על שני רמות תמחור: ללא תשלום (או חינם) ותשלום לפי שימוש (או בתשלום). המחירים והמגבלות על קצב שליחת הבקשות משתנים בין הרמות האלה, וגם משתנים בהתאם למודל. המחירים והמגבלות העדכניות מפורטים במאמר תמחור. פירוט של היכולות לפי מודל זמין בדף המודלים של Gemini.

הגבלות קצב

מגבלות קצב שליחת בקשות הן מכסות שמגבילות את מספר הבקשות שאפשר לשלוח ל-Gemini API בפרק זמן נתון. המגבלות האלה עוזרות לנו להבטיח שימוש הוגן, להגן מפני ניצול לרעה ולשמור על ביצועים מיטביים לכל המשתמשים.

למגבלות קצב יש כמה פונקציות חיוניות:

  • מניעת ניצול לרעה: הם מגינים על ה-API מפני גורמים זדוניים שמנסים לשבש את המערכת או לגרום לעומס יתר עליה.
  • הבטחת גישה הוגנת: מגבלות קצב שולחות לכל משתמש הודעה על כך שהוא לא יכול לשלוט במשאבי ה-API, וכך מבטיחות חוויית שימוש חלקה לכולם.
  • ניהול עומס התשתית: שליטה בנפח הבקשות עוזרת לשמור על ביצועים עקביים של ה-API ולמנוע עומס יתר על השרת.

דוגמה בדיונית למכסות שעשויות לחול על מודל נתון ברמה נתונה:

  • 10 בקשות לדקה
  • 10,000 TPM (אסימונים לדקה)
  • 1,000 בקשות ביום

בדוגמה הזו, אם תחרגו מ-10 RPM (או מ-10,000 TPM או מ-1,000 RPD), שירות Gemini API יחזיר את השגיאה 429: RESOURCE_EXHAUSTED, שמציינת חריגה ממגבלת הקצב.

איך פועלות מגבלות הקצב

הגבלות הקצב נמדדות לפי ארבעה מאפיינים:

  • בקשות לדקה (RPM)
  • בקשות ביום (RPD)
  • טוקנים לדקה (TPM)
  • תמונות לדקה (IPM)

השימוש שלכם נבדק כנגד כל אחת מהמגבלות, חריגה מכל אחת מהן תגרום להצגת שגיאה של הגבלת קצב שליחת הבקשות. לדוגמה, אם המגבלה שלכם היא 20 בקשות לשעה, שליחת 21 בקשות בדקה תוביל לשגיאה, גם אם לא חרגתם ממגבלת הבקשות לשעה או ממגבלות אחרות.

מגבלות הקצב חלות לכל פרויקט, ולא לכל מפתח API.

המגבלות משתנות בהתאם לדגם הספציפי שבו נעשה שימוש, וחלק מהמגבלות חלות רק על דגמים ספציפיים. לדוגמה, מדד IPM מחושב רק למודלים שיכולים ליצור תמונות.

רמות שימוש והגדלות של מגבלות קצב שליחת בקשות

מגבלות הקצב קשורות לרמת השימוש בפרויקט. ככל שהשימוש ב-API וההוצאות שלכם יגברו, תוכלו לשדרג לרמה גבוהה יותר עם מגבלות קצב גבוהות יותר.

שכבה דרישות
חינם משתמשים במדינות שעומדות בדרישות
שכבה 1 החשבון לחיוב מקושר
שכבה 2 סה"כ הוצאות: 250$; סה"כ ההוצאות הנדרשות חלפו לפחות 30 יום

כשמבקשים שדרוג, מערכת ההגנה האוטומטית שלנו מפני ניצול לרעה מבצעת בדיקות נוספות. בדרך כלל, עמידה בקריטריונים המפורטים מספיקה לקבלת אישור, אבל במקרים נדירים יכול להיות שבקשת שדרוג תידחה על סמך גורמים אחרים שזוהו במהלך תהליך הבדיקה.

המערכת הזו עוזרת להבטיח את האבטחה והשלמות של פלטפורמת Gemini API לכל המשתמשים.

איך מבקשים שדרוג

ב-Gemini API נעשה שימוש בחיוב ב-Cloud לכל שירותי החיוב. כדי לעבור מרמה ללא תשלום לרמה בתשלום, תחילה צריך להפעיל את החיוב ב-Cloud בפרויקט ב-Google Cloud.

כשהפרויקט עומד בקריטריונים שצוינו, הוא הופך להיות מתאים לשדרוג לרמה הבאה. כדי לבקש שדרוג, פועלים לפי השלבים הבאים:

  1. נכנסים לדף AI Studio API keys.
  2. מאתרים את הפרויקט שרוצים לשדרג ולוחצים על שדרוג.
  3. המערכת תאמת באופן אוטומטי את הכשירות של הפרויקט. התהליך הזה נמשך כמה שניות.
  4. אם הפרויקט עומד בכל הדרישות, הוא ישודרג באופן מיידי לרמה הבאה.

כשמפעילים את החיוב ומשתמשים ברמה בתשלום, אפשר ליהנות ממגבלות קצב גבוהות יותר, וההנחיות והתשובות שלכם לא ישמשו לשיפור מוצרי Google. מידע נוסף על השימוש בנתונים בשירותים בתשלום זמין בתנאים ובהגבלות.

חיוב ב-Cloud

ב-Gemini API נעשה שימוש בחיוב ב-Cloud לחיוב שירותים. כדי להשתמש ברמה בתשלום, צריך להגדיר חיוב ב-Cloud בפרויקט בענן. אחרי שמפעילים את החיוב ב-Cloud, אפשר להשתמש בכלים של חיוב ב-Cloud כדי לעקוב אחרי ההוצאות, להבין את העלויות, לבצע תשלומים ולקבל גישה לתמיכה בחיוב ב-Cloud.

הפעלת החיוב

אפשר להפעיל את החיוב ב-Cloud מ-Google AI Studio:

  1. פותחים את Google AI Studio.

  2. בחלק התחתון של סרגל הצד הימני, בוחרים באפשרות הגדרות > פרטי התוכנית.

  3. לוחצים על Set up Billing (הגדרת החיוב) בפרויקט שבחרתם כדי להפעיל את החיוב ב-Cloud.

מעקב אחר השימוש

אחרי שמפעילים את החיוב ב-Cloud, אפשר לעקוב אחרי השימוש ב-Gemini API במסוף Google Cloud. שם השירות של ה-API הוא generativelanguage.googleapis.com, ובמסוף נקרא ה-Gemini API גם Generative Language API.

מסוף Cloud

מידע נוסף זמין במסמכי התיעוד של Google Cloud בנושא מעקב אחר השימוש ב-API.

שאלות נפוצות

בקטע הזה ריכזנו תשובות לשאלות נפוצות.

על מה מחייבים אותי?

התמחור של Gemini API מבוסס על הגורמים הבאים:

  • מספר הטוקנים שהוזנו
  • מספר הטוקנים בפלט
  • מספר הטוקנים ששמורים במטמון
  • משך האחסון של אסימונים במטמון

למידע על מחירים, אפשר לעיין בדף התמחור.

איפה אפשר לראות את המכסה?

אתם יכולים לראות את המכסות והמגבלות המערכת שלכם במסוף Google Cloud.

איך מבקשים להגדיל את המכסות?

כדי לבקש הגדלה של המכסה, פועלים לפי ההוראות המפורטות במאמר איך מבקשים שדרוג.

האם אפשר להשתמש ב-Gemini API בחינם באזור הכלכלי האירופי (כולל האיחוד האירופי), בבריטניה ובשווייץ?

כן, אנחנו מאפשרים להשתמש ברמה החינמית וברמה בתשלום באזורים רבים.

אם מגדירים חיוב באמצעות Gemini API, האם תחויבו על השימוש ב-Google AI Studio?

לא, השימוש ב-Google AI Studio יישאר בחינם, גם אם תגדירו חיוב בכל האזורים הנתמכים.

האם אפשר להשתמש ב-1 מיליון אסימונים ברמה החינמית?

רמת המינוי בחינם ל-Gemini API משתנה בהתאם לדגם שנבחר. בשלב הזה, תוכלו לנסות את חלון הקשר שיכול להכיל מיליון טוקנים בדרכים הבאות:

  • ב-Google AI Studio
  • בתוכניות תשלום לפי שימוש
  • עם תוכניות ללא תשלום במודלים נבחרים

בדף התמחור תוכלו לראות את מגבלות הקצב העדכניות ללא תשלום לכל מודל.

איך מחשבים את מספר האסימונים שבהם משתמשים?

משתמשים ב-method‏ GenerativeModel.count_tokens כדי לספור את מספר האסימונים. מידע נוסף על אסימונים זמין במדריך בנושא אסימונים.

האם אפשר להשתמש בקרדיטים ב-Google Cloud עם Gemini API?

כן, אפשר להשתמש בזיכויים ב-Google Cloud לצורך שימוש ב-Gemini API.

איך מתבצע החיוב?

החיוב על Gemini API מתבצע על ידי מערכת Cloud Billing.

האם מחייבים על בקשות שנכשלו?

אם הבקשה נכשלת עם הודעת השגיאה 400 או 500, לא תחויבו על האסימונים שבהם השתמשתם. עם זאת, הבקשה עדיין תיכלל במכסה שלכם.

האם יש חיוב על כוונון עדין של המודלים?

התאמת המודלים היא בחינם, אבל החישוב של המסקנות על סמך המודלים המותאמים מחויב באותו שיעור כמו החישוב של המסקנות על סמך המודלים הבסיסיים.

האם מתבצע חיוב על GetTokens?

אין חיוב על בקשות ל-GetTokens API והן לא נספרות במסגרת המכסה של הטענות.

בתנאים מוסבר איך אנחנו מטפלים בנתונים כשהחיוב ב-Cloud מופעל (בקטע 'איך Google משתמשת בנתונים שלכם' בקטע 'שירותים בתשלום'). חשוב לדעת שההנחיות של Google AI Studio כפופות לתנאים של 'שירותים בתשלום', כל עוד הופעל חיוב לפחות בפרויקט API אחד. תוכלו לאמת זאת בדף של מפתח Gemini API, אם מופיעים פרויקטים שמסומנים בתור 'בתשלום' בקטע 'תוכנית'.

איפה אפשר לקבל עזרה בנושאי חיוב?

לקבלת עזרה בנושאי חיוב, תוכלו לעיין במאמר קבלת תמיכה בנושא חיוב ב-Cloud.