המדריך הזה יעזור לכם לאבחן ולפתור בעיות נפוצות שקשורות לקריאה ל-Gemini API. יכול להיות שתתקלו בבעיות בשירות הקצה העורפי של Gemini API או ב-SDK של הלקוח. ערכות ה-SDK ללקוחות שלנו הן בקוד פתוח במאגרים הבאים:
אם נתקלת בבעיות במפתח API, עליך לוודא שהגדרת את מפתח ה-API בצורה נכונה לפי המדריך להגדרת מפתח API.
קודי שגיאה של שירות הקצה העורפי של Gemini API
בטבלה הבאה מפורטים קודי שגיאה נפוצים בקצה העורפי שעשויים להופיע, יחד עם הסברים על הסיבות שלהם והשלבים לפתרון הבעיות:
קוד HTTP | סטטוס | תיאור | דוגמה | הפתרון |
400 | INVALID_ARGUMENT | גוף הבקשה פגום. | יש שגיאת הקלדה או שחסרה בקשה שדה חובה. | במאמר ההפניה ל-API מפורט מידע על פורמט הבקשות, דוגמאות וגרסאות נתמכות. שימוש בתכונות מגרסה חדשה יותר של API עם נקודת קצה ישנה יותר עלול לגרום לשגיאות. |
400 | FAILED_PRECONDITION | המינוי ללא תשלום ל-Gemini API לא זמין במדינה שלכם. צריך להפעיל את החיוב בפרויקט ב-Google AI Studio. | אתם שולחים בקשה מאזור שבו אין תמיכה ברמת התמחור ללא תשלום, ולא הפעלתם את החיוב בפרויקט ב-Google AI Studio. | כדי להשתמש ב-Gemini API, צריך להגדיר תוכנית בתשלום באמצעות Google AI Studio. |
403 | PERMISSION_DENIED | למפתח ה-API אין את ההרשאות הנדרשות. | אתם משתמשים במפתח API שגוי, או שאתם מנסים להשתמש במודל מותאם ללא אימות תקין. | בודקים אם מפתח ה-API מוגדר ויש לו את הגישה הנכונה. חשוב גם לבצע אימות תקין כדי להשתמש במודלים מותאמים. |
404 | NOT_FOUND | המשאב המבוקש לא נמצא. | לא נמצא קובץ תמונה, אודיו או וידאו שצוין בבקשה שלך. | בודקים אם כל הפרמטרים בבקשה תקינים לגרסה של ה-API. |
429 | RESOURCE_EXHAUSTED | חרגתם ממגבלת הקצב. | אתם שולחים יותר מדי בקשות לדקה באמצעות Gemini API ברמה החינמית. | מוודאים שאתם פועלים בהתאם למגבלת הקצב של המודל. מבקשים הגדלה של המכסה במקרה הצורך. |
500 | פנימי | אירעה שגיאה לא צפויה בצד של Google. | הקשר הקלט ארוך מדי. | אפשר לצמצם את הקשר הקלט או לעבור באופן זמני למודל אחר (למשל, מ-Gemini 1.5 Pro ל-Gemini 1.5 Flash) ולבדוק אם הבעיה נפתרה. אפשר גם להמתין קצת ולנסות שוב לשלוח את הבקשה. אם הבעיה נמשכת אחרי ניסיון חוזר, אפשר לדווח עליה באמצעות הלחצן שליחת משוב ב-Google AI Studio. |
503 | UNAVAILABLE | יכול להיות שהשירות מושבת או עמווס באופן זמני. | השירות לא יכול לקבל יותר בקשות כרגע. | עוברים באופן זמני למודל אחר (למשל, מ-Gemini 1.5 Pro ל-Gemini 1.5 Flash) ובודקים אם הוא פועל. אפשר גם להמתין קצת ולנסות שוב לשלוח את הבקשה. אם הבעיה נמשכת אחרי ניסיון חוזר, אפשר לדווח עליה באמצעות הלחצן שליחת משוב ב-Google AI Studio. |
504 | DEADLINE_EXCEEDED | השירות לא יכול להשלים את העיבוד עד למועד היעד. | ההנחיה (או ההקשר) גדולים מדי לעיבוד בזמן. | כדי למנוע את השגיאה הזו, צריך להגדיר 'זמן קצוב לתפוגה' ארוך יותר בבקשת הלקוח. |
קודי שגיאה של SDK ללקוח
בדיקת הקריאות ל-API לזיהוי שגיאות בפרמטר של המודל
מוודאים שהפרמטרים של המודל נמצאים בטווח הערכים הבא:
פרמטר של מודל | ערכים (טווח) |
מספר המועמדים | 1-8 (מספר שלם) |
טמפרטורה | 0.0-1.0 |
מספר מקסימלי של אסימוני פלט |
משתמשים ב-get_model (Python) כדי לקבוע את המספר המקסימלי של האסימונים במודל שבו אתם משתמשים.
|
TopP | 0.0-1.0 |
בנוסף לבדיקה של ערכי הפרמטרים, חשוב לוודא שאתם משתמשים בגרסת ה-API הנכונה (למשל, /v1
או /v1beta
) ודגם שתומך בתכונות הנדרשות. לדוגמה, אם תכונה מסוימת נמצאת בגרסה זמנית, היא תהיה זמינה רק בגרסה /v1beta
של ה-API.
איך בודקים אם יש לכם את הדגם הנכון
חשוב לוודא שאתם משתמשים במודל נתמך שמופיע בדף המודלים שלנו.
בעיות בטיחות
אם אתם רואים שהודעת בקשה נחסמה בגלל הגדרת בטיחות בקריאה ל-API, כדאי לבדוק את ההודעה בהתאם למסננים שהגדרתם בקריאה ל-API.
אם מופיע הערך BlockedReason.OTHER
, יכול להיות שהשאילתה או התשובה מפירות את התנאים וההגבלות או שהן לא נתמכות מסיבה אחרת.
בעיה בהקראה
אם אתם רואים שהמודל מפסיק ליצור פלט בגלל הסיבה RECITATION, פירוש הדבר הוא שפלט המודל עשוי להיות דומה לנתונים מסוימים. כדי לפתור את הבעיה, נסו ליצור הנחיה או הקשר ייחודיים ככל האפשר ולהשתמש בטמפרטורה גבוהה יותר.
שיפור הפלט של המודל
כדי לקבל פלט באיכות גבוהה יותר מהמודל, כדאי לנסות לכתוב הנחיות מובנות יותר. בדף מבוא לעיצוב הנחיות מוסבר על כמה מושגים בסיסיים, שיטות ושיטות מומלצות שיעזרו לכם להתחיל.
אם יש לכם מאות דוגמאות לזוגות קלט/פלט טובים, תוכלו גם לנסות כוונון מודל.
הסבר על מגבלות האסימונים
מומלץ לקרוא את המדריך בנושא אסימונים כדי להבין טוב יותר איך לספור אסימונים ואת המגבלות שלהם.
בעיות מוכרות
- ה-API תומך רק במספר שפות נבחרות. שליחת הנחיות בשפות שלא נתמכות עלולה לגרום לתשובות לא צפויות או אפילו לחסימה של התשובות. כאן מפורטות השפות שבהן יש עדכונים.
דיווח על באג
אם יש לכם שאלות, תוכלו להצטרף לדיון בפורום למפתחי AI של Google.