אפשרויות תצורה ליצירה ולפלט של מודלים. לא כל הפרמטרים ניתנים להגדרה בכל מודל.
ייצוג JSON |
---|
{
"stopSequences": [
string
],
"responseMimeType": string,
"responseSchema": {
object ( |
שדות | |
---|---|
stopSequences[] |
זה שינוי אופציונלי. קבוצה של רצפי תווים (עד 5) שיפסיקו את יצירת הפלט. אם צוין אחרת, ה-API יפסיק בהופעה הראשונה של רצף עצירה. רצף העצירה לא ייכלל בתגובה. |
responseMimeType |
זה שינוי אופציונלי. mimetype של תגובת הפלט של הטקסט המועמד שנוצר. mimetype נתמך: |
responseSchema |
זה שינוי אופציונלי. סכימת תגובת פלט של הטקסט המועמד שנוצר כאשר לסוג mime של התגובה יכולה להיות סכימה. הסכימה יכולה להיות אובייקטים, פרימיטיבים או מערכים, והיא קבוצת משנה של סכימת OpenAPI. אם המדיניות הזו מוגדרת, יש להגדיר גם accessMimeType תואם. mimetypes תואמים: |
candidateCount |
זה שינוי אופציונלי. מספר התשובות שנוצרו שיש להחזיר. כרגע אפשר להגדיר את הערך הזה רק ל-1. אם המדיניות לא מוגדרת, ברירת המחדל תהיה 1. |
maxOutputTokens |
זה שינוי אופציונלי. מספר האסימונים המקסימלי שיש לכלול במועמד. הערה: ערך ברירת המחדל משתנה לפי המודל. מידע נוסף מופיע במאפיין |
temperature |
זה שינוי אופציונלי. ההגדרה קובעת את מידת הרנדומיזציה של הפלט. הערה: ערך ברירת המחדל משתנה לפי המודל. מידע נוסף מופיע במאפיין הערכים יכולים לנוע בין [0.0, 2.0]. |
topP |
זה שינוי אופציונלי. ההסתברות המצטברת המקסימלית של אסימונים שצריך לקחת בחשבון במהלך דגימה. במודל נעשה שימוש בדגימה משולבת של סולם הערכים המובילים ודגימות גרעין. האסימונים ממוינים לפי ההסתברויות שלהם, כך שהמערכת תתייחס רק לאסימונים בעלי הסבירות הגבוהה ביותר. דגימה מסוג 'Top-K' מגבילה באופן ישיר את מספר האסימונים המקסימלי שניתן לשקול, בעוד שדגימת Nucleus מגבילה את מספר האסימונים, על סמך ההסתברות המצטברת. הערה: ערך ברירת המחדל משתנה לפי המודל. מידע נוסף מופיע במאפיין |
topK |
זה שינוי אופציונלי. מספר האסימונים המקסימלי שיש לקחת בחשבון במהלך דגימה. במודלים נעשה שימוש בדגימת גרעין או בדגימה משולבת של 'Top k' ו'גרעין'. בדגימה מסוג 'Top k' נלקחת בחשבון הקבוצה של הערה: ערך ברירת המחדל משתנה לפי המודל. מידע נוסף מופיע במאפיין |