REST Resource: models

משאב: דגם

מידע על מודל שפה גנרטיבי.

ייצוג JSON
{
  "name": string,
  "baseModelId": string,
  "version": string,
  "displayName": string,
  "description": string,
  "inputTokenLimit": integer,
  "outputTokenLimit": integer,
  "supportedGenerationMethods": [
    string
  ],
  "temperature": number,
  "topP": number,
  "topK": integer
}
שדות
name

string

חובה. שם המשאב של Model.

פורמט: models/{model} עם מוסכמה של {model} למתן שמות של:

  • "{baseModelId}-{version}"

דוגמאות:

  • models/chat-bison-001
baseModelId

string

חובה. שם המודל הבסיסי. יש להעביר אותו לבקשת היצירה.

דוגמאות:

  • chat-bison
version

string

חובה. מספר הגרסה של המודל.

היא מייצגת את הגרסה הראשית

displayName

string

שם המודל הקריא (לבני אדם). למשל, "Chat Bison".

השם יכול להיות באורך של עד 128 תווים ויכול לכלול כל תו בקידוד UTF-8.

description

string

תיאור קצר של המודל.

inputTokenLimit

integer

המספר המקסימלי של אסימוני קלט שמותר במודל הזה.

outputTokenLimit

integer

המספר המקסימלי של אסימוני פלט שזמינים למודל הזה.

supportedGenerationMethods[]

string

שיטות היצירה הנתמכות במודל.

שמות ה-methods מוגדרים כמחרוזות אותיות של פסקל, כמו generateMessage, שתואמות לשיטות ה-API.

temperature

number

ההגדרה קובעת את מידת הרנדומיזציה של הפלט.

הערכים יכולים לנוע מעל [0.0,1.0], כולל. ערך קרוב ל-1.0 יניב תשובות מגוונות יותר, ואילו ערך קרוב ל-0.0 בדרך כלל יניב תשובות פחות מפתיעות מהמודל. הערך הזה מציין את ברירת המחדל שתשמש את הקצה העורפי בזמן ביצוע הקריאה למודל.

topP

number

לדגימות גרעיניות.

דגימת גרעין מתייחסת לקבוצת האסימונים הקטנה ביותר שסכום ההסתברות שלהם הוא topP לפחות. הערך הזה מציין את ברירת המחדל שתשמש את הקצה העורפי בזמן ביצוע הקריאה למודל.

topK

integer

לדגימה מסוג Top-k.

בדגימה מסוג 'Top k' נלקחת בחשבון הקבוצה של topK האסימונים בעלי הסבירות הגבוהה ביותר. הערך הזה מציין את ברירת המחדל שתשמש את הקצה העורפי בזמן ביצוע הקריאה למודל. אם השדה ריק, המשמעות היא שהמודל לא משתמש בדגימה מסוג'למעלה' וש-topK אינו מותר כפרמטר של יצירה.

שיטות

batchEmbedContents

יוצרות מספר הטמעות מהמודל של טקסט הקלט הנתון בהפעלה סינכרונית.

batchEmbedText

יוצרות מספר הטמעות מהמודל של טקסט הקלט הנתון בהפעלה סינכרונית.

countMessageTokens

הפונקציה מפעילה את ההמרה לאסימונים של מודל על מחרוזת ומחזירה את מספר האסימונים.

countTextTokens

הפונקציה מפעילה את ההמרה לאסימונים של מודל על טקסט ומחזירה את מספר האסימונים.

countTokens

הפונקציה מפעילה את ההמרה לאסימונים של המודל על תוכן הקלט ומחזירה את מספר האסימונים.

embedContent

יוצר הטמעה מהמודל בהינתן קלט Content.

embedText

יוצר הטמעה מהמודל שניתנה לו הודעת קלט.

generateAnswer

יוצר תשובה מבוססת על המודל בהינתן קלט GenerateAnswerRequest.

generateContent

יוצרות תשובה מהמודל בהינתן קלט GenerateContentRequest.

generateMessage

יוצרות תשובה מהמודל בהינתן קלט MessagePrompt.

generateText

יוצרות תשובה מהמודל שקיבל הודעת קלט.

get

קבלת מידע על דגם ספציפי.

list

פירוט המודלים הזמינים דרך ה-API.

streamGenerateContent

יוצר תגובה בשידור חי מהמודל עם קלט GenerateContentRequest.