Models

נקודת הקצה של המודלים מאפשרת לכם ליצור רשימה של המודלים הזמינים באופן פרוגרמטי, ולאחזר מטא-נתונים מורחבים כמו פונקציונליות נתמכת וגודל חלון ההקשר. מידע נוסף על מודלים

שיטה: models.get

קבלת מידע על Model ספציפי, כמו מספר הגרסה, מגבלות הטוקנים, פרמטרים ומטא-נתונים אחרים. מידע מפורט על המודלים זמין במדריך למודלים של Gemini.

נקודת קצה

get https://generativelanguage.googleapis.com/v1beta/{name=models/*}

פרמטרים של נתיב

name string

חובה. שם המשאב של המודל.

השם הזה צריך להיות זהה לשם של מודל שמוחזר על ידי השיטה models.list.

פורמט: models/{model} הפורמט הוא models/{model}.

גוף הבקשה

גוף הבקשה צריך להיות ריק.

דוגמה לבקשה

Python

from google import genai

client = genai.Client()
model_info = client.models.get(model="gemini-2.0-flash")
print(model_info)

Go

ctx := context.Background()
client, err := genai.NewClient(ctx, &genai.ClientConfig{
	APIKey:  os.Getenv("GEMINI_API_KEY"),
	Backend: genai.BackendGeminiAPI,
})
if err != nil {
	log.Fatal(err)
}

modelInfo, err := client.Models.Get(ctx, "gemini-2.0-flash", nil)
if err != nil {
	log.Fatal(err)
}

fmt.Println(modelInfo)

קונכייה

curl https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash?key=$GEMINI_API_KEY

גוף התשובה

אם הפעולה בוצעה ללא שגיאות, גוף התגובה יכיל מופע של Model.

שיטה: models.list

רשימה של Models שזמינים דרך Gemini API.

נקודת קצה

get https://generativelanguage.googleapis.com/v1beta/models

פרמטרים של שאילתה

pageSize integer

המספר המקסימלי של Models שיוחזרו (לכל דף).

אם לא מצוין, יוצגו 50 מודלים בכל דף. השיטה הזו מחזירה לכל היותר 1,000 מודלים לכל דף, גם אם מעבירים ערך גדול יותר של pageSize.

pageToken string

טוקן דף שהתקבל מקריאה קודמת של models.list.

כדי לאחזר את הדף הבא, צריך לספק את הערך pageToken שהוחזר מבקשה אחת כארגומנט לבקשה הבאה.

כשמבצעים חלוקה לעמודים, כל הפרמטרים האחרים שסופקו ל-models.list חייבים להיות זהים לקריאה שסיפקה את אסימון הדף.

גוף הבקשה

גוף הבקשה צריך להיות ריק.

דוגמה לבקשה

Python

from google import genai

client = genai.Client()

print("List of models that support generateContent:\n")
for m in client.models.list():
    for action in m.supported_actions:
        if action == "generateContent":
            print(m.name)

print("List of models that support embedContent:\n")
for m in client.models.list():
    for action in m.supported_actions:
        if action == "embedContent":
            print(m.name)

Go

ctx := context.Background()
client, err := genai.NewClient(ctx, &genai.ClientConfig{
	APIKey:  os.Getenv("GEMINI_API_KEY"),
	Backend: genai.BackendGeminiAPI,
})
if err != nil {
	log.Fatal(err)
}


// Retrieve the list of models.
models, err := client.Models.List(ctx, &genai.ListModelsConfig{})
if err != nil {
	log.Fatal(err)
}

fmt.Println("List of models that support generateContent:")
for _, m := range models.Items {
	for _, action := range m.SupportedActions {
		if action == "generateContent" {
			fmt.Println(m.Name)
			break
		}
	}
}

fmt.Println("\nList of models that support embedContent:")
for _, m := range models.Items {
	for _, action := range m.SupportedActions {
		if action == "embedContent" {
			fmt.Println(m.Name)
			break
		}
	}
}

קונכייה

curl https://generativelanguage.googleapis.com/v1beta/models?key=$GEMINI_API_KEY

גוף התשובה

תשובה מ-ListModel שמכילה רשימה עם מספור עמודים של מודלים.

אם הפעולה מצליחה, גוף התגובה מכיל נתונים במבנה הבא:

שדות
models[] object (Model)

המודלים שמוחזרים.

nextPageToken string

אסימון שאפשר לשלוח כ-pageToken כדי לאחזר את הדף הבא.

אם השדה הזה לא מופיע, אין יותר דפים.

ייצוג ב-JSON
{
  "models": [
    {
      object (Model)
    }
  ],
  "nextPageToken": string
}

משאב REST: ‏ models

משאב: מודל

מידע על מודל שפה גנרטיבי.

שדות
name string

חובה. שם המשאב של Model. כל הערכים המותרים מפורטים במאמר בנושא וריאציות של מודלים.

פורמט: models/{model} עם מוסכמת מתן שמות {model} של:

  • ‪"{baseModelId}-{version}"

דוגמאות:

  • models/gemini-1.5-flash-001
baseModelId string

חובה. השם של מודל הבסיס, צריך להעביר אותו לבקשת היצירה.

דוגמאות:

  • gemini-1.5-flash
version string

חובה. מספר הגרסה של המודל.

המספר הזה מייצג את הגרסה הראשית (1.0 או 1.5)

displayName string

השם של המודל בפורמט שקריא לבני אדם. לדוגמה, Gemini 1.5 Flash.

השם יכול להכיל עד 128 תווים, והוא יכול לכלול כל תו UTF-8.

description string

תיאור קצר של המודל.

inputTokenLimit integer

המספר המקסימלי של טוקנים של קלט שמותר להשתמש בהם במודל הזה.

outputTokenLimit integer

המספר המקסימלי של טוקנים של פלט שזמין למודל הזה.

supportedGenerationMethods[] string

שיטות היצירה הנתמכות של המודל.

שמות ה-method המתאימים של ה-API מוגדרים כמחרוזות בפורמט Pascal case, כמו generateMessage ו-generateContent.

thinking boolean

האם המודל תומך בחשיבה.

temperature number

המדיניות קובעת את מידת הרנדומיזציה של הפלט.

הערכים יכולים לנוע בין [0.0,maxTemperature], כולל. ערך גבוה יותר יניב תשובות מגוונות יותר, ואילו ערך שקרוב יותר ל-0.0 בדרך כלל יניב תשובות פחות מפתיעות מהמודל. הערך הזה מציין את ברירת המחדל שבה הקצה העורפי ישתמש בזמן ביצוע הקריאה למודל.

maxTemperature number

הטמפרטורה המקסימלית שבה המודל יכול להשתמש.

topP number

בדגימה של Nucleus.

בשיטת הדגימה Nucleus נבחן הסט הקטן ביותר של טוקנים שסכום ההסתברות שלהם הוא לפחות topP. הערך הזה מציין את ברירת המחדל שבה הקצה העורפי ישתמש בזמן ביצוע הקריאה למודל.

topK integer

לדגימת k המילים המובילות.

דגימת k המובילים מתבססת על קבוצת topK האסימונים הסבירים ביותר. הערך הזה מציין את ברירת המחדל שבה הקצה העורפי ישתמש בזמן ביצוע הקריאה למודל. אם הערך ריק, המשמעות היא שהמודל לא משתמש בדגימה של k המובילים, ואי אפשר להשתמש ב-topK כפרמטר יצירה.

ייצוג ב-JSON
{
  "name": string,
  "baseModelId": string,
  "version": string,
  "displayName": string,
  "description": string,
  "inputTokenLimit": integer,
  "outputTokenLimit": integer,
  "supportedGenerationMethods": [
    string
  ],
  "thinking": boolean,
  "temperature": number,
  "maxTemperature": number,
  "topP": number,
  "topK": integer
}

שיטה: models.predict

מבצע בקשת חיזוי.

נקודת קצה

post https://generativelanguage.googleapis.com/v1beta/{model=models/*}:predict

פרמטרים של נתיב

model string

חובה. שם המודל לחיזוי. פורמט: name=models/{model} הוא מקבל את הצורה models/{model}.

גוף הבקשה

גוף הבקשה מכיל נתונים עם המבנה הבא:

Fields
instances[] value (Value format)

חובה. המופעים שמשמשים כקלט לקריאת החיזוי.

parameters value (Value format)

אופציונלי. הפרמטרים שקובעים את שיחת החיזוי.

גוף התשובה

הודעת תגובה ל- [PredictionService.Predict].

אם הפעולה מצליחה, גוף התגובה מכיל נתונים במבנה הבא:

שדות
predictions[] value (Value format)

הפלט של קריאת החיזוי.

ייצוג ב-JSON
{
  "predictions": [
    value
  ]
}

שיטה: models.predictLongRunning

זהה ל-models.predict אבל מחזיר LRO.

נקודת קצה

post https://generativelanguage.googleapis.com/v1beta/{model=models/*}:predictLongRunning

פרמטרים של נתיב

model string

חובה. שם המודל לחיזוי. פורמט: name=models/{model}

גוף הבקשה

גוף הבקשה מכיל נתונים עם המבנה הבא:

Fields
instances[] value (Value format)

חובה. המופעים שמשמשים כקלט לקריאת החיזוי.

parameters value (Value format)

אופציונלי. הפרמטרים שקובעים את שיחת החיזוי.

גוף התשובה

אם הפעולה בוצעה ללא שגיאות, גוף התגובה יכיל מופע של Operation.