Model Live API baru telah hadir. Coba gratis di Google AI Studio.

Halaman ini diterjemahkan oleh Cloud Translation API.

Models

Endpoint model menyediakan cara bagi Anda untuk mencantumkan model yang tersedia secara terprogram, dan mengambil metadata yang diperluas seperti fungsi yang didukung dan ukuran jendela konteks. Baca selengkapnya di panduan Model.

Mendapatkan informasi tentang Model tertentu seperti nomor versinya, batas token, parameter, dan metadata lainnya. Lihat panduan model Gemini untuk mengetahui informasi model yang mendetail.

Endpoint

get https://generativelanguage.googleapis.com/v1beta/{name=models/*}

Parameter jalur

name string

Wajib. Nama resource model.

Nama ini harus cocok dengan nama model yang ditampilkan oleh metode models.list.

Format: models/{model} Formatnya adalah models/{model}.

Isi permintaan

Isi permintaan harus kosong.

Contoh permintaan

Python

from google import genai

client = genai.Client()
model_info = client.models.get(model="gemini-2.0-flash")
print(model_info)models.py

Go

ctx := context.Background()
client, err := genai.NewClient(ctx, &genai.ClientConfig{
	APIKey:  os.Getenv("GEMINI_API_KEY"),
	Backend: genai.BackendGeminiAPI,
})
if err != nil {
	log.Fatal(err)
}

modelInfo, err := client.Models.Get(ctx, "gemini-2.0-flash", nil)
if err != nil {
	log.Fatal(err)
}

fmt.Println(modelInfo)models.go

Shell

curl https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash?key=$GEMINI_API_KEYmodels.sh

Isi respons

Jika berhasil, isi respons memuat instance Model.

Metode: models.list

Endpoint
Parameter kueri
Isi permintaan
Isi respons
- Representasi JSON
Cakupan otorisasi
Contoh permintaan
- Daftar

Mencantumkan Models yang tersedia melalui Gemini API.

Endpoint

get https://generativelanguage.googleapis.com/v1beta/models

Parameter kueri

pageSize integer

Jumlah maksimum Models yang akan ditampilkan (per halaman).

Jika tidak ditentukan, 50 model akan ditampilkan per halaman. Metode ini menampilkan paling banyak 1.000 model per halaman, meskipun Anda meneruskan pageSize yang lebih besar.

pageToken string

Token halaman, yang diterima dari panggilan models.list sebelumnya.

Berikan pageToken yang ditampilkan oleh satu permintaan sebagai argumen ke permintaan berikutnya untuk mengambil halaman berikutnya.

Saat melakukan penomoran halaman, semua parameter lain yang disediakan untuk models.list harus sesuai dengan panggilan yang memberikan token halaman.

Isi permintaan

Isi permintaan harus kosong.

Contoh permintaan

Python

from google import genai

client = genai.Client()

print("List of models that support generateContent:\n")
for m in client.models.list():
    for action in m.supported_actions:
        if action == "generateContent":
            print(m.name)

print("List of models that support embedContent:\n")
for m in client.models.list():
    for action in m.supported_actions:
        if action == "embedContent":
            print(m.name)models.py

Go

ctx := context.Background()
client, err := genai.NewClient(ctx, &genai.ClientConfig{
	APIKey:  os.Getenv("GEMINI_API_KEY"),
	Backend: genai.BackendGeminiAPI,
})
if err != nil {
	log.Fatal(err)
}


// Retrieve the list of models.
models, err := client.Models.List(ctx, &genai.ListModelsConfig{})
if err != nil {
	log.Fatal(err)
}

fmt.Println("List of models that support generateContent:")
for _, m := range models.Items {
	for _, action := range m.SupportedActions {
		if action == "generateContent" {
			fmt.Println(m.Name)
			break
		}
	}
}

fmt.Println("\nList of models that support embedContent:")
for _, m := range models.Items {
	for _, action := range m.SupportedActions {
		if action == "embedContent" {
			fmt.Println(m.Name)
			break
		}
	}
}models.go

Shell

curl https://generativelanguage.googleapis.com/v1beta/models?key=$GEMINI_API_KEYmodels.sh

Isi respons

Respons dari ListModel yang berisi daftar Model yang di-pagination.

Jika berhasil, isi respons memuat data dengan struktur berikut:

Kolom

models[] object (Model)

Model yang ditampilkan.

nextPageToken string

Token yang dapat dikirim sebagai pageToken untuk mengambil halaman berikutnya.

Jika kolom ini dihilangkan, tidak ada lagi halaman.

Representasi JSON
{ "models": [ { object (`Model`) } ], "nextPageToken": string }

REST Resource: model

Resource: Model
- Representasi JSON
Metode

Resource: Model

Informasi tentang Model Bahasa Generatif.

Kolom

name string

Wajib. Nama resource Model. Lihat Varian model untuk semua nilai yang diizinkan.

Format: models/{model} dengan konvensi penamaan {model}:

"{baseModelId}-{version}"

Contoh:

models/gemini-1.5-flash-001

baseModelId string

Wajib. Nama model dasar, teruskan ini ke permintaan pembuatan.

Contoh:

gemini-1.5-flash

version string

Wajib. Nomor versi model.

Ini menunjukkan versi utama (1.0 atau 1.5)

displayName string

Nama model yang dapat dibaca manusia. Misalnya, "Gemini 1.5 Flash".

Nama dapat berisi hingga 128 karakter dan dapat terdiri dari karakter UTF-8 apa pun.

description string

Deskripsi singkat model.

inputTokenLimit integer

Jumlah maksimum token input yang diizinkan untuk model ini.

outputTokenLimit integer

Jumlah maksimum token output yang tersedia untuk model ini.

supportedGenerationMethods[] string

Metode pembuatan yang didukung model.

Nama metode API yang sesuai ditentukan sebagai string Pascal case, seperti generateMessage dan generateContent.

thinking boolean

Apakah model mendukung pemikiran.

temperature number

Mengontrol keacakan output.

Nilai dapat berkisar lebih dari [0.0,maxTemperature], inklusif. Nilai yang lebih tinggi akan menghasilkan respons yang lebih bervariasi, sedangkan nilai yang lebih dekat dengan 0.0 biasanya akan menghasilkan respons yang tidak terlalu mengejutkan dari model. Nilai ini menentukan default yang akan digunakan oleh backend saat melakukan panggilan ke model.

maxTemperature number

Suhu maksimum yang dapat digunakan model ini.

topP number

Untuk Sampling inti.

Pengambilan sampel inti mempertimbangkan kumpulan token terkecil yang jumlah probabilitasnya setidaknya topP. Nilai ini menentukan default yang akan digunakan oleh backend saat melakukan panggilan ke model.

topK integer

Untuk pengambilan sampel Top-k.

Pengambilan sampel top-k mempertimbangkan kumpulan topK token yang paling mungkin. Nilai ini menentukan default yang akan digunakan oleh backend saat melakukan panggilan ke model. Jika kosong, menunjukkan bahwa model tidak menggunakan pengambilan sampel top-k, dan topK tidak diizinkan sebagai parameter pembuatan.

Representasi JSON
{ "name": string, "baseModelId": string, "version": string, "displayName": string, "description": string, "inputTokenLimit": integer, "outputTokenLimit": integer, "supportedGenerationMethods": [ string ], "thinking": boolean, "temperature": number, "maxTemperature": number, "topP": number, "topK": integer }

Representasi JSON

{
  "name": string,
  "baseModelId": string,
  "version": string,
  "displayName": string,
  "description": string,
  "inputTokenLimit": integer,
  "outputTokenLimit": integer,
  "supportedGenerationMethods": [
    string
  ],
  "thinking": boolean,
  "temperature": number,
  "maxTemperature": number,
  "topP": number,
  "topK": integer
}

Metode: models.predict

Endpoint
Parameter jalur
Isi permintaan
- Representasi JSON
Isi respons
- Representasi JSON
Cakupan otorisasi

Melakukan permintaan prediksi.

Endpoint

postingan https://generativelanguage.googleapis.com/v1beta/{model=models/*}:predict

Parameter jalur

model string

Wajib. Nama model untuk prediksi. Format: name=models/{model}. Formatnya adalah models/{model}.

Isi permintaan

Isi permintaan memuat data dengan struktur berikut:

Kolom

instances[] value (Value format)

Wajib. Instance yang merupakan input ke panggilan prediksi.

parameters value (Value format)

Opsional. Parameter yang mengatur panggilan prediksi.

Isi respons

Pesan respons untuk [PredictionService.Predict].

Jika berhasil, isi respons memuat data dengan struktur berikut:

Kolom

predictions[] value (Value format)

Output panggilan prediksi.

Representasi JSON
{ "predictions": [ value ] }

Metode: models.predictLongRunning

Endpoint
Parameter jalur
Isi permintaan
- Representasi JSON
Isi respons
Cakupan otorisasi

Sama seperti models.predict, tetapi menampilkan LRO.

Endpoint

postingan https://generativelanguage.googleapis.com/v1beta/{model=models/*}:predictLongRunning

Parameter jalur

model string

Wajib. Nama model untuk prediksi. Format: name=models/{model}.

Isi permintaan

Isi permintaan memuat data dengan struktur berikut:

Kolom

instances[] value (Value format)

Wajib. Instance yang merupakan input ke panggilan prediksi.

parameters value (Value format)

Opsional. Parameter yang mengatur panggilan prediksi.

Isi respons

Jika berhasil, isi respons memuat instance Operation.