Models

모델 엔드포인트를 사용하면 사용 가능한 모델을 프로그래매틱 방식으로 나열하고 지원되는 기능 및 컨텍스트 창 크기 조정과 같은 확장된 메타데이터를 검색할 수 있습니다. 자세한 내용은 모델 가이드를 참조하세요.

메서드: models.get

버전 번호, 토큰 제한, 매개변수, 기타 메타데이터와 같은 특정 Model에 대한 정보를 가져옵니다. 자세한 모델 정보는 Gemini 모델 가이드를 참고하세요.

엔드포인트

get https://generativelanguage.googleapis.com/v1beta/{name=models/*}

경로 매개변수

name string

필수 항목입니다. 모델의 리소스 이름입니다.

이 이름은 models.list 메서드에서 반환하는 모델 이름과 일치해야 합니다.

형식: models/{model} models/{model} 형식을 사용합니다.

요청 본문

요청 본문은 비어 있어야 합니다.

요청 예시

Python

import google.generativeai as genai

model_info = genai.get_model("models/gemini-1.5-flash-latest")
print(model_info)

Shell

curl https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash?key=$GOOGLE_API_KEY

응답 본문

성공한 경우 응답 본문에 Model의 인스턴스가 포함됩니다.

메서드: models.list

Gemini API를 통해 사용 가능한 Model를 나열합니다.

엔드포인트

<ph type="x-smartling-placeholder"></ph> <ph type="x-smartling-placeholder"></ph> 받기 https://generativelanguage.googleapis.com/v1beta/models

쿼리 매개변수

pageSize integer

반환할 최대 Models 수(페이지당)입니다.

지정하지 않으면 페이지당 50개의 모델이 반환됩니다. 이 메서드는 더 큰 pageSize를 전달하더라도 페이지당 최대 1,000개의 모델을 반환합니다.

pageToken string

이전 models.list 호출에서 받은 페이지 토큰입니다.

한 요청에서 반환된 pageToken를 다음 요청의 인수로 제공하여 다음 페이지를 검색합니다.

페이지를 매길 때 models.list에 제공된 다른 모든 매개변수는 페이지 토큰을 제공한 호출과 일치해야 합니다.

요청 본문

요청 본문은 비어 있어야 합니다.

요청 예시

Python

import google.generativeai as genai

print("List of models that support generateContent:\n")
for m in genai.list_models():
    if "generateContent" in m.supported_generation_methods:
        print(m.name)

print("List of models that support embedContent:\n")
for m in genai.list_models():
    if "embedContent" in m.supported_generation_methods:
        print(m.name)

Shell

curl https://generativelanguage.googleapis.com/v1beta/models?key=$GOOGLE_API_KEY

응답 본문

모델의 페이징된 목록이 포함된 ListModel의 응답입니다.

성공할 경우 응답 본문에 다음 구조의 데이터가 포함됩니다.

필드
models[] object (Model)

반환된 모델입니다.

nextPageToken string

다음 페이지를 검색하기 위해 pageToken으로 전송할 수 있는 토큰입니다.

이 필드를 생략하면 더 이상 페이지가 없습니다.

JSON 표현
{
  "models": [
    {
      object (Model)
    }
  ],
  "nextPageToken": string
}

REST 리소스: models

리소스: Model

생성형 언어 모델에 관한 정보입니다.

를 통해 개인정보처리방침을 정의할 수 있습니다. <ph type="x-smartling-placeholder">
</ph> 입력란
name string

필수 항목입니다. Model의 리소스 이름입니다. 허용되는 모든 값은 모델 변형을 참고하세요.

형식: 다음과 같은 {model} 이름 지정 규칙을 사용하는 models/{model}

  • "{baseModelId}-{version}"

예:

  • models/gemini-1.5-flash-001
baseModelId string

필수 항목입니다. 기본 모델의 이름입니다. 생성 요청에 전달합니다.

예:

  • gemini-1.5-flash
version string

필수 항목입니다. 모델의 버전 번호입니다.

주 버전 (1.0 또는 1.5)을 나타냅니다.

displayName string

사람이 읽을 수 있는 모델 이름입니다. 예: 'Gemini 1.5 Flash'.

이름은 최대 128자(영문 기준)까지 가능하며 UTF-8 문자를 포함할 수 있습니다.

description string

모델에 대한 간단한 설명입니다.

inputTokenLimit integer

이 모델에 허용되는 최대 입력 토큰 수입니다.

outputTokenLimit integer

이 모델에 사용할 수 있는 최대 출력 토큰 수입니다.

supportedGenerationMethods[] string

모델에서 지원되는 생성 메서드입니다.

해당 API 메서드 이름은 파스칼 표기법 문자열(예: generateMessagegenerateContent)로 정의됩니다.

temperature number

출력의 무작위성을 제어합니다.

값의 범위는 [0.0,maxTemperature](양 끝값 포함)입니다. 값이 클수록 더 다양한 응답이 생성되는 반면, 0.0에 가까울수록 일반적으로 모델에서 예상치 못한 응답을 얻게 됩니다. 이 값은 모델을 호출하는 동안 백엔드에서 사용할 기본값을 지정합니다.

maxTemperature number

이 모델에서 사용할 수 있는 최대 온도입니다.

topP number

핵 샘플링

핵 샘플링은 확률 합계가 topP 이상인 가장 작은 토큰 집합을 고려합니다. 이 값은 모델을 호출하는 동안 백엔드에서 사용할 기본값을 지정합니다.

topK integer

Top-k 샘플링.

Top-k 샘플링은 확률이 가장 높은 topK 토큰 집합을 고려합니다. 이 값은 모델을 호출하는 동안 백엔드에서 사용할 기본값을 지정합니다. 비어 있으면 모델이 최상위 k 샘플링을 사용하지 않으며 topK이 생성 매개변수로 허용되지 않음을 나타냅니다.

JSON 표현
{
  "name": string,
  "baseModelId": string,
  "version": string,
  "displayName": string,
  "description": string,
  "inputTokenLimit": integer,
  "outputTokenLimit": integer,
  "supportedGenerationMethods": [
    string
  ],
  "temperature": number,
  "maxTemperature": number,
  "topP": number,
  "topK": integer
}