REST Resource: models

리소스: Model

생성 언어 모델에 관한 정보입니다.

JSON 표현
{
  "name": string,
  "baseModelId": string,
  "version": string,
  "displayName": string,
  "description": string,
  "inputTokenLimit": integer,
  "outputTokenLimit": integer,
  "supportedGenerationMethods": [
    string
  ],
  "temperature": number,
  "topP": number,
  "topK": integer
}
입력란
name

string

필수 항목입니다. Model의 리소스 이름입니다.

형식: 다음과 같은 {model} 이름 지정 규칙을 사용하는 models/{model}

  • "{baseModelId}-{version}"

예:

  • models/chat-bison-001
baseModelId

string

필수 항목입니다. 기본 모델의 이름으로, 이를 생성 요청에 전달합니다.

예:

  • chat-bison
version

string

필수 항목입니다. 모델의 버전 번호입니다.

이것은 메이저 버전을 나타냅니다.

displayName

string

사람이 읽을 수 있는 모델 이름입니다. 예: 'Bison과 채팅'

이름은 최대 128자(영문 기준)까지 가능하며 UTF-8 문자를 포함할 수 있습니다.

description

string

모델에 대한 간단한 설명입니다.

inputTokenLimit

integer

이 모델에 허용되는 최대 입력 토큰 수입니다.

outputTokenLimit

integer

이 모델에 사용할 수 있는 최대 출력 토큰 수입니다.

supportedGenerationMethods[]

string

모델에서 지원하는 생성 메서드입니다.

메서드 이름은 API 메서드에 해당하는 generateMessage와 같은 파스칼 표기법 문자열로 정의됩니다.

temperature

number

출력의 무작위성을 제어합니다.

값의 범위는 [0.0,1.0] 이상입니다. 값이 1.0에 가까울수록 더 다양한 응답이 생성되고, 값이 0.0에 가까울수록 일반적으로 모델에서 덜 놀랄만한 응답이 생성됩니다. 이 값은 모델을 호출하는 동안 백엔드에서 사용할 기본값을 지정합니다.

topP

number

Nucleus 샘플링용입니다.

핵 샘플링은 확률 합계가 topP 이상인 최소 토큰 집합을 고려합니다. 이 값은 모델을 호출하는 동안 백엔드에서 사용할 기본값을 지정합니다.

topK

integer

Top-k 샘플링

최상위 K 샘플링에서는 확률이 가장 높은 topK 토큰 집합을 고려합니다. 이 값은 모델을 호출하는 동안 백엔드에서 사용할 기본값을 지정합니다. 비어 있으면 모델이 최상위 K 샘플링을 사용하지 않으며 topK이 생성 매개변수로 허용되지 않음을 나타냅니다.

방법

batchEmbedContents

동기 호출로 입력 텍스트가 지정된 모델에서 여러 임베딩을 생성합니다.

batchEmbedText

동기 호출로 입력 텍스트가 지정된 모델에서 여러 임베딩을 생성합니다.

countMessageTokens

문자열에 모델의 tokenizer를 실행하고 토큰 수를 반환합니다.

countTextTokens

텍스트에 모델의 tokenizer를 실행하고 토큰 수를 반환합니다.

countTokens

입력 콘텐츠에서 모델의 tokenizer를 실행하고 토큰 수를 반환합니다.

embedContent

입력 Content가 지정된 모델에서 임베딩을 생성합니다.

embedText

입력 메시지가 지정된 모델에서 임베딩을 생성합니다.

generateAnswer

입력 GenerateAnswerRequest가 지정된 경우 모델에서 그라운드 답변을 생성합니다.

generateContent

입력 GenerateContentRequest가 지정된 경우 모델에서 응답을 생성합니다.

generateMessage

입력 MessagePrompt가 지정된 경우 모델에서 응답을 생성합니다.

generateText

입력 메시지에 따라 모델에서 응답을 생성합니다.

get

특정 모델에 대한 정보를 가져옵니다.

list

API를 통해 사용할 수 있는 모델을 나열합니다.

streamGenerateContent

입력 GenerateContentRequest가 지정된 경우 모델에서 스트리밍된 응답을 생성합니다.