REST Resource: models

Tài nguyên: Mô hình

Thông tin về Mô hình ngôn ngữ tạo sinh.

Biểu diễn dưới dạng JSON
{
  "name": string,
  "baseModelId": string,
  "version": string,
  "displayName": string,
  "description": string,
  "inputTokenLimit": integer,
  "outputTokenLimit": integer,
  "supportedGenerationMethods": [
    string
  ],
  "temperature": number,
  "topP": number,
  "topK": integer
}
Trường
name

string

Bắt buộc. Tên tài nguyên của Model.

Định dạng: models/{model} với quy ước đặt tên {model} là:

  • "{baseModelId}-{version}"

Ví dụ:

  • models/chat-bison-001
baseModelId

string

Bắt buộc. Tên của mô hình cơ sở, hãy truyền mã này đến yêu cầu tạo.

Ví dụ:

  • chat-bison
version

string

Bắt buộc. Số phiên bản của mô hình.

Đây là phiên bản lớn

displayName

string

Tên mô hình mà con người có thể đọc được. Ví dụ: "Chat Bison".

Tên có thể dài tối đa 128 ký tự và có thể bao gồm bất kỳ ký tự UTF-8 nào.

description

string

Nội dung mô tả ngắn về mô hình.

inputTokenLimit

integer

Số lượng mã thông báo đầu vào tối đa được phép cho mô hình này.

outputTokenLimit

integer

Số lượng mã thông báo đầu ra tối đa có sẵn cho mô hình này.

supportedGenerationMethods[]

string

Các phương thức tạo được hỗ trợ của mô hình.

Tên phương thức được định nghĩa là chuỗi viết hoa Pascal case, chẳng hạn như generateMessage tương ứng với các phương thức API.

temperature

number

Kiểm soát tính ngẫu nhiên của dữ liệu đầu ra.

Các giá trị có thể vượt quá [0.0,1.0] (bao gồm cả hai giá trị này). Giá trị gần 1.0 sẽ tạo ra các câu trả lời đa dạng hơn, trong khi giá trị gần 0.0 thường sẽ dẫn đến các câu trả lời ít bất ngờ hơn từ mô hình. Giá trị này chỉ định giá trị mặc định để phần phụ trợ sử dụng trong khi thực hiện lệnh gọi đến mô hình.

topP

number

Đối với tính năng lấy mẫu hạt nhân.

Việc lấy mẫu hạt nhân sẽ xem xét tập hợp mã thông báo nhỏ nhất có tổng xác suất ít nhất là topP. Giá trị này chỉ định giá trị mặc định để phần phụ trợ sử dụng trong khi thực hiện lệnh gọi đến mô hình.

topK

integer

Đối với lấy mẫu Top-k.

Việc lấy mẫu top-k xem xét tập hợp topK mã thông báo có khả năng xuất hiện nhất. Giá trị này chỉ định giá trị mặc định để phần phụ trợ sử dụng trong khi thực hiện lệnh gọi đến mô hình. Nếu trống, thì điều này có nghĩa là mô hình không sử dụng phương pháp lấy mẫu top-k, và topK không được phép làm tham số tạo.

Phương thức

batchEmbedContents

Tạo nhiều nhúng từ mô hình có văn bản đầu vào đã cho trong một lệnh gọi đồng bộ.

batchEmbedText

Tạo nhiều nhúng từ mô hình có văn bản đầu vào đã cho trong một lệnh gọi đồng bộ.

countMessageTokens

Chạy trình tạo mã thông báo của mô hình trên một chuỗi và trả về số lượng mã thông báo.

countTextTokens

Chạy trình tạo mã thông báo của một mô hình trên văn bản và trả về số lượng mã thông báo.

countTokens

Chạy trình tạo mã thông báo của một mô hình trên nội dung đầu vào và trả về số lượng mã thông báo.

embedContent

Tạo một bản nhúng từ mô hình dựa vào Content đầu vào.

embedText

Tạo một bản nhúng từ mô hình khi có thông báo đầu vào.

generateAnswer

Tạo câu trả lời có cơ sở từ mô hình dựa vào GenerateAnswerRequest đầu vào.

generateContent

Tạo phản hồi từ mô hình dựa vào GenerateContentRequest đầu vào.

generateMessage

Tạo phản hồi từ mô hình dựa vào MessagePrompt đầu vào.

generateText

Tạo phản hồi từ mô hình khi có thông báo đầu vào.

get

Nhận thông tin về một Mô hình cụ thể.

list

Liệt kê các mô hình có sẵn thông qua API.

streamGenerateContent

Tạo phản hồi được truyền trực tuyến từ mô hình đã cung cấp dữ liệu đầu vào GenerateContentRequest.