REST Resource: models

ทรัพยากร: โมเดล

ข้อมูลเกี่ยวกับโมเดลภาษาแบบ Generative

การแสดง JSON
{
  "name": string,
  "baseModelId": string,
  "version": string,
  "displayName": string,
  "description": string,
  "inputTokenLimit": integer,
  "outputTokenLimit": integer,
  "supportedGenerationMethods": [
    string
  ],
  "temperature": number,
  "topP": number,
  "topK": integer
}
ช่อง
name

string

ต้องระบุ ชื่อทรัพยากรของ Model

รูปแบบ: models/{model} โดยใช้รูปแบบการตั้งชื่อ {model} ดังต่อไปนี้

  • "{baseModelId}-{version}"

ตัวอย่าง

  • models/chat-bison-001
baseModelId

string

ต้องระบุ ชื่อของโมเดลฐาน แล้วส่งต่อไปยังคำขอการสร้าง

ตัวอย่าง

  • chat-bison
version

string

ต้องระบุ หมายเลขเวอร์ชันของโมเดล

ค่านี้แสดงถึงเวอร์ชันหลัก

displayName

string

ชื่อโมเดลที่มนุษย์อ่านได้ เช่น "Chat Bison"

ชื่อมีความยาวได้สูงสุด 128 อักขระ และประกอบด้วยอักขระ UTF-8 ใดก็ได้

description

string

คำอธิบายสั้นๆ เกี่ยวกับโมเดล

inputTokenLimit

integer

จำนวนโทเค็นอินพุตสูงสุดที่อนุญาตสำหรับโมเดลนี้

outputTokenLimit

integer

จำนวนโทเค็นเอาต์พุตสูงสุดที่ใช้ได้สำหรับโมเดลนี้

supportedGenerationMethods[]

string

วิธีการสร้างที่รองรับของโมเดล

ชื่อเมธอดจะถูกกำหนดเป็นสตริงแบบ Pascal เช่น generateMessage ซึ่งสอดคล้องกับเมธอด API

temperature

number

ควบคุมการสุ่มของเอาต์พุต

ค่ามีได้ตั้งแต่ [0.0,1.0] ค่าที่ใกล้เคียงกับ 1.0 จะทำให้คำตอบมีความหลากหลายมากกว่า ขณะที่ค่าที่ใกล้กับ 0.0 มักจะทำให้ได้คำตอบที่น่าประหลาดใจน้อยลงจากโมเดล ค่านี้จะระบุค่าเริ่มต้นที่แบ็กเอนด์จะใช้ขณะทำการเรียกโมเดล

topP

number

สําหรับการสุ่มตัวอย่างแบบนิวเคลียส

การสุ่มตัวอย่างนิวเคลียสจะพิจารณาชุดโทเค็นขนาดเล็กที่สุดที่มีผลรวมความน่าจะเป็นอย่างน้อย topP ค่านี้จะระบุค่าเริ่มต้นที่แบ็กเอนด์จะใช้ขณะทำการเรียกโมเดล

topK

integer

สำหรับการสุ่มตัวอย่างยอดนิยม

การสุ่มตัวอย่างแบบ Top-K จะพิจารณาชุดโทเค็นที่เป็นไปได้มากที่สุด topK รายการ ค่านี้จะระบุค่าเริ่มต้นที่แบ็กเอนด์จะใช้ขณะทำการเรียกโมเดล หากเว้นว่างไว้ แสดงว่าโมเดลไม่ได้ใช้การสุ่มตัวอย่างแบบท็อป-K และไม่อนุญาตให้ใช้ topK เป็นพารามิเตอร์การสร้าง

วิธีการ

batchEmbedContents

สร้างการฝังหลายรายการจากโมเดลที่ได้รับข้อความอินพุตในการเรียกแบบพร้อมกัน

batchEmbedText

สร้างการฝังหลายรายการจากโมเดลที่ได้รับข้อความอินพุตในการเรียกแบบพร้อมกัน

countMessageTokens

เรียกใช้เครื่องมือแปลงข้อมูลเป็นโทเค็นของโมเดลกับสตริงและแสดงผลจำนวนโทเค็น

countTextTokens

เรียกใช้เครื่องมือแปลงข้อมูลโทเค็นของโมเดลกับข้อความและแสดงผลจำนวนโทเค็น

countTokens

เรียกใช้เครื่องมือแปลงข้อมูลเป็นโทเค็นของโมเดลกับเนื้อหาที่ป้อนและแสดงผลจำนวนโทเค็น

embedContent

สร้างการฝังจากโมเดลที่ระบุอินพุต Content

embedText

สร้างการฝังจากโมเดลตามข้อความอินพุต

generateAnswer

สร้างคำตอบพื้นฐานจากโมเดลที่ระบุอินพุต GenerateAnswerRequest

generateContent

สร้างคำตอบจากโมเดลที่กำหนดอินพุต GenerateContentRequest

generateMessage

สร้างคำตอบจากโมเดลที่กำหนดอินพุต MessagePrompt

generateText

สร้างการตอบกลับจากโมเดลตามข้อความอินพุต

get

รับข้อมูลเกี่ยวกับรุ่นที่เฉพาะเจาะจง

list

แสดงรายการโมเดลที่ใช้ได้ผ่าน API

streamGenerateContent

สร้างการตอบสนองแบบสตรีมจากโมเดลที่มีอินพุต GenerateContentRequest