Gemini API

Gemini Interactions API เป็น API เวอร์ชันทดลองที่ช่วยให้นักพัฒนาซอฟต์แวร์สร้างแอปพลิเคชัน Generative AI โดยใช้โมเดล Gemini ได้ Gemini เป็นโมเดลที่มีความสามารถมากที่สุดของเรา ซึ่งสร้างขึ้นมาใหม่ให้ทำงานกับข้อมูลหลายรูปแบบ สามารถสรุปและเข้าใจ ทำงาน และผสมผสานข้อมูลประเภทต่างๆ ได้อย่างราบรื่น รวมถึงภาษา รูปภาพ เสียง วิดีโอ และโค้ด คุณสามารถใช้ Gemini API สำหรับ Use Case ต่างๆ เช่น การให้เหตุผลในข้อความและรูปภาพ การสร้างเนื้อหา เอเจนต์โต้ตอบ ระบบสรุปและจัดประเภท และอื่นๆ

การสร้างการโต้ตอบ

post https://generativelanguage.googleapis.com/v1beta/interactions

สร้างการโต้ตอบใหม่

เนื้อความของคำขอ

เนื้อหาของคำขอมีข้อมูลซึ่งมีโครงสร้างดังต่อไปนี้

model ModelOption  (ไม่บังคับ)

ชื่อของ `Model` ที่ใช้ในการสร้างการโต้ตอบ
ต้องระบุหากไม่ได้ระบุ `agent`

ค่าที่เป็นไปได้ มีดังนี้

  • gemini-2.5-computer-use-preview-10-2025

    โมเดลความสามารถแบบเป็น Agent ที่ออกแบบมาสำหรับการโต้ตอบกับอินเทอร์เฟซโดยตรง ซึ่งช่วยให้ Gemini รับรู้และไปยังส่วนต่างๆ ของสภาพแวดล้อมดิจิทัลได้

  • gemini-2.5-flash

    โมเดลการให้เหตุผลแบบไฮบริดตัวแรกของเราซึ่งรองรับหน้าต่างบริบทขนาด 1 ล้านโทเค็นและมีงบประมาณสำหรับการคิด

  • gemini-2.5-flash-image

    โมเดลการสร้างรูปภาพในตัวของเราได้รับการเพิ่มประสิทธิภาพด้านความเร็ว ความยืดหยุ่น และความเข้าใจบริบท ระบบจะคิดราคาอินพุตและเอาต์พุตข้อความเหมือนกับ 2.5 Flash

  • gemini-2.5-flash-lite

    โมเดลที่มีขนาดเล็กที่สุดและคุ้มค่าที่สุดของเรา สร้างขึ้นเพื่อการใช้งานในวงกว้าง

  • gemini-2.5-flash-lite-preview-09-2025

    โมเดลล่าสุดที่อิงตาม Gemini 2.5 Flash lite ซึ่งได้รับการเพิ่มประสิทธิภาพเพื่อความคุ้มค่า การส่งข้อความปริมาณมาก และคุณภาพสูง

  • gemini-2.5-flash-native-audio-preview-12-2025

    โมเดลเสียงดั้งเดิมของเราได้รับการเพิ่มประสิทธิภาพเพื่อเอาต์พุตเสียงคุณภาพสูงขึ้นพร้อมการเว้นวรรคที่ดีขึ้น ความเป็นธรรมชาติของเสียง ความละเอียด และอารมณ์

  • gemini-2.5-flash-preview-09-2025

    โมเดลล่าสุดที่อิงตามโมเดล 2.5 Flash 2.5 Flash Preview เหมาะที่สุดสำหรับการประมวลผลขนาดใหญ่ งานที่มีเวลาในการตอบสนองต่ำและมีปริมาณมากซึ่งต้องใช้ความคิด และกรณีการใช้งานแบบเอเจนต์

  • gemini-2.5-flash-preview-tts

    โมเดลข้อความเป็นคำพูด 2.5 Flash ของเราได้รับการเพิ่มประสิทธิภาพเพื่อการสร้างคำพูดที่ควบคุมได้ซึ่งมีประสิทธิภาพและมีความหน่วงต่ำ

  • gemini-2.5-pro

    โมเดลอเนกประสงค์ที่ล้ำสมัยของเรา ซึ่งโดดเด่นด้านการเขียนโค้ดและงานการให้เหตุผลที่ซับซ้อน

  • gemini-2.5-pro-preview-tts

    โมเดลเสียงอ่านออกเสียงข้อความ 2.5 Pro ของเราได้รับการเพิ่มประสิทธิภาพเพื่อการสร้างเสียงพูดที่ทรงพลังและมีเวลาในการตอบสนองต่ำ เพื่อให้ได้ผลลัพธ์ที่เป็นธรรมชาติมากขึ้นและควบคุมพรอมต์ได้ง่ายขึ้น

  • gemini-3-flash-preview

    โมเดลที่ชาญฉลาดที่สุดของเราสร้างขึ้นเพื่อเน้นความเร็ว โดยผสานความชาญฉลาดระดับแนวหน้าเข้ากับการค้นหาและการอ้างอิงที่เหนือกว่า

  • gemini-3-pro-image-preview

    โมเดลการสร้างและแก้ไขรูปภาพที่ล้ำสมัย

  • gemini-3-pro-preview

    โมเดลที่ชาญฉลาดที่สุดของเราที่มีความสามารถในการให้เหตุผลและการทำความเข้าใจข้อมูลหลายรูปแบบที่ล้ำสมัยที่สุด รวมถึงความสามารถในการเขียนโค้ดแบบเป็น Agent และ Vibe Coding ที่ทรงพลัง

  • gemini-3.1-pro-preview

    โมเดลการให้เหตุผล SOTA ล่าสุดของเราที่มีความลึกซึ้งและมีความแตกต่างอย่างที่ไม่เคยมีมาก่อน รวมถึงความสามารถในการทำความเข้าใจข้อมูลหลายรูปแบบและการเขียนโค้ดที่ทรงพลัง

  • gemini-3.1-flash-image-preview

    ความสามารถด้านภาพระดับมืออาชีพที่มีประสิทธิภาพระดับ Flash และความสามารถในการสร้างที่อิงตามความเป็นจริง

  • gemini-3.1-flash-lite-preview

    โมเดลที่มีประสิทธิภาพด้านต้นทุนมากที่สุดของเรา ซึ่งได้รับการเพิ่มประสิทธิภาพสำหรับงานที่ต้องใช้ Agent จำนวนมาก การแปล และการประมวลผลข้อมูลอย่างง่าย

  • gemini-3.1-flash-tts-preview

    TTS ของ Gemini 3.1 Flash: การสร้างเสียงพูดที่ทรงพลังและมีเวลาในการตอบสนองต่ำ เพลิดเพลินกับเอาต์พุตที่เป็นธรรมชาติ พรอมต์ที่ควบคุมได้ และแท็กเสียงแบบใหม่ที่สื่ออารมณ์เพื่อการควบคุมการบรรยายที่แม่นยำ

  • lyria-3-clip-preview

    โมเดลการสร้างเพลงที่มีเวลาในการตอบสนองต่ำของเราได้รับการเพิ่มประสิทธิภาพสำหรับคลิปเสียงที่มีความละเอียดสูงและการควบคุมจังหวะที่แม่นยำ

  • lyria-3-pro-preview

    โมเดล Generative ขั้นสูงแบบเต็มเพลงของเรามีความเข้าใจด้านการเรียบเรียงเพลงอย่างลึกซึ้ง ซึ่งได้รับการเพิ่มประสิทธิภาพเพื่อการควบคุมโครงสร้างที่แม่นยำและการเปลี่ยนผ่านที่ซับซ้อนในสไตล์ดนตรีที่หลากหลาย

โมเดลที่จะเติมข้อความของคุณให้สมบูรณ์\n\nดูรายละเอียดเพิ่มเติมได้ที่ [models](https://ai.google.dev/gemini-api/docs/models)

agent AgentOption  (ไม่บังคับ)

ชื่อของ `Agent` ที่ใช้สร้างการโต้ตอบ
ต้องระบุหากไม่ได้ระบุ `model`

ค่าที่เป็นไปได้ มีดังนี้

  • deep-research-pro-preview-12-2025

    เอเจนต์ Deep Research ของ Gemini

  • deep-research-preview-04-2026

    เอเจนต์ Deep Research ของ Gemini

  • deep-research-max-preview-04-2026

    Gemini Deep Research Max Agent

Agent ที่จะโต้ตอบด้วย

input Content หรืออาร์เรย์ (Content) หรืออาร์เรย์ (Step) หรือสตริง  (ต้องระบุ)

อินพุตสำหรับการโต้ตอบ (ใช้ร่วมกันทั้งโมเดลและเอเจนต์)

system_instruction string  (ไม่บังคับ)

คำสั่งของระบบสำหรับการโต้ตอบ

เครื่องมือ อาร์เรย์ (เครื่องมือ)  (ไม่บังคับ)

รายการการประกาศเครื่องมือที่โมเดลอาจเรียกใช้ระหว่างการโต้ตอบ

response_format ResponseFormat หรือ ResponseFormatList  (ไม่บังคับ)

บังคับให้การตอบกลับที่สร้างขึ้นเป็นออบเจ็กต์ JSON ที่เป็นไปตามสคีมา JSON ที่ระบุในฟิลด์นี้

response_mime_type string  (ไม่บังคับ)

ประเภท MIME ของการตอบกลับ ต้องระบุหากตั้งค่า response_format

stream boolean  (ไม่บังคับ)

อินพุตเท่านั้น จะมีการสตรีมการโต้ตอบหรือไม่

store boolean  (ไม่บังคับ)

อินพุตเท่านั้น จะจัดเก็บคำตอบและคำขอเพื่อเรียกข้อมูลในภายหลังหรือไม่

background boolean  (ไม่บังคับ)

อินพุตเท่านั้น ว่าจะเรียกใช้การโต้ตอบกับโมเดลในเบื้องหลังหรือไม่

generation_config GenerationConfig  (ไม่บังคับ)

การกำหนดค่าโมเดล
พารามิเตอร์การกำหนดค่าสำหรับการโต้ตอบกับโมเดล
ทางเลือกแทน `agent_config` ใช้ได้เฉพาะเมื่อตั้งค่า `model`

พารามิเตอร์การกำหนดค่าสำหรับการโต้ตอบกับโมเดล

ช่อง

temperature number  (ไม่บังคับ)

ควบคุมความสุ่มของเอาต์พุต

top_p number  (ไม่บังคับ)

ความน่าจะเป็นสะสมสูงสุดของโทเค็นที่ต้องพิจารณาเมื่อทำการสุ่มตัวอย่าง

seed integer  (ไม่บังคับ)

Seed ที่ใช้ในการถอดรหัสเพื่อความสามารถในการทำซ้ำ

stop_sequences array (string)  (ไม่บังคับ)

รายการลำดับอักขระที่จะหยุดการโต้ตอบเอาต์พุต

thinking_level ThinkingLevel  (ไม่บังคับ)

ระดับโทเค็นความคิดที่โมเดลควรสร้าง

ค่าที่เป็นไปได้ มีดังนี้

  • minimal
  • low
  • medium
  • high

thinking_summaries ThinkingSummaries  (ไม่บังคับ)

จะรวมสรุปความคิดในคำตอบหรือไม่

ค่าที่เป็นไปได้ มีดังนี้

  • auto
  • none

max_output_tokens integer  (ไม่บังคับ)

จำนวนโทเค็นสูงสุดที่จะรวมไว้ในการตอบกลับ

speech_config SpeechConfig  (ไม่บังคับ)

การกำหนดค่าสำหรับการโต้ตอบด้วยเสียง

การกำหนดค่าสำหรับการโต้ตอบด้วยคำพูด

ช่อง

เสียง สตริง  (ไม่บังคับ)

เสียงของผู้พูด

language string  (ไม่บังคับ)

ภาษาของคำพูด

speaker string  (ไม่บังคับ)

ชื่อผู้พูดควรตรงกับชื่อผู้พูดที่ระบุในพรอมต์

image_config ImageConfig  (ไม่บังคับ)

การกำหนดค่าสำหรับการโต้ตอบกับรูปภาพ

การกำหนดค่าสำหรับการโต้ตอบกับรูปภาพ

ช่อง

aspect_ratio enum (string)  (ไม่บังคับ)

ไม่มีคำอธิบาย

ค่าที่เป็นไปได้ มีดังนี้

  • 1:1
  • 2:3
  • 3:2
  • 3:4
  • 4:3
  • 4:5
  • 5:4
  • 9:16
  • 16:9
  • 21:9
  • 1:8
  • 8:1
  • 1:4
  • 4:1
image_size enum (string)  (ไม่บังคับ)

ไม่มีคำอธิบาย

ค่าที่เป็นไปได้ มีดังนี้

  • 1K
  • 2K
  • 4K
  • 512
tool_choice ToolChoiceConfig หรือ ToolChoiceType  (ไม่บังคับ)

การกำหนดค่าการเลือกเครื่องมือ

agent_config object  (ไม่บังคับ)

การกำหนดค่า Agent
การกำหนดค่าสำหรับ Agent
ทางเลือกแทน `generation_config` ใช้ได้เฉพาะเมื่อตั้งค่า `agent`

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบ Polymorphic: type

DynamicAgentConfig

การกำหนดค่าสำหรับเอเจนต์แบบไดนามิก

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "dynamic" เสมอ

DeepResearchAgentConfig

การกำหนดค่าสำหรับตัวแทน Deep Research

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "deep-research" เสมอ

thinking_summaries ThinkingSummaries  (ไม่บังคับ)

จะรวมสรุปความคิดในคำตอบหรือไม่

ค่าที่เป็นไปได้ มีดังนี้

  • auto
  • none

visualization enum (string)  (ไม่บังคับ)

รวมภาพข้อมูลในการตอบกลับไหม

ค่าที่เป็นไปได้ มีดังนี้

  • off
  • auto
collaborative_planning boolean  (ไม่บังคับ)

ช่วยให้การวางแผนแบบมีมนุษย์เป็นผู้ควบคุมสำหรับตัวแทน Deep Research หากตั้งค่าเป็น true ตัวแทน Deep Research จะระบุแผนการค้นคว้าข้อมูลในการตอบกลับ จากนั้นเอเจนต์จะดำเนินการต่อก็ต่อเมื่อผู้ใช้ยืนยันแผนในเทิร์นถัดไป

previous_interaction_id string  (ไม่บังคับ)

รหัสของการโต้ตอบก่อนหน้า (หากมี)

response_modalities ResponseModality  (ไม่บังคับ)

รูปแบบคำตอบที่ขอ (TEXT, IMAGE, AUDIO)

ค่าที่เป็นไปได้ มีดังนี้

  • text
  • image
  • audio
  • video
  • document

service_tier ServiceTier  (ไม่บังคับ)

ระดับบริการสำหรับการโต้ตอบ

ค่าที่เป็นไปได้ มีดังนี้

  • flex
  • standard
  • priority

webhook_config WebhookConfig  (ไม่บังคับ)

ไม่บังคับ การกำหนดค่าเว็บฮุคสำหรับการรับการแจ้งเตือนเมื่อการโต้ตอบเสร็จสมบูรณ์

ข้อความสําหรับการกําหนดค่าเหตุการณ์เว็บฮุคสําหรับคําขอ

ช่อง

uris อาร์เรย์ (สตริง)  (ไม่บังคับ)

ไม่บังคับ หากตั้งค่าไว้ ระบบจะใช้ URI ของเว็บฮุคเหล่านี้สำหรับเหตุการณ์เว็บฮุคแทน เว็บฮุคที่ลงทะเบียน

user_metadata object  (ไม่บังคับ)

ไม่บังคับ ข้อมูลเมตาของผู้ใช้ที่จะแสดงในแต่ละการส่งเหตุการณ์ไปยัง Webhook

การตอบกลับ

แสดงผลทรัพยากร Interaction

คำขอแบบง่าย

ตัวอย่างการตอบกลับ

{
  "created": "2025-11-26T12:25:15Z",
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "object": "interaction",
  "steps": [
    {
      "type": "model_output",
      "content": [
        {
          "type": "text",
          "text": "Hello! I'm functioning perfectly and ready to assist you.\n\nHow are you doing today?"
        }
      ]
    }
  ],
  "status": "completed",
  "updated": "2025-11-26T12:25:15Z",
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 7
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 7,
    "total_output_tokens": 20,
    "total_thought_tokens": 22,
    "total_tokens": 49,
    "total_tool_use_tokens": 0
  }
}

หลายรอบ

ตัวอย่างการตอบกลับ

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "steps": [
    {
      "type": "model_output",
      "content": [
        {
          "type": "text",
          "text": "The capital of France is Paris."
        }
      ]
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 50
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 50,
    "total_output_tokens": 10,
    "total_thought_tokens": 0,
    "total_tokens": 60,
    "total_tool_use_tokens": 0
  }
}

การป้อนข้อมูลรูปภาพ

ตัวอย่างการตอบกลับ

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "steps": [
    {
      "type": "model_output",
      "content": [
        {
          "type": "text",
          "text": "A white humanoid robot with glowing blue eyes stands holding a red skateboard."
        }
      ]
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 10
      },
      {
        "modality": "image",
        "tokens": 258
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 268,
    "total_output_tokens": 20,
    "total_thought_tokens": 0,
    "total_tokens": 288,
    "total_tool_use_tokens": 0
  }
}

การเรียกใช้ฟังก์ชัน

ตัวอย่างการตอบกลับ

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "requires_action",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "steps": [
    {
      "type": "function_call",
      "id": "gth23981",
      "name": "get_weather",
      "arguments": {
        "location": "Boston, MA"
      }
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 100
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 100,
    "total_output_tokens": 25,
    "total_thought_tokens": 0,
    "total_tokens": 125,
    "total_tool_use_tokens": 50
  }
}

Deep Research

ตัวอย่างการตอบกลับ

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "agent": "deep-research-pro-preview-12-2025",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "steps": [
    {
      "type": "model_output",
      "content": [
        {
          "type": "text",
          "text": "Here is a comprehensive research report on the current state of cancer research..."
        }
      ]
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 20
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 20,
    "total_output_tokens": 1000,
    "total_thought_tokens": 500,
    "total_tokens": 1520,
    "total_tool_use_tokens": 0
  }
}

การดึงข้อมูลการโต้ตอบ

get https://generativelanguage.googleapis.com/v1beta/interactions/{id}

ดึงรายละเอียดทั้งหมดของการโต้ตอบรายการเดียวตาม `Interaction.id`

พารามิเตอร์เส้นทาง / การค้นหา

id string  (ต้องระบุ)

ตัวระบุที่ไม่ซ้ำกันของการโต้ตอบที่จะดึงข้อมูล

stream boolean  (ไม่บังคับ)

หากตั้งค่าเป็น "จริง" ระบบจะสตรีมเนื้อหาที่สร้างขึ้นทีละส่วน

ค่าเริ่มต้นคือ False

last_event_id string  (ไม่บังคับ)

ไม่บังคับ หากตั้งค่าไว้ จะเริ่มสตรีมการโต้ตอบจากก้อนข้อมูลถัดไปหลังจากเหตุการณ์ที่ทำเครื่องหมายด้วยรหัสเหตุการณ์ ใช้ได้เฉพาะในกรณีที่ `stream` เป็นจริง

include_input boolean  (ไม่บังคับ)

หากตั้งค่าเป็น "จริง" จะรวมอินพุตไว้ในการตอบกลับ

ค่าเริ่มต้นคือ False

api_version string  (ไม่บังคับ)

เวอร์ชันของ API ที่จะใช้

การตอบกลับ

แสดงผลทรัพยากร Interaction

รับการโต้ตอบ

ตัวอย่างการตอบกลับ

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:25:15Z",
  "updated": "2025-11-26T12:25:15Z",
  "steps": [
    {
      "type": "model_output",
      "content": [
        {
          "type": "text",
          "text": "I'm doing great, thank you for asking! How can I help you today?"
        }
      ]
    }
  ]
}

การลบการโต้ตอบ

delete https://generativelanguage.googleapis.com/v1beta/interactions/{id}

ลบการโต้ตอบตามรหัส

พารามิเตอร์เส้นทาง / การค้นหา

id string  (ต้องระบุ)

ตัวระบุที่ไม่ซ้ำกันของการโต้ตอบที่จะลบ

api_version string  (ไม่บังคับ)

เวอร์ชันของ API ที่จะใช้

การตอบกลับ

หากทำสำเร็จ การตอบกลับจะว่างเปล่า

ลบการโต้ตอบ

การยกเลิกการโต้ตอบ

post https://generativelanguage.googleapis.com/v1beta/interactions/{id}/cancel

ยกเลิกการโต้ตอบตามรหัส โดยจะมีผลกับการโต้ตอบในเบื้องหลังที่ยังทำงานอยู่เท่านั้น

พารามิเตอร์เส้นทาง / การค้นหา

id string  (ต้องระบุ)

ตัวระบุที่ไม่ซ้ำกันของการโต้ตอบที่จะยกเลิก

api_version string  (ไม่บังคับ)

เวอร์ชันของ API ที่จะใช้

การตอบกลับ

แสดงผลทรัพยากร Interaction

ยกเลิกการโต้ตอบ

ตัวอย่างการตอบกลับ

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "agent": "deep-research-pro-preview-12-2025",
  "status": "cancelled",
  "object": "interaction",
  "created": "2025-11-26T12:25:15Z",
  "updated": "2025-11-26T12:25:15Z"
}

แหล่งข้อมูล

การโต้ตอบ

ทรัพยากรการโต้ตอบ

ช่อง

model ModelOption  (ไม่บังคับ)

ชื่อของ `Model` ที่ใช้ในการสร้างการโต้ตอบ

ค่าที่เป็นไปได้ มีดังนี้

  • gemini-2.5-computer-use-preview-10-2025

    โมเดลความสามารถแบบเป็น Agent ที่ออกแบบมาสำหรับการโต้ตอบกับอินเทอร์เฟซโดยตรง ซึ่งช่วยให้ Gemini รับรู้และไปยังส่วนต่างๆ ของสภาพแวดล้อมดิจิทัลได้

  • gemini-2.5-flash

    โมเดลการให้เหตุผลแบบไฮบริดตัวแรกของเราซึ่งรองรับหน้าต่างบริบทขนาด 1 ล้านโทเค็นและมีงบประมาณสำหรับการคิด

  • gemini-2.5-flash-image

    โมเดลการสร้างรูปภาพในตัวของเราได้รับการเพิ่มประสิทธิภาพด้านความเร็ว ความยืดหยุ่น และความเข้าใจบริบท ระบบจะคิดราคาอินพุตและเอาต์พุตข้อความเหมือนกับ 2.5 Flash

  • gemini-2.5-flash-lite

    โมเดลที่มีขนาดเล็กที่สุดและคุ้มค่าที่สุดของเรา สร้างขึ้นเพื่อการใช้งานในวงกว้าง

  • gemini-2.5-flash-lite-preview-09-2025

    โมเดลล่าสุดที่อิงตาม Gemini 2.5 Flash lite ซึ่งได้รับการเพิ่มประสิทธิภาพเพื่อความคุ้มค่า การส่งข้อความปริมาณมาก และคุณภาพสูง

  • gemini-2.5-flash-native-audio-preview-12-2025

    โมเดลเสียงดั้งเดิมของเราได้รับการเพิ่มประสิทธิภาพเพื่อเอาต์พุตเสียงคุณภาพสูงขึ้นพร้อมการเว้นวรรคที่ดีขึ้น ความเป็นธรรมชาติของเสียง ความละเอียด และอารมณ์

  • gemini-2.5-flash-preview-09-2025

    โมเดลล่าสุดที่อิงตามโมเดล 2.5 Flash 2.5 Flash Preview เหมาะที่สุดสำหรับการประมวลผลขนาดใหญ่ งานที่มีเวลาในการตอบสนองต่ำและมีปริมาณมากซึ่งต้องใช้ความคิด และกรณีการใช้งานแบบเอเจนต์

  • gemini-2.5-flash-preview-tts

    โมเดลข้อความเป็นคำพูด 2.5 Flash ของเราได้รับการเพิ่มประสิทธิภาพเพื่อการสร้างคำพูดที่ควบคุมได้ซึ่งมีประสิทธิภาพและมีความหน่วงต่ำ

  • gemini-2.5-pro

    โมเดลอเนกประสงค์ที่ล้ำสมัยของเรา ซึ่งโดดเด่นด้านการเขียนโค้ดและงานการให้เหตุผลที่ซับซ้อน

  • gemini-2.5-pro-preview-tts

    โมเดลเสียงอ่านออกเสียงข้อความ 2.5 Pro ของเราได้รับการเพิ่มประสิทธิภาพเพื่อการสร้างเสียงพูดที่ทรงพลังและมีเวลาในการตอบสนองต่ำ เพื่อให้ได้ผลลัพธ์ที่เป็นธรรมชาติมากขึ้นและควบคุมพรอมต์ได้ง่ายขึ้น

  • gemini-3-flash-preview

    โมเดลที่ชาญฉลาดที่สุดของเราสร้างขึ้นเพื่อเน้นความเร็ว โดยผสานความชาญฉลาดระดับแนวหน้าเข้ากับการค้นหาและการอ้างอิงที่เหนือกว่า

  • gemini-3-pro-image-preview

    โมเดลการสร้างและแก้ไขรูปภาพที่ล้ำสมัย

  • gemini-3-pro-preview

    โมเดลที่ชาญฉลาดที่สุดของเราที่มีความสามารถในการให้เหตุผลและการทำความเข้าใจข้อมูลหลายรูปแบบที่ล้ำสมัยที่สุด รวมถึงความสามารถในการเขียนโค้ดแบบเป็น Agent และ Vibe Coding ที่ทรงพลัง

  • gemini-3.1-pro-preview

    โมเดลการให้เหตุผล SOTA ล่าสุดของเราที่มีความลึกซึ้งและมีความแตกต่างอย่างที่ไม่เคยมีมาก่อน รวมถึงความสามารถในการทำความเข้าใจข้อมูลหลายรูปแบบและการเขียนโค้ดที่ทรงพลัง

  • gemini-3.1-flash-image-preview

    ความสามารถด้านภาพระดับมืออาชีพที่มีประสิทธิภาพระดับ Flash และความสามารถในการสร้างที่อิงตามความเป็นจริง

  • gemini-3.1-flash-lite-preview

    โมเดลที่มีประสิทธิภาพด้านต้นทุนมากที่สุดของเรา ซึ่งได้รับการเพิ่มประสิทธิภาพสำหรับงานที่ต้องใช้ Agent จำนวนมาก การแปล และการประมวลผลข้อมูลอย่างง่าย

  • gemini-3.1-flash-tts-preview

    TTS ของ Gemini 3.1 Flash: การสร้างเสียงพูดที่ทรงพลังและมีเวลาในการตอบสนองต่ำ เพลิดเพลินกับเอาต์พุตที่เป็นธรรมชาติ พรอมต์ที่ควบคุมได้ และแท็กเสียงแบบใหม่ที่สื่ออารมณ์เพื่อการควบคุมการบรรยายที่แม่นยำ

  • lyria-3-clip-preview

    โมเดลการสร้างเพลงที่มีเวลาในการตอบสนองต่ำของเราได้รับการเพิ่มประสิทธิภาพสำหรับคลิปเสียงที่มีความละเอียดสูงและการควบคุมจังหวะที่แม่นยำ

  • lyria-3-pro-preview

    โมเดล Generative ขั้นสูงแบบเต็มเพลงของเรามีความเข้าใจด้านการเรียบเรียงเพลงอย่างลึกซึ้ง ซึ่งได้รับการเพิ่มประสิทธิภาพเพื่อการควบคุมโครงสร้างที่แม่นยำและการเปลี่ยนผ่านที่ซับซ้อนในสไตล์ดนตรีที่หลากหลาย

โมเดลที่จะเติมข้อความของคุณให้สมบูรณ์\n\nดูรายละเอียดเพิ่มเติมได้ที่ [models](https://ai.google.dev/gemini-api/docs/models)

agent AgentOption  (ไม่บังคับ)

ชื่อของ `Agent` ที่ใช้สร้างการโต้ตอบ

ค่าที่เป็นไปได้ มีดังนี้

  • deep-research-pro-preview-12-2025

    เอเจนต์ Deep Research ของ Gemini

  • deep-research-preview-04-2026

    เอเจนต์ Deep Research ของ Gemini

  • deep-research-max-preview-04-2026

    Gemini Deep Research Max Agent

Agent ที่จะโต้ตอบด้วย

id string  (ไม่บังคับ)

ต้องระบุ เอาต์พุตเท่านั้น ตัวระบุที่ไม่ซ้ำกันสำหรับการโต้ตอบที่เสร็จสมบูรณ์

status enum (string)  (ไม่บังคับ)

ต้องระบุ เอาต์พุตเท่านั้น สถานะของการโต้ตอบ

ค่าที่เป็นไปได้ มีดังนี้

  • in_progress
  • requires_action
  • completed
  • failed
  • cancelled
  • incomplete
created string  (ไม่บังคับ)

ต้องระบุ เอาต์พุตเท่านั้น เวลาที่สร้างคำตอบในรูปแบบ ISO 8601 (YYYY-MM-DDThh:mm:ssZ)

updated string  (ไม่บังคับ)

ต้องระบุ เอาต์พุตเท่านั้น เวลาที่อัปเดตคำตอบครั้งล่าสุดในรูปแบบ ISO 8601 (YYYY-MM-DDThh:mm:ssZ)

role string  (ไม่บังคับ)

เอาต์พุตเท่านั้น บทบาทของการโต้ตอบ

system_instruction string  (ไม่บังคับ)

คำสั่งของระบบสำหรับการโต้ตอบ

เครื่องมือ อาร์เรย์ (เครื่องมือ)  (ไม่บังคับ)

รายการการประกาศเครื่องมือที่โมเดลอาจเรียกใช้ระหว่างการโต้ตอบ

usage Usage  (ไม่บังคับ)

เอาต์พุตเท่านั้น สถิติการใช้โทเค็นของคำขอโต้ตอบ

สถิติการใช้โทเค็นของคำขอโต้ตอบ

ช่อง

total_input_tokens integer  (ไม่บังคับ)

จำนวนโทเค็นในพรอมต์ (บริบท)

input_tokens_by_modality ModalityTokens  (ไม่บังคับ)

รายละเอียดการใช้โทเค็นอินพุตตามรูปแบบ

จำนวนโทเค็นสำหรับรูปแบบการตอบกลับเดียว

ช่อง

modality ResponseModality  (ไม่บังคับ)

รูปแบบที่เชื่อมโยงกับจำนวนโทเค็น

ค่าที่เป็นไปได้ มีดังนี้

  • text
  • image
  • audio
  • video
  • document

โทเค็น จำนวนเต็ม  (ไม่บังคับ)

จำนวนโทเค็นสำหรับรูปแบบ

total_cached_tokens integer  (ไม่บังคับ)

จํานวนโทเค็นในส่วนที่แคชของพรอมต์ (เนื้อหาที่แคช)

cached_tokens_by_modality ModalityTokens  (ไม่บังคับ)

รายละเอียดการใช้โทเค็นที่แคชไว้ตามรูปแบบ

จำนวนโทเค็นสำหรับรูปแบบการตอบกลับเดียว

ช่อง

modality ResponseModality  (ไม่บังคับ)

รูปแบบที่เชื่อมโยงกับจำนวนโทเค็น

ค่าที่เป็นไปได้ มีดังนี้

  • text
  • image
  • audio
  • video
  • document

โทเค็น จำนวนเต็ม  (ไม่บังคับ)

จำนวนโทเค็นสำหรับรูปแบบ

total_output_tokens integer  (ไม่บังคับ)

จำนวนโทเค็นทั้งหมดในการตอบกลับที่สร้างขึ้นทั้งหมด

output_tokens_by_modality ModalityTokens  (ไม่บังคับ)

รายละเอียดการใช้โทเค็นเอาต์พุตตามรูปแบบ

จำนวนโทเค็นสำหรับรูปแบบการตอบกลับเดียว

ช่อง

modality ResponseModality  (ไม่บังคับ)

รูปแบบที่เชื่อมโยงกับจำนวนโทเค็น

ค่าที่เป็นไปได้ มีดังนี้

  • text
  • image
  • audio
  • video
  • document

โทเค็น จำนวนเต็ม  (ไม่บังคับ)

จำนวนโทเค็นสำหรับรูปแบบ

total_tool_use_tokens integer  (ไม่บังคับ)

จำนวนโทเค็นที่อยู่ในพรอมต์การใช้เครื่องมือ

tool_use_tokens_by_modality ModalityTokens  (ไม่บังคับ)

รายละเอียดการใช้โทเค็นการใช้เครื่องมือตามรูปแบบ

จำนวนโทเค็นสำหรับรูปแบบการตอบกลับเดียว

ช่อง

modality ResponseModality  (ไม่บังคับ)

รูปแบบที่เชื่อมโยงกับจำนวนโทเค็น

ค่าที่เป็นไปได้ มีดังนี้

  • text
  • image
  • audio
  • video
  • document

โทเค็น จำนวนเต็ม  (ไม่บังคับ)

จำนวนโทเค็นสำหรับรูปแบบ

total_thought_tokens integer  (ไม่บังคับ)

จำนวนโทเค็นของความคิดสำหรับโมเดลการคิด

total_tokens integer  (ไม่บังคับ)

จำนวนโทเค็นทั้งหมดสำหรับคำขอการโต้ตอบ (พรอมต์ + คำตอบ + โทเค็นภายในอื่นๆ )

grounding_tool_count GroundingToolCount  (ไม่บังคับ)

จำนวนเครื่องมือที่ต่อสายดิน

จำนวนเครื่องมือต่อสายดิน

ช่อง

ประเภท enum (สตริง)  (ไม่บังคับ)

ประเภทเครื่องมือการอ้างอิงที่เชื่อมโยงกับจำนวน

ค่าที่เป็นไปได้ มีดังนี้

  • google_search
  • google_maps
  • retrieval
count integer  (ไม่บังคับ)

จำนวนเครื่องมือต่อสายดิน

response_modalities ResponseModality  (ไม่บังคับ)

รูปแบบคำตอบที่ขอ (TEXT, IMAGE, AUDIO)

ค่าที่เป็นไปได้ มีดังนี้

  • text
  • image
  • audio
  • video
  • document

response_mime_type string  (ไม่บังคับ)

ประเภท MIME ของการตอบกลับ ต้องระบุหากตั้งค่า response_format

previous_interaction_id string  (ไม่บังคับ)

รหัสของการโต้ตอบก่อนหน้า (หากมี)

service_tier ServiceTier  (ไม่บังคับ)

ระดับบริการสำหรับการโต้ตอบ

ค่าที่เป็นไปได้ มีดังนี้

  • flex
  • standard
  • priority

webhook_config WebhookConfig  (ไม่บังคับ)

ไม่บังคับ การกำหนดค่าเว็บฮุคสำหรับการรับการแจ้งเตือนเมื่อการโต้ตอบเสร็จสมบูรณ์

ข้อความสําหรับการกําหนดค่าเหตุการณ์เว็บฮุคสําหรับคําขอ

ช่อง

uris อาร์เรย์ (สตริง)  (ไม่บังคับ)

ไม่บังคับ หากตั้งค่าไว้ ระบบจะใช้ URI ของเว็บฮุคเหล่านี้สำหรับเหตุการณ์เว็บฮุคแทน เว็บฮุคที่ลงทะเบียน

user_metadata object  (ไม่บังคับ)

ไม่บังคับ ข้อมูลเมตาของผู้ใช้ที่จะแสดงในแต่ละการส่งเหตุการณ์ไปยัง Webhook

ขั้นตอน ขั้นตอน  (ไม่บังคับ)

เอาต์พุตเท่านั้น ขั้นตอนที่ประกอบกันเป็นการโต้ตอบ

ขั้นตอนในการโต้ตอบ

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบ Polymorphic: type

UserInputStep

ข้อมูลที่ผู้ใช้ระบุ

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "user_input" เสมอ

เนื้อหา อาร์เรย์ (เนื้อหา)  (ไม่บังคับ)

ไม่มีคำอธิบาย

ModelOutputStep

เอาต์พุตที่โมเดลสร้างขึ้น

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "model_output" เสมอ

เนื้อหา อาร์เรย์ (เนื้อหา)  (ไม่บังคับ)

ไม่มีคำอธิบาย

ThoughtStep

ขั้นตอนการคิด

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "thought" เสมอ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

summary ThoughtSummaryContent  (ไม่บังคับ)

สรุปความคิด

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบ Polymorphic: type

TextContent

บล็อกเนื้อหาข้อความ

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "text" เสมอ

ข้อความ สตริง  (ต้องระบุ)

ต้องระบุ เนื้อหาข้อความ

annotations Annotation  (ไม่บังคับ)

ข้อมูลการอ้างอิงสำหรับเนื้อหาที่โมเดลสร้างขึ้น

ข้อมูลการอ้างอิงสำหรับเนื้อหาที่โมเดลสร้างขึ้น

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบ Polymorphic: type

UrlCitation

คำอธิบายประกอบการอ้างอิง URL

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "url_citation" เสมอ

url string  (ไม่บังคับ)

URL

title string  (ไม่บังคับ)

ชื่อของ URL

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

FileCitation

คำอธิบายประกอบการอ้างอิงไฟล์

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "file_citation" เสมอ

document_uri string  (ไม่บังคับ)

URI ของไฟล์

file_name string  (ไม่บังคับ)

ชื่อไฟล์

แหล่งที่มา สตริง  (ไม่บังคับ)

แหล่งที่มาที่ระบุสำหรับข้อความบางส่วน

custom_metadata object  (ไม่บังคับ)

ข้อมูลเมตาที่ผู้ใช้ระบุเกี่ยวกับบริบทที่ดึงมา

page_number integer  (ไม่บังคับ)

หมายเลขหน้าของเอกสารที่อ้างอิง (หากมี)

media_id string  (ไม่บังคับ)

รหัสสื่อในกรณีที่มีการอ้างอิงรูปภาพ (หากมี)

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

PlaceCitation

คำอธิบายประกอบการอ้างอิงสถานที่

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "place_citation" เสมอ

place_id string  (ไม่บังคับ)

รหัสของสถานที่ในรูปแบบ `places/{place_id}`

name string  (ไม่บังคับ)

ชื่อสถานที่

url string  (ไม่บังคับ)

การอ้างอิง URI ของสถานที่

review_snippets ReviewSnippet  (ไม่บังคับ)

ข้อมูลรีวิวที่ใช้ในการสร้างคำตอบเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps

แคปซูลข้อมูลรีวิวของผู้ใช้ที่ตอบคำถามเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps

ช่อง

title string  (ไม่บังคับ)

ชื่อของรีวิว

url string  (ไม่บังคับ)

ลิงก์ที่สอดคล้องกับรีวิวของผู้ใช้ใน Google Maps

review_id string  (ไม่บังคับ)

รหัสของตัวอย่างรีวิว

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

ImageContent

บล็อกเนื้อหารูปภาพ

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "image" เสมอ

data string  (ไม่บังคับ)

เนื้อหารูปภาพ

uri สตริง  (ไม่บังคับ)

URI ของรูปภาพ

mime_type enum (string)  (ไม่บังคับ)

ประเภท MIME ของรูปภาพ

ค่าที่เป็นไปได้ มีดังนี้

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
  • image/gif
  • image/bmp
  • image/tiff
resolution MediaResolution  (ไม่บังคับ)

ความละเอียดของสื่อ

ค่าที่เป็นไปได้ มีดังนี้

  • low
  • medium
  • high
  • ultra_high

FunctionCallStep

ขั้นตอนการเรียกใช้เครื่องมือฟังก์ชัน

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "function_call" เสมอ

name string  (ต้องระบุ)

ต้องระบุ ชื่อของเครื่องมือที่จะเรียกใช้

อาร์กิวเมนต์ object  (ต้องระบุ)

ต้องระบุ อาร์กิวเมนต์ที่จะส่งไปยังฟังก์ชัน

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

CodeExecutionCallStep

ขั้นตอนการเรียกใช้โค้ด

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "code_execution_call" เสมอ

arguments CodeExecutionCallStepArguments  (ต้องระบุ)

ต้องระบุ อาร์กิวเมนต์ที่จะส่งผ่านไปยังการเรียกใช้โค้ด

อาร์กิวเมนต์ที่จะส่งผ่านไปยังการเรียกใช้โค้ด

ช่อง

language enum (string)  (ไม่บังคับ)

ภาษาโปรแกรมของ `code`

ค่าที่เป็นไปได้ มีดังนี้

  • python
รหัส สตริง  (ไม่บังคับ)

โค้ดที่จะดำเนินการ

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

UrlContextCallStep

ขั้นตอนการเรียกบริบท URL

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "url_context_call" เสมอ

arguments UrlContextCallStepArguments  (required)

ต้องระบุ อาร์กิวเมนต์ที่จะส่งไปยังบริบท URL

อาร์กิวเมนต์ที่จะส่งไปยังบริบท URL

ช่อง

urls array (string)  (ไม่บังคับ)

URL ที่จะดึงข้อมูล

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

McpServerToolCallStep

ขั้นตอนการเรียกใช้เครื่องมือ MCPServer

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "mcp_server_tool_call" เสมอ

name string  (ต้องระบุ)

ต้องระบุ ชื่อของเครื่องมือที่เรียกใช้

server_name string  (ต้องระบุ)

ต้องระบุ ชื่อเซิร์ฟเวอร์ MCP ที่ใช้

อาร์กิวเมนต์ object  (ต้องระบุ)

ต้องระบุ ออบเจ็กต์ JSON ของอาร์กิวเมนต์สำหรับฟังก์ชัน

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

GoogleSearchCallStep

ขั้นตอนการโทรของ Google Search

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "google_search_call" เสมอ

arguments GoogleSearchCallStepArguments  (ต้องระบุ)

ต้องระบุ อาร์กิวเมนต์ที่จะส่งไปยัง Google Search

อาร์กิวเมนต์ที่จะส่งไปยัง Google Search

ช่อง

queries อาร์เรย์ (สตริง)  (ไม่บังคับ)

คำค้นหาใน Web Search สำหรับการค้นหาเว็บเพิ่มเติม

search_type enum (string)  (ไม่บังคับ)

ประเภทการอ้างอิงการค้นหาที่เปิดใช้

ค่าที่เป็นไปได้ มีดังนี้

  • web_search
  • image_search
  • enterprise_web_search
id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

FileSearchCallStep

ขั้นตอนการเรียกใช้การค้นหาไฟล์

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "file_search_call" เสมอ

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

GoogleMapsCallStep

ขั้นตอนการโทรของ Google Maps

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "google_maps_call" เสมอ

arguments GoogleMapsCallStepArguments  (ไม่บังคับ)

อาร์กิวเมนต์ที่จะส่งไปยังเครื่องมือ Google Maps

อาร์กิวเมนต์ที่จะส่งไปยังเครื่องมือ Google Maps

ช่อง

queries อาร์เรย์ (สตริง)  (ไม่บังคับ)

คำค้นหาที่จะดำเนินการ

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

FunctionResultStep

ผลลัพธ์ของการเรียกใช้เครื่องมือฟังก์ชัน

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "function_result" เสมอ

name string  (ไม่บังคับ)

ชื่อของเครื่องมือที่เรียกใช้

is_error boolean  (ไม่บังคับ)

การเรียกใช้เครื่องมือทำให้เกิดข้อผิดพลาดหรือไม่

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

result array (FunctionResultSubcontent) หรือสตริง  (ต้องระบุ)

ผลลัพธ์ของการเรียกใช้เครื่องมือ

CodeExecutionResultStep

ขั้นตอนผลการรันโค้ด

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "code_execution_result" เสมอ

result string  (ต้องระบุ)

ต้องระบุ เอาต์พุตของการเรียกใช้โค้ด

is_error boolean  (ไม่บังคับ)

การดำเนินการโค้ดส่งผลให้เกิดข้อผิดพลาดหรือไม่

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

UrlContextResultStep

ขั้นตอนผลลัพธ์บริบท URL

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "url_context_result" เสมอ

result UrlContextResultItem  (ต้องระบุ)

ต้องระบุ ผลลัพธ์ของบริบท URL

ผลลัพธ์ของบริบท URL

ช่อง

url string  (ไม่บังคับ)

URL ที่ดึงข้อมูล

status enum (string)  (ไม่บังคับ)

สถานะของการดึงข้อมูล URL

ค่าที่เป็นไปได้ มีดังนี้

  • success
  • error
  • paywall
  • unsafe
is_error boolean  (ไม่บังคับ)

ไม่ว่าบริบท URL จะทำให้เกิดข้อผิดพลาดหรือไม่

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

GoogleSearchResultStep

ขั้นตอนผลการค้นหาของ Google Search

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "google_search_result" เสมอ

result GoogleSearchResultItem  (ต้องระบุ)

ต้องระบุ ผลการค้นหาของ Google Search

ผลการค้นหาของ Google Search

ช่อง

search_suggestions string  (ไม่บังคับ)

ข้อมูลโค้ดเนื้อหาเว็บที่ฝังในหน้าเว็บหรือ WebView ของแอปได้

is_error boolean  (ไม่บังคับ)

ไม่ว่า Google Search จะทำให้เกิดข้อผิดพลาดหรือไม่

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

McpServerToolResultStep

ขั้นตอนผลลัพธ์ของเครื่องมือ MCPServer

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "mcp_server_tool_result" เสมอ

name string  (ไม่บังคับ)

ชื่อของเครื่องมือที่เรียกใช้สำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

server_name string  (ไม่บังคับ)

ชื่อเซิร์ฟเวอร์ MCP ที่ใช้

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

result array (FunctionResultSubcontent) หรือสตริง  (ต้องระบุ)

เอาต์พุตจากการเรียกเซิร์ฟเวอร์ MCP อาจเป็นข้อความธรรมดาหรือข้อมูลอย่างละเอียด

FileSearchResultStep

ขั้นตอนผลการค้นหาไฟล์

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "file_search_result" เสมอ

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

GoogleMapsResultStep

ขั้นตอนผลลัพธ์ของ Google Maps

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "google_maps_result" เสมอ

result GoogleMapsResultItem  (ต้องระบุ)

ไม่มีคำอธิบาย

ผลลัพธ์ของ Google Maps

ช่อง

places GoogleMapsResultPlaces  (ไม่บังคับ)

ไม่มีคำอธิบาย

ช่อง

place_id string  (ไม่บังคับ)

ไม่มีคำอธิบาย

name string  (ไม่บังคับ)

ไม่มีคำอธิบาย

url string  (ไม่บังคับ)

ไม่มีคำอธิบาย

review_snippets ReviewSnippet  (ไม่บังคับ)

ไม่มีคำอธิบาย

แคปซูลข้อมูลรีวิวของผู้ใช้ที่ตอบคำถามเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps

ช่อง

title string  (ไม่บังคับ)

ชื่อของรีวิว

url string  (ไม่บังคับ)

ลิงก์ที่สอดคล้องกับรีวิวของผู้ใช้ใน Google Maps

review_id string  (ไม่บังคับ)

รหัสของตัวอย่างรีวิว

widget_context_token string  (ไม่บังคับ)

ไม่มีคำอธิบาย

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

อินพุต เนื้อหาหรืออาร์เรย์ (เนื้อหา) หรืออาร์เรย์ (ขั้นตอน) หรือสตริง  (ไม่บังคับ)

อินพุตสำหรับการโต้ตอบ

response_format ResponseFormat หรือ ResponseFormatList  (ไม่บังคับ)

บังคับให้การตอบกลับที่สร้างขึ้นเป็นออบเจ็กต์ JSON ที่เป็นไปตามสคีมา JSON ที่ระบุในฟิลด์นี้

agent_config object  (ไม่บังคับ)

พารามิเตอร์การกำหนดค่าสำหรับการโต้ตอบของตัวแทน

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบ Polymorphic: type

DynamicAgentConfig

การกำหนดค่าสำหรับเอเจนต์แบบไดนามิก

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "dynamic" เสมอ

DeepResearchAgentConfig

การกำหนดค่าสำหรับตัวแทน Deep Research

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "deep-research" เสมอ

thinking_summaries ThinkingSummaries  (ไม่บังคับ)

จะรวมสรุปความคิดในคำตอบหรือไม่

ค่าที่เป็นไปได้ มีดังนี้

  • auto
  • none

visualization enum (string)  (ไม่บังคับ)

รวมภาพข้อมูลในการตอบกลับไหม

ค่าที่เป็นไปได้ มีดังนี้

  • off
  • auto
collaborative_planning boolean  (ไม่บังคับ)

ช่วยให้การวางแผนแบบมีมนุษย์เป็นผู้ควบคุมสำหรับตัวแทน Deep Research หากตั้งค่าเป็น true ตัวแทน Deep Research จะระบุแผนการค้นคว้าข้อมูลในการตอบกลับ จากนั้นเอเจนต์จะดำเนินการต่อก็ต่อเมื่อผู้ใช้ยืนยันแผนในเทิร์นถัดไป

ตัวอย่าง

ตัวอย่าง

{
  "created": "2025-12-04T15:01:45Z",
  "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg",
  "model": "gemini-3-flash-preview",
  "object": "interaction",
  "steps": [
    {
      "type": "model_output",
      "content": [
        {
          "type": "text",
          "text": "Hello! I'm doing well, functioning as expected. Thank you for asking! How are you doing today?"
        }
      ]
    }
  ],
  "status": "completed",
  "updated": "2025-12-04T15:01:45Z",
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 7
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 7,
    "total_output_tokens": 23,
    "total_thought_tokens": 49,
    "total_tokens": 79,
    "total_tool_use_tokens": 0
  }
}

โมเดลข้อมูล

เนื้อหา

เนื้อหาของการตอบกลับ

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบ Polymorphic: type

TextContent

บล็อกเนื้อหาข้อความ

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "text" เสมอ

ข้อความ สตริง  (ต้องระบุ)

ต้องระบุ เนื้อหาข้อความ

annotations Annotation  (ไม่บังคับ)

ข้อมูลการอ้างอิงสำหรับเนื้อหาที่โมเดลสร้างขึ้น

ข้อมูลการอ้างอิงสำหรับเนื้อหาที่โมเดลสร้างขึ้น

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบ Polymorphic: type

UrlCitation

คำอธิบายประกอบการอ้างอิง URL

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "url_citation" เสมอ

url string  (ไม่บังคับ)

URL

title string  (ไม่บังคับ)

ชื่อของ URL

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

FileCitation

คำอธิบายประกอบการอ้างอิงไฟล์

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "file_citation" เสมอ

document_uri string  (ไม่บังคับ)

URI ของไฟล์

file_name string  (ไม่บังคับ)

ชื่อไฟล์

แหล่งที่มา สตริง  (ไม่บังคับ)

แหล่งที่มาที่ระบุสำหรับข้อความบางส่วน

custom_metadata object  (ไม่บังคับ)

ข้อมูลเมตาที่ผู้ใช้ระบุเกี่ยวกับบริบทที่ดึงมา

page_number integer  (ไม่บังคับ)

หมายเลขหน้าของเอกสารที่อ้างอิง (หากมี)

media_id string  (ไม่บังคับ)

รหัสสื่อในกรณีที่มีการอ้างอิงรูปภาพ (หากมี)

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

PlaceCitation

คำอธิบายประกอบการอ้างอิงสถานที่

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "place_citation" เสมอ

place_id string  (ไม่บังคับ)

รหัสของสถานที่ในรูปแบบ `places/{place_id}`

name string  (ไม่บังคับ)

ชื่อสถานที่

url string  (ไม่บังคับ)

การอ้างอิง URI ของสถานที่

review_snippets ReviewSnippet  (ไม่บังคับ)

ข้อมูลรีวิวที่ใช้ในการสร้างคำตอบเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps

แคปซูลข้อมูลรีวิวของผู้ใช้ที่ตอบคำถามเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps

ช่อง

title string  (ไม่บังคับ)

ชื่อของรีวิว

url string  (ไม่บังคับ)

ลิงก์ที่สอดคล้องกับรีวิวของผู้ใช้ใน Google Maps

review_id string  (ไม่บังคับ)

รหัสของตัวอย่างรีวิว

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

ImageContent

บล็อกเนื้อหารูปภาพ

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "image" เสมอ

data string  (ไม่บังคับ)

เนื้อหารูปภาพ

uri สตริง  (ไม่บังคับ)

URI ของรูปภาพ

mime_type enum (string)  (ไม่บังคับ)

ประเภท MIME ของรูปภาพ

ค่าที่เป็นไปได้ มีดังนี้

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
  • image/gif
  • image/bmp
  • image/tiff
resolution MediaResolution  (ไม่บังคับ)

ความละเอียดของสื่อ

ค่าที่เป็นไปได้ มีดังนี้

  • low
  • medium
  • high
  • ultra_high

AudioContent

บล็อกเนื้อหาเสียง

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "audio" เสมอ

data string  (ไม่บังคับ)

เนื้อหาเสียง

uri สตริง  (ไม่บังคับ)

URI ของเสียง

mime_type enum (string)  (ไม่บังคับ)

ประเภท MIME ของเสียง

ค่าที่เป็นไปได้ มีดังนี้

  • audio/wav
  • audio/mp3
  • audio/aiff
  • audio/aac
  • audio/ogg
  • audio/flac
  • audio/mpeg
  • audio/m4a
  • audio/l16
  • audio/opus
  • audio/alaw
  • audio/mulaw
channels integer  (ไม่บังคับ)

จำนวนช่องเสียง

sample_rate integer  (ไม่บังคับ)

อัตราการสุ่มตัวอย่างของเสียง

DocumentContent

บล็อกเนื้อหาของเอกสาร

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "document" เสมอ

data string  (ไม่บังคับ)

เนื้อหาเอกสาร

uri สตริง  (ไม่บังคับ)

URI ของเอกสาร

mime_type enum (string)  (ไม่บังคับ)

ประเภท MIME ของเอกสาร

ค่าที่เป็นไปได้ มีดังนี้

  • application/pdf
VideoContent

บล็อกเนื้อหาวิดีโอ

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "video" เสมอ

data string  (ไม่บังคับ)

เนื้อหาวิดีโอ

uri สตริง  (ไม่บังคับ)

URI ของวิดีโอ

mime_type enum (string)  (ไม่บังคับ)

ประเภท MIME ของวิดีโอ

ค่าที่เป็นไปได้ มีดังนี้

  • video/mp4
  • video/mpeg
  • video/mpg
  • video/mov
  • video/avi
  • video/x-flv
  • video/webm
  • video/wmv
  • video/3gpp
resolution MediaResolution  (ไม่บังคับ)

ความละเอียดของสื่อ

ค่าที่เป็นไปได้ มีดังนี้

  • low
  • medium
  • high
  • ultra_high

ตัวอย่าง

ข้อความ

{
  "type": "text",
  "text": "Hello, how are you?"
}

รูปภาพ

{
  "type": "image",
  "data": "BASE64_ENCODED_IMAGE",
  "mime_type": "image/png"
}

เสียง

{
  "type": "audio",
  "data": "BASE64_ENCODED_AUDIO",
  "mime_type": "audio/wav"
}

เอกสาร

{
  "type": "document",
  "data": "BASE64_ENCODED_DOCUMENT",
  "mime_type": "application/pdf"
}

วิดีโอ

{
  "type": "video",
  "uri": "https://www.youtube.com/watch?v=9hE5-98ZeCg"
}

เครื่องมือ

เครื่องมือที่โมเดลใช้ได้

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบ Polymorphic: type

ฟังก์ชัน

เครื่องมือที่โมเดลใช้ได้

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "function" เสมอ

name string  (ไม่บังคับ)

ชื่อฟังก์ชัน

description string  (ไม่บังคับ)

คำอธิบายฟังก์ชัน

พารามิเตอร์ ออบเจ็กต์  (ไม่บังคับ)

สคีมา JSON สำหรับพารามิเตอร์ของฟังก์ชัน

CodeExecution

เครื่องมือที่โมเดลใช้ดำเนินการกับโค้ดได้

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "code_execution" เสมอ

UrlContext

เครื่องมือที่โมเดลใช้เพื่อดึงบริบท URL ได้

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "url_context" เสมอ

ComputerUse

เครื่องมือที่โมเดลใช้โต้ตอบกับคอมพิวเตอร์ได้

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "computer_use" เสมอ

environment enum (string)  (ไม่บังคับ)

สภาพแวดล้อมที่ดำเนินการ

ค่าที่เป็นไปได้ มีดังนี้

  • browser
excluded_predefined_functions array (string)  (ไม่บังคับ)

รายการฟังก์ชันที่กำหนดไว้ล่วงหน้าซึ่งยกเว้นจากการเรียกโมเดล

McpServer

MCPServer คือเซิร์ฟเวอร์ที่โมเดลเรียกใช้เพื่อดำเนินการได้

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "mcp_server" เสมอ

name string  (ไม่บังคับ)

ชื่อของ MCPServer

url string  (ไม่บังคับ)

URL แบบเต็มสำหรับปลายทาง MCPServer ตัวอย่างเช่น "https://api.example.com/mcp"

ส่วนหัว ออบเจ็กต์  (ไม่บังคับ)

ไม่บังคับ: ช่องสำหรับส่วนหัวการตรวจสอบสิทธิ์ การหมดเวลา ฯลฯ หากจำเป็น

allowed_tools AllowedTools  (ไม่บังคับ)

เครื่องมือที่อนุญาต

การกำหนดค่าสำหรับเครื่องมือที่อนุญาต

ช่อง

mode ToolChoiceType  (ไม่บังคับ)

โหมดการเลือกเครื่องมือ

ค่าที่เป็นไปได้ มีดังนี้

  • auto
  • any
  • none
  • validated

เครื่องมือ อาร์เรย์ (สตริง)  (ไม่บังคับ)

ชื่อของเครื่องมือที่อนุญาต

GoogleSearch

เครื่องมือที่โมเดลใช้ค้นหาใน Google ได้

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "google_search" เสมอ

search_types array (enum (string))  (ไม่บังคับ)

ประเภทของการอ้างอิงการค้นหาที่จะเปิดใช้

ค่าที่เป็นไปได้ มีดังนี้

  • web_search
  • image_search
  • enterprise_web_search
FileSearch

เครื่องมือที่โมเดลใช้ค้นหาไฟล์ได้

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "file_search" เสมอ

file_search_store_names array (string)  (ไม่บังคับ)

ไฟล์จะจัดเก็บชื่อที่ใช้ค้นหา

top_k integer  (ไม่บังคับ)

จำนวนกลุ่มการดึงข้อมูลเชิงความหมายที่จะดึงข้อมูล

metadata_filter string  (ไม่บังคับ)

ตัวกรองข้อมูลเมตาที่จะใช้กับเอกสารและการแบ่งกลุ่มการดึงข้อมูลเชิงความหมาย

GoogleMaps

เครื่องมือที่โมเดลใช้เรียก Google Maps ได้

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "google_maps" เสมอ

enable_widget boolean  (ไม่บังคับ)

ระบุว่าจะแสดงโทเค็นบริบทของวิดเจ็ตในผลการเรียกใช้เครื่องมือของ การตอบกลับหรือไม่

latitude number  (ไม่บังคับ)

ละติจูดของตำแหน่งของผู้ใช้

longitude number  (ไม่บังคับ)

ลองจิจูดของตำแหน่งของผู้ใช้

การดึงข้อมูล

เครื่องมือที่โมเดลใช้เพื่อดึงข้อมูลไฟล์

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "retrieval" เสมอ

retrieval_types array (enum (string))  (ไม่บังคับ)

ประเภทการดึงข้อมูลไฟล์ที่จะเปิดใช้

ค่าที่เป็นไปได้ มีดังนี้

  • vertex_ai_search
vertex_ai_search_config VertexAISearchConfig  (ไม่บังคับ)

ใช้เพื่อระบุการกำหนดค่าสำหรับ VertexAISearch

ใช้เพื่อระบุการกำหนดค่าสำหรับ VertexAISearch

ช่อง

engine string  (ไม่บังคับ)

ไม่บังคับ ใช้เพื่อระบุ Vertex AI Search

datastores อาร์เรย์ (สตริง)  (ไม่บังคับ)

ไม่บังคับ ใช้เพื่อระบุพื้นที่เก็บข้อมูลของ Vertex AI Search

ตัวอย่าง

ฟังก์ชัน

CodeExecution

UrlContext

ComputerUse

McpServer

GoogleSearch

FileSearch

GoogleMaps

การดึงข้อมูล

ไม่มีตัวอย่างสำหรับประเภทนี้

InteractionSseEvent

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบ Polymorphic: event_type

InteractionCreatedEvent

event_type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "interaction.created" เสมอ

interaction Interaction  (ต้องระบุ)

ไม่มีคำอธิบาย

event_id string  (ไม่บังคับ)

โทเค็น event_id ที่จะใช้เพื่อดำเนินการต่อในสตรีมการโต้ตอบจากเหตุการณ์นี้

InteractionCompletedEvent

event_type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "interaction.completed" เสมอ

interaction Interaction  (ต้องระบุ)

ต้องระบุ การโต้ตอบที่เสร็จสมบูรณ์โดยมีเอาต์พุตว่างเปล่าเพื่อลดขนาดเพย์โหลด ใช้เหตุการณ์ ContentDelta ก่อนหน้าสำหรับเอาต์พุตจริง

event_id string  (ไม่บังคับ)

โทเค็น event_id ที่จะใช้เพื่อดำเนินการต่อในสตรีมการโต้ตอบจากเหตุการณ์นี้

InteractionStatusUpdate

event_type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "interaction.status_update" เสมอ

interaction_id string  (ต้องระบุ)

ไม่มีคำอธิบาย

สถานะ enum (string)  (ต้องระบุ)

ไม่มีคำอธิบาย

ค่าที่เป็นไปได้ มีดังนี้

  • in_progress
  • requires_action
  • completed
  • failed
  • cancelled
  • incomplete
event_id string  (ไม่บังคับ)

โทเค็น event_id ที่จะใช้เพื่อดำเนินการต่อในสตรีมการโต้ตอบจากเหตุการณ์นี้

ErrorEvent

event_type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "error" เสมอ

ข้อผิดพลาด ข้อผิดพลาด  (ไม่บังคับ)

ไม่มีคำอธิบาย

ข้อความแสดงข้อผิดพลาดจากการโต้ตอบ

ช่อง

รหัส สตริง  (ไม่บังคับ)

URI ที่ระบุประเภทข้อผิดพลาด

ข้อความ สตริง  (ไม่บังคับ)

ข้อความแสดงข้อผิดพลาดที่มนุษย์อ่านได้

event_id string  (ไม่บังคับ)

โทเค็น event_id ที่จะใช้เพื่อดำเนินการต่อในสตรีมการโต้ตอบจากเหตุการณ์นี้

StepStart

event_type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "step.start" เสมอ

index integer  (ต้องระบุ)

ไม่มีคำอธิบาย

step Step  (ต้องระบุ)

ไม่มีคำอธิบาย

ขั้นตอนในการโต้ตอบ

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบ Polymorphic: type

UserInputStep

ข้อมูลที่ผู้ใช้ระบุ

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "user_input" เสมอ

เนื้อหา อาร์เรย์ (เนื้อหา)  (ไม่บังคับ)

ไม่มีคำอธิบาย

ModelOutputStep

เอาต์พุตที่โมเดลสร้างขึ้น

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "model_output" เสมอ

เนื้อหา อาร์เรย์ (เนื้อหา)  (ไม่บังคับ)

ไม่มีคำอธิบาย

ThoughtStep

ขั้นตอนการคิด

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "thought" เสมอ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

summary ThoughtSummaryContent  (ไม่บังคับ)

สรุปความคิด

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบ Polymorphic: type

TextContent

บล็อกเนื้อหาข้อความ

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "text" เสมอ

ข้อความ สตริง  (ต้องระบุ)

ต้องระบุ เนื้อหาข้อความ

annotations Annotation  (ไม่บังคับ)

ข้อมูลการอ้างอิงสำหรับเนื้อหาที่โมเดลสร้างขึ้น

ข้อมูลการอ้างอิงสำหรับเนื้อหาที่โมเดลสร้างขึ้น

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบ Polymorphic: type

UrlCitation

คำอธิบายประกอบการอ้างอิง URL

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "url_citation" เสมอ

url string  (ไม่บังคับ)

URL

title string  (ไม่บังคับ)

ชื่อของ URL

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

FileCitation

คำอธิบายประกอบการอ้างอิงไฟล์

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "file_citation" เสมอ

document_uri string  (ไม่บังคับ)

URI ของไฟล์

file_name string  (ไม่บังคับ)

ชื่อไฟล์

แหล่งที่มา สตริง  (ไม่บังคับ)

แหล่งที่มาที่ระบุสำหรับข้อความบางส่วน

custom_metadata object  (ไม่บังคับ)

ข้อมูลเมตาที่ผู้ใช้ระบุเกี่ยวกับบริบทที่ดึงมา

page_number integer  (ไม่บังคับ)

หมายเลขหน้าของเอกสารที่อ้างอิง (หากมี)

media_id string  (ไม่บังคับ)

รหัสสื่อในกรณีที่มีการอ้างอิงรูปภาพ (หากมี)

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

PlaceCitation

คำอธิบายประกอบการอ้างอิงสถานที่

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "place_citation" เสมอ

place_id string  (ไม่บังคับ)

รหัสของสถานที่ในรูปแบบ `places/{place_id}`

name string  (ไม่บังคับ)

ชื่อสถานที่

url string  (ไม่บังคับ)

การอ้างอิง URI ของสถานที่

review_snippets ReviewSnippet  (ไม่บังคับ)

ข้อมูลรีวิวที่ใช้ในการสร้างคำตอบเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps

แคปซูลข้อมูลรีวิวของผู้ใช้ที่ตอบคำถามเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps

ช่อง

title string  (ไม่บังคับ)

ชื่อของรีวิว

url string  (ไม่บังคับ)

ลิงก์ที่สอดคล้องกับรีวิวของผู้ใช้ใน Google Maps

review_id string  (ไม่บังคับ)

รหัสของตัวอย่างรีวิว

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

ImageContent

บล็อกเนื้อหารูปภาพ

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "image" เสมอ

data string  (ไม่บังคับ)

เนื้อหารูปภาพ

uri สตริง  (ไม่บังคับ)

URI ของรูปภาพ

mime_type enum (string)  (ไม่บังคับ)

ประเภท MIME ของรูปภาพ

ค่าที่เป็นไปได้ มีดังนี้

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
  • image/gif
  • image/bmp
  • image/tiff
resolution MediaResolution  (ไม่บังคับ)

ความละเอียดของสื่อ

ค่าที่เป็นไปได้ มีดังนี้

  • low
  • medium
  • high
  • ultra_high

FunctionCallStep

ขั้นตอนการเรียกใช้เครื่องมือฟังก์ชัน

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "function_call" เสมอ

name string  (ต้องระบุ)

ต้องระบุ ชื่อของเครื่องมือที่จะเรียกใช้

อาร์กิวเมนต์ object  (ต้องระบุ)

ต้องระบุ อาร์กิวเมนต์ที่จะส่งไปยังฟังก์ชัน

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

CodeExecutionCallStep

ขั้นตอนการเรียกใช้โค้ด

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "code_execution_call" เสมอ

arguments CodeExecutionCallStepArguments  (ต้องระบุ)

ต้องระบุ อาร์กิวเมนต์ที่จะส่งผ่านไปยังการเรียกใช้โค้ด

อาร์กิวเมนต์ที่จะส่งผ่านไปยังการเรียกใช้โค้ด

ช่อง

language enum (string)  (ไม่บังคับ)

ภาษาโปรแกรมของ `code`

ค่าที่เป็นไปได้ มีดังนี้

  • python
รหัส สตริง  (ไม่บังคับ)

โค้ดที่จะดำเนินการ

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

UrlContextCallStep

ขั้นตอนการเรียกบริบท URL

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "url_context_call" เสมอ

arguments UrlContextCallStepArguments  (required)

ต้องระบุ อาร์กิวเมนต์ที่จะส่งไปยังบริบท URL

อาร์กิวเมนต์ที่จะส่งไปยังบริบท URL

ช่อง

urls array (string)  (ไม่บังคับ)

URL ที่จะดึงข้อมูล

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

McpServerToolCallStep

ขั้นตอนการเรียกใช้เครื่องมือ MCPServer

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "mcp_server_tool_call" เสมอ

name string  (ต้องระบุ)

ต้องระบุ ชื่อของเครื่องมือที่เรียกใช้

server_name string  (ต้องระบุ)

ต้องระบุ ชื่อเซิร์ฟเวอร์ MCP ที่ใช้

อาร์กิวเมนต์ object  (ต้องระบุ)

ต้องระบุ ออบเจ็กต์ JSON ของอาร์กิวเมนต์สำหรับฟังก์ชัน

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

GoogleSearchCallStep

ขั้นตอนการโทรของ Google Search

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "google_search_call" เสมอ

arguments GoogleSearchCallStepArguments  (ต้องระบุ)

ต้องระบุ อาร์กิวเมนต์ที่จะส่งไปยัง Google Search

อาร์กิวเมนต์ที่จะส่งไปยัง Google Search

ช่อง

queries อาร์เรย์ (สตริง)  (ไม่บังคับ)

คำค้นหาใน Web Search สำหรับการค้นหาเว็บเพิ่มเติม

search_type enum (string)  (ไม่บังคับ)

ประเภทการอ้างอิงการค้นหาที่เปิดใช้

ค่าที่เป็นไปได้ มีดังนี้

  • web_search
  • image_search
  • enterprise_web_search
id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

FileSearchCallStep

ขั้นตอนการเรียกใช้การค้นหาไฟล์

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "file_search_call" เสมอ

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

GoogleMapsCallStep

ขั้นตอนการโทรของ Google Maps

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "google_maps_call" เสมอ

arguments GoogleMapsCallStepArguments  (ไม่บังคับ)

อาร์กิวเมนต์ที่จะส่งไปยังเครื่องมือ Google Maps

อาร์กิวเมนต์ที่จะส่งไปยังเครื่องมือ Google Maps

ช่อง

queries อาร์เรย์ (สตริง)  (ไม่บังคับ)

คำค้นหาที่จะดำเนินการ

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

FunctionResultStep

ผลลัพธ์ของการเรียกใช้เครื่องมือฟังก์ชัน

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "function_result" เสมอ

name string  (ไม่บังคับ)

ชื่อของเครื่องมือที่เรียกใช้

is_error boolean  (ไม่บังคับ)

การเรียกใช้เครื่องมือทำให้เกิดข้อผิดพลาดหรือไม่

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

result array (FunctionResultSubcontent) หรือสตริง  (ต้องระบุ)

ผลลัพธ์ของการเรียกใช้เครื่องมือ

CodeExecutionResultStep

ขั้นตอนผลการรันโค้ด

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "code_execution_result" เสมอ

result string  (ต้องระบุ)

ต้องระบุ เอาต์พุตของการเรียกใช้โค้ด

is_error boolean  (ไม่บังคับ)

การดำเนินการโค้ดส่งผลให้เกิดข้อผิดพลาดหรือไม่

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

UrlContextResultStep

ขั้นตอนผลลัพธ์บริบท URL

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "url_context_result" เสมอ

result UrlContextResultItem  (ต้องระบุ)

ต้องระบุ ผลลัพธ์ของบริบท URL

ผลลัพธ์ของบริบท URL

ช่อง

url string  (ไม่บังคับ)

URL ที่ดึงข้อมูล

status enum (string)  (ไม่บังคับ)

สถานะของการดึงข้อมูล URL

ค่าที่เป็นไปได้ มีดังนี้

  • success
  • error
  • paywall
  • unsafe
is_error boolean  (ไม่บังคับ)

ไม่ว่าบริบท URL จะทำให้เกิดข้อผิดพลาดหรือไม่

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

GoogleSearchResultStep

ขั้นตอนผลการค้นหาของ Google Search

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "google_search_result" เสมอ

result GoogleSearchResultItem  (ต้องระบุ)

ต้องระบุ ผลการค้นหาของ Google Search

ผลการค้นหาของ Google Search

ช่อง

search_suggestions string  (ไม่บังคับ)

ข้อมูลโค้ดเนื้อหาเว็บที่ฝังในหน้าเว็บหรือ WebView ของแอปได้

is_error boolean  (ไม่บังคับ)

ไม่ว่า Google Search จะทำให้เกิดข้อผิดพลาดหรือไม่

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

McpServerToolResultStep

ขั้นตอนผลลัพธ์ของเครื่องมือ MCPServer

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "mcp_server_tool_result" เสมอ

name string  (ไม่บังคับ)

ชื่อของเครื่องมือที่เรียกใช้สำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

server_name string  (ไม่บังคับ)

ชื่อเซิร์ฟเวอร์ MCP ที่ใช้

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

result array (FunctionResultSubcontent) หรือสตริง  (ต้องระบุ)

เอาต์พุตจากการเรียกเซิร์ฟเวอร์ MCP อาจเป็นข้อความธรรมดาหรือข้อมูลอย่างละเอียด

FileSearchResultStep

ขั้นตอนผลการค้นหาไฟล์

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "file_search_result" เสมอ

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

GoogleMapsResultStep

ขั้นตอนผลลัพธ์ของ Google Maps

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "google_maps_result" เสมอ

result GoogleMapsResultItem  (ต้องระบุ)

ไม่มีคำอธิบาย

ผลลัพธ์ของ Google Maps

ช่อง

places GoogleMapsResultPlaces  (ไม่บังคับ)

ไม่มีคำอธิบาย

ช่อง

place_id string  (ไม่บังคับ)

ไม่มีคำอธิบาย

name string  (ไม่บังคับ)

ไม่มีคำอธิบาย

url string  (ไม่บังคับ)

ไม่มีคำอธิบาย

review_snippets ReviewSnippet  (ไม่บังคับ)

ไม่มีคำอธิบาย

แคปซูลข้อมูลรีวิวของผู้ใช้ที่ตอบคำถามเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps

ช่อง

title string  (ไม่บังคับ)

ชื่อของรีวิว

url string  (ไม่บังคับ)

ลิงก์ที่สอดคล้องกับรีวิวของผู้ใช้ใน Google Maps

review_id string  (ไม่บังคับ)

รหัสของตัวอย่างรีวิว

widget_context_token string  (ไม่บังคับ)

ไม่มีคำอธิบาย

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

event_id string  (ไม่บังคับ)

โทเค็น event_id ที่จะใช้เพื่อดำเนินการต่อในสตรีมการโต้ตอบจากเหตุการณ์นี้

StepDelta

event_type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "step.delta" เสมอ

index integer  (ต้องระบุ)

ไม่มีคำอธิบาย

delta StepDeltaData  (ต้องระบุ)

ไม่มีคำอธิบาย

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบ Polymorphic: type

TextDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "text" เสมอ

ข้อความ สตริง  (ต้องระบุ)

ไม่มีคำอธิบาย

ImageDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "image" เสมอ

data string  (ไม่บังคับ)

ไม่มีคำอธิบาย

uri สตริง  (ไม่บังคับ)

ไม่มีคำอธิบาย

mime_type enum (string)  (ไม่บังคับ)

ไม่มีคำอธิบาย

ค่าที่เป็นไปได้ มีดังนี้

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
  • image/gif
  • image/bmp
  • image/tiff
resolution MediaResolution  (ไม่บังคับ)

ความละเอียดของสื่อ

ค่าที่เป็นไปได้ มีดังนี้

  • low
  • medium
  • high
  • ultra_high

AudioDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "audio" เสมอ

data string  (ไม่บังคับ)

ไม่มีคำอธิบาย

uri สตริง  (ไม่บังคับ)

ไม่มีคำอธิบาย

mime_type enum (string)  (ไม่บังคับ)

ไม่มีคำอธิบาย

ค่าที่เป็นไปได้ มีดังนี้

  • audio/wav
  • audio/mp3
  • audio/aiff
  • audio/aac
  • audio/ogg
  • audio/flac
  • audio/mpeg
  • audio/m4a
  • audio/l16
  • audio/opus
  • audio/alaw
  • audio/mulaw
rate integer  (ไม่บังคับ)

เลิกใช้งานแล้ว โปรดใช้ sample_rate แทน ระบบจะไม่สนใจค่าดังกล่าว

sample_rate integer  (ไม่บังคับ)

อัตราการสุ่มตัวอย่างของเสียง

channels integer  (ไม่บังคับ)

จำนวนช่องเสียง

DocumentDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "document" เสมอ

data string  (ไม่บังคับ)

ไม่มีคำอธิบาย

uri สตริง  (ไม่บังคับ)

ไม่มีคำอธิบาย

mime_type enum (string)  (ไม่บังคับ)

ไม่มีคำอธิบาย

ค่าที่เป็นไปได้ มีดังนี้

  • application/pdf
VideoDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "video" เสมอ

data string  (ไม่บังคับ)

ไม่มีคำอธิบาย

uri สตริง  (ไม่บังคับ)

ไม่มีคำอธิบาย

mime_type enum (string)  (ไม่บังคับ)

ไม่มีคำอธิบาย

ค่าที่เป็นไปได้ มีดังนี้

  • video/mp4
  • video/mpeg
  • video/mpg
  • video/mov
  • video/avi
  • video/x-flv
  • video/webm
  • video/wmv
  • video/3gpp
resolution MediaResolution  (ไม่บังคับ)

ความละเอียดของสื่อ

ค่าที่เป็นไปได้ มีดังนี้

  • low
  • medium
  • high
  • ultra_high

ThoughtSummaryDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "thought_summary" เสมอ

content ThoughtSummaryContent  (ไม่บังคับ)

รายการสรุปใหม่ที่จะเพิ่มลงในความคิด

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบ Polymorphic: type

TextContent

บล็อกเนื้อหาข้อความ

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "text" เสมอ

ข้อความ สตริง  (ต้องระบุ)

ต้องระบุ เนื้อหาข้อความ

annotations Annotation  (ไม่บังคับ)

ข้อมูลการอ้างอิงสำหรับเนื้อหาที่โมเดลสร้างขึ้น

ข้อมูลการอ้างอิงสำหรับเนื้อหาที่โมเดลสร้างขึ้น

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบ Polymorphic: type

UrlCitation

คำอธิบายประกอบการอ้างอิง URL

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "url_citation" เสมอ

url string  (ไม่บังคับ)

URL

title string  (ไม่บังคับ)

ชื่อของ URL

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

FileCitation

คำอธิบายประกอบการอ้างอิงไฟล์

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "file_citation" เสมอ

document_uri string  (ไม่บังคับ)

URI ของไฟล์

file_name string  (ไม่บังคับ)

ชื่อไฟล์

แหล่งที่มา สตริง  (ไม่บังคับ)

แหล่งที่มาที่ระบุสำหรับข้อความบางส่วน

custom_metadata object  (ไม่บังคับ)

ข้อมูลเมตาที่ผู้ใช้ระบุเกี่ยวกับบริบทที่ดึงมา

page_number integer  (ไม่บังคับ)

หมายเลขหน้าของเอกสารที่อ้างอิง (หากมี)

media_id string  (ไม่บังคับ)

รหัสสื่อในกรณีที่มีการอ้างอิงรูปภาพ (หากมี)

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

PlaceCitation

คำอธิบายประกอบการอ้างอิงสถานที่

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "place_citation" เสมอ

place_id string  (ไม่บังคับ)

รหัสของสถานที่ในรูปแบบ `places/{place_id}`

name string  (ไม่บังคับ)

ชื่อสถานที่

url string  (ไม่บังคับ)

การอ้างอิง URI ของสถานที่

review_snippets ReviewSnippet  (ไม่บังคับ)

ข้อมูลรีวิวที่ใช้ในการสร้างคำตอบเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps

แคปซูลข้อมูลรีวิวของผู้ใช้ที่ตอบคำถามเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps

ช่อง

title string  (ไม่บังคับ)

ชื่อของรีวิว

url string  (ไม่บังคับ)

ลิงก์ที่สอดคล้องกับรีวิวของผู้ใช้ใน Google Maps

review_id string  (ไม่บังคับ)

รหัสของตัวอย่างรีวิว

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

ImageContent

บล็อกเนื้อหารูปภาพ

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "image" เสมอ

data string  (ไม่บังคับ)

เนื้อหารูปภาพ

uri สตริง  (ไม่บังคับ)

URI ของรูปภาพ

mime_type enum (string)  (ไม่บังคับ)

ประเภท MIME ของรูปภาพ

ค่าที่เป็นไปได้ มีดังนี้

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
  • image/gif
  • image/bmp
  • image/tiff
resolution MediaResolution  (ไม่บังคับ)

ความละเอียดของสื่อ

ค่าที่เป็นไปได้ มีดังนี้

  • low
  • medium
  • high
  • ultra_high

ThoughtSignatureDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "thought_signature" เสมอ

ลายเซ็น สตริง  (ไม่บังคับ)

ลายเซ็นที่ตรงกับแหล่งข้อมูลแบ็กเอนด์เพื่อเป็นส่วนหนึ่งของการสร้าง

TextAnnotationDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "text_annotation_delta" เสมอ

annotations Annotation  (ไม่บังคับ)

ข้อมูลการอ้างอิงสำหรับเนื้อหาที่โมเดลสร้างขึ้น

ข้อมูลการอ้างอิงสำหรับเนื้อหาที่โมเดลสร้างขึ้น

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบ Polymorphic: type

UrlCitation

คำอธิบายประกอบการอ้างอิง URL

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "url_citation" เสมอ

url string  (ไม่บังคับ)

URL

title string  (ไม่บังคับ)

ชื่อของ URL

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

FileCitation

คำอธิบายประกอบการอ้างอิงไฟล์

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "file_citation" เสมอ

document_uri string  (ไม่บังคับ)

URI ของไฟล์

file_name string  (ไม่บังคับ)

ชื่อไฟล์

แหล่งที่มา สตริง  (ไม่บังคับ)

แหล่งที่มาที่ระบุสำหรับข้อความบางส่วน

custom_metadata object  (ไม่บังคับ)

ข้อมูลเมตาที่ผู้ใช้ระบุเกี่ยวกับบริบทที่ดึงมา

page_number integer  (ไม่บังคับ)

หมายเลขหน้าของเอกสารที่อ้างอิง (หากมี)

media_id string  (ไม่บังคับ)

รหัสสื่อในกรณีที่มีการอ้างอิงรูปภาพ (หากมี)

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

PlaceCitation

คำอธิบายประกอบการอ้างอิงสถานที่

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "place_citation" เสมอ

place_id string  (ไม่บังคับ)

รหัสของสถานที่ในรูปแบบ `places/{place_id}`

name string  (ไม่บังคับ)

ชื่อสถานที่

url string  (ไม่บังคับ)

การอ้างอิง URI ของสถานที่

review_snippets ReviewSnippet  (ไม่บังคับ)

ข้อมูลรีวิวที่ใช้ในการสร้างคำตอบเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps

แคปซูลข้อมูลรีวิวของผู้ใช้ที่ตอบคำถามเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps

ช่อง

title string  (ไม่บังคับ)

ชื่อของรีวิว

url string  (ไม่บังคับ)

ลิงก์ที่สอดคล้องกับรีวิวของผู้ใช้ใน Google Maps

review_id string  (ไม่บังคับ)

รหัสของตัวอย่างรีวิว

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

ArgumentsDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "arguments_delta" เสมอ

partial_arguments string  (ไม่บังคับ)

ไม่มีคำอธิบาย

event_id string  (ไม่บังคับ)

โทเค็น event_id ที่จะใช้เพื่อดำเนินการต่อในสตรีมการโต้ตอบจากเหตุการณ์นี้

StepStop

event_type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "step.stop" เสมอ

index integer  (ต้องระบุ)

ไม่มีคำอธิบาย

event_id string  (ไม่บังคับ)

โทเค็น event_id ที่จะใช้เพื่อดำเนินการต่อในสตรีมการโต้ตอบจากเหตุการณ์นี้

ตัวอย่าง

สร้างการโต้ตอบแล้ว

{
  "event_type": "interaction.created",
  "interaction": {
    "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg",
    "model": "gemini-3-flash-preview",
    "status": "in_progress",
    "created": "2025-12-04T15:01:45Z",
    "updated": "2025-12-04T15:01:45Z"
  },
  "event_id": "evt_123"
}

การโต้ตอบเสร็จสมบูรณ์

{
  "event_type": "interaction.completed",
  "interaction": {
    "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg",
    "model": "gemini-3-flash-preview",
    "status": "completed",
    "created": "2025-12-04T15:01:45Z",
    "updated": "2025-12-04T15:01:45Z"
  },
  "event_id": "evt_123"
}

การอัปเดตสถานะการโต้ตอบ

{
  "event_type": "interaction.status_update",
  "interaction_id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM",
  "status": "in_progress"
}

เหตุการณ์ข้อผิดพลาด

{
  "event_type": "error",
  "error": {
    "message": "Failed to get completed interaction: Result not found.",
    "code": "not_found"
  }
}

เริ่มขั้นตอน

{
  "event_type": "step.start",
  "index": 0,
  "step": {
    "type": "model_output"
  }
}

เดลต้าของขั้นตอน

{
  "event_type": "step.delta",
  "index": 0,
  "delta": {
    "type": "text",
    "text": "Hello"
  }
}

หยุดทีละขั้น

{
  "event_type": "step.stop",
  "index": 0
}