Gemini API

Gemini Interactions API เป็น API เวอร์ชันทดลองที่ช่วยให้นักพัฒนาซอฟต์แวร์สร้างแอปพลิเคชัน Generative AI โดยใช้โมเดล Gemini ได้ Gemini เป็นโมเดลที่มีความสามารถมากที่สุดของเรา ซึ่งสร้างขึ้นมาใหม่ให้ทำงานกับข้อมูลหลายรูปแบบ สามารถสรุปและทำความเข้าใจ ทำงานท่ามกลางความหลากของข้อมูล และรวมข้อมูลประเภทต่างๆ เข้าด้วยกันได้อย่างราบรื่น ทั้งภาษา รูปภาพ เสียง วิดีโอ และโค้ด คุณสามารถใช้ Gemini API สำหรับ Use Case ต่างๆ เช่น การให้เหตุผลในข้อความและรูปภาพ การสร้างเนื้อหา เอเจนต์โต้ตอบ ระบบสรุปและจัดประเภท และอื่นๆ

การสร้างการโต้ตอบ

post https://generativelanguage.googleapis.com/v1beta/interactions

สร้างการโต้ตอบใหม่

เนื้อความของคำขอ

เนื้อหาของคำขอมีข้อมูลซึ่งมีโครงสร้างดังต่อไปนี้

model ModelOption  (ไม่บังคับ)

ชื่อของ `Model` ที่ใช้ในการสร้างการโต้ตอบ
ต้องระบุหากไม่ได้ระบุ `agent`

ค่าที่เป็นไปได้ มีดังนี้

  • gemini-2.5-computer-use-preview-10-2025

    โมเดลความสามารถแบบเป็น Agent ที่ออกแบบมาสำหรับการโต้ตอบกับอินเทอร์เฟซโดยตรง ซึ่งช่วยให้ Gemini รับรู้และไปยังส่วนต่างๆ ของสภาพแวดล้อมดิจิทัลได้

  • gemini-2.5-flash

    โมเดลการให้เหตุผลแบบไฮบริดรุ่นแรกของเราซึ่งรองรับหน้าต่างบริบทขนาด 1 ล้านโทเค็นและมีงบประมาณสำหรับการคิด

  • gemini-2.5-flash-image

    โมเดลการสร้างรูปภาพในตัวของเราที่ได้รับการเพิ่มประสิทธิภาพเพื่อความเร็ว ความยืดหยุ่น และความเข้าใจบริบท ระบบจะคิดราคาอินพุตและเอาต์พุตข้อความเหมือนกับ 2.5 Flash

  • gemini-2.5-flash-lite

    โมเดลที่มีขนาดเล็กที่สุดและคุ้มค่าที่สุดของเรา ซึ่งสร้างขึ้นเพื่อการใช้งานในวงกว้าง

  • gemini-2.5-flash-lite-preview-09-2025

    โมเดลล่าสุดที่อิงตาม Gemini 2.5 Flash lite ซึ่งได้รับการเพิ่มประสิทธิภาพเพื่อความคุ้มค่า การส่งข้อความปริมาณมาก และคุณภาพสูง

  • gemini-2.5-flash-native-audio-preview-12-2025

    โมเดลเสียงดั้งเดิมของเราได้รับการเพิ่มประสิทธิภาพเพื่อเอาต์พุตเสียงคุณภาพสูงขึ้นพร้อมการเว้นวรรคที่ดีขึ้น ความเป็นธรรมชาติของเสียง ความละเอียด และอารมณ์

  • gemini-2.5-flash-preview-09-2025

    โมเดลล่าสุดที่อิงตามโมเดล 2.5 Flash 2.5 Flash Preview เหมาะที่สุดสำหรับการประมวลผลขนาดใหญ่ งานที่มีเวลาในการตอบสนองต่ำและมีปริมาณมากซึ่งต้องใช้ความคิด และกรณีการใช้งานแบบเอเจนต์

  • gemini-2.5-flash-preview-tts

    โมเดลข้อความเป็นคำพูด 2.5 Flash ของเราได้รับการเพิ่มประสิทธิภาพเพื่อการสร้างคำพูดที่ควบคุมได้ซึ่งมีประสิทธิภาพและมีความหน่วงต่ำ

  • gemini-2.5-pro

    โมเดลอเนกประสงค์ที่ล้ำสมัยของเรา ซึ่งโดดเด่นด้านการเขียนโค้ดและงานการให้เหตุผลที่ซับซ้อน

  • gemini-2.5-pro-preview-tts

    โมเดลเสียงอ่านออกเสียงข้อความ 2.5 Pro ของเราได้รับการเพิ่มประสิทธิภาพเพื่อการสร้างเสียงพูดที่ทรงพลังและมีเวลาในการตอบสนองต่ำ เพื่อให้ได้ผลลัพธ์ที่เป็นธรรมชาติมากขึ้นและควบคุมพรอมต์ได้ง่ายขึ้น

  • gemini-3-flash-preview

    โมเดลที่ชาญฉลาดที่สุดของเราสร้างขึ้นเพื่อเน้นความเร็ว โดยผสานความชาญฉลาดระดับแนวหน้าเข้ากับการค้นหาและการเชื่อมต่อแหล่งข้อมูลที่เหนือกว่า

  • gemini-3-pro-image-preview

    โมเดลการสร้างและแก้ไขรูปภาพที่ล้ำสมัย

  • gemini-3-pro-preview

    โมเดลที่ชาญฉลาดที่สุดของเราซึ่งมีการให้เหตุผลและทำความเข้าใจข้อมูลหลายรูปแบบระดับ SOTA รวมถึงความสามารถในการเขียนโค้ดแบบเป็น Agent และ Vibe Coding ที่ทรงพลัง

  • gemini-3.1-pro-preview

    โมเดลการให้เหตุผล SOTA ล่าสุดของเราที่มีความลึกซึ้งและเฉดสีที่ไม่เคยมีมาก่อน รวมถึงความสามารถในการทำความเข้าใจข้อมูลหลายรูปแบบและการเขียนโค้ดที่ทรงพลัง

  • gemini-3.1-flash-image-preview

    ความสามารถด้านภาพระดับมืออาชีพที่มีประสิทธิภาพระดับ Flash และความสามารถในการสร้างที่อิงตามความเป็นจริง

  • gemini-3.1-flash-lite-preview

    โมเดลที่มีประสิทธิภาพด้านต้นทุนมากที่สุดของเรา ซึ่งได้รับการเพิ่มประสิทธิภาพสำหรับงานที่ต้องใช้ Agent จำนวนมาก การแปล และการประมวลผลข้อมูลอย่างง่าย

  • gemini-3.1-flash-tts-preview

    TTS ของ Gemini 3.1 Flash: การสร้างคำพูดที่ทรงพลังและมีเวลาในการตอบสนองต่ำ เพลิดเพลินกับเอาต์พุตที่เป็นธรรมชาติ พรอมต์ที่ควบคุมได้ และแท็กเสียงแบบใหม่ที่สื่ออารมณ์เพื่อการควบคุมการบรรยายที่แม่นยำ

  • lyria-3-clip-preview

    โมเดลการสร้างเพลงที่มีเวลาในการตอบสนองต่ำของเราได้รับการเพิ่มประสิทธิภาพสำหรับคลิปเสียงที่มีความละเอียดสูงและการควบคุมจังหวะที่แม่นยำ

  • lyria-3-pro-preview

    โมเดล Generative สำหรับเพลงเต็มขั้นสูงของเราที่มีความเข้าใจด้านการเรียบเรียงเพลงอย่างลึกซึ้ง ซึ่งได้รับการเพิ่มประสิทธิภาพเพื่อการควบคุมโครงสร้างที่แม่นยำและการเปลี่ยนผ่านที่ซับซ้อนในสไตล์ดนตรีที่หลากหลาย

โมเดลที่จะเติมข้อความของคุณให้สมบูรณ์\n\nดูรายละเอียดเพิ่มเติมได้ที่ [models](https://ai.google.dev/gemini-api/docs/models)

agent AgentOption  (ไม่บังคับ)

ชื่อของ `Agent` ที่ใช้สร้างการโต้ตอบ
ต้องระบุหากไม่ได้ระบุ `model`

ค่าที่เป็นไปได้ มีดังนี้

  • deep-research-pro-preview-12-2025

    เอเจนต์ Deep Research ของ Gemini

  • deep-research-preview-04-2026

    เอเจนต์ Deep Research ของ Gemini

  • deep-research-max-preview-04-2026

    Gemini Deep Research Max Agent

ตัวแทนที่จะโต้ตอบด้วย

input Content หรืออาร์เรย์ (Content) หรืออาร์เรย์ (Turn) หรือสตริง  (ต้องระบุ)

อินพุตสำหรับการโต้ตอบ (ใช้ร่วมกันทั้งโมเดลและเอเจนต์)

system_instruction string  (ไม่บังคับ)

คำสั่งของระบบสำหรับการโต้ตอบ

เครื่องมือ อาร์เรย์ (เครื่องมือ)  (ไม่บังคับ)

รายการการประกาศเครื่องมือที่โมเดลอาจเรียกใช้ระหว่างการโต้ตอบ

response_format object  (ไม่บังคับ)

บังคับให้การตอบกลับที่สร้างขึ้นเป็นออบเจ็กต์ JSON ที่เป็นไปตามสคีมา JSON ที่ระบุในฟิลด์นี้

response_mime_type string  (ไม่บังคับ)

ประเภท MIME ของการตอบกลับ ต้องระบุหากตั้งค่า response_format

stream boolean  (ไม่บังคับ)

อินพุตเท่านั้น จะมีการสตรีมการโต้ตอบหรือไม่

store boolean  (ไม่บังคับ)

อินพุตเท่านั้น จะจัดเก็บคำตอบและคำขอเพื่อเรียกข้อมูลในภายหลังหรือไม่

background boolean  (ไม่บังคับ)

อินพุตเท่านั้น ว่าจะเรียกใช้การโต้ตอบกับโมเดลในเบื้องหลังหรือไม่

generation_config GenerationConfig  (ไม่บังคับ)

การกำหนดค่าโมเดล
พารามิเตอร์การกำหนดค่าสำหรับการโต้ตอบกับโมเดล
ทางเลือกแทน `agent_config` ใช้ได้เฉพาะเมื่อตั้งค่า `model`

พารามิเตอร์การกำหนดค่าสำหรับการโต้ตอบกับโมเดล

ช่อง

temperature number  (ไม่บังคับ)

ควบคุมความสุ่มของเอาต์พุต

top_p number  (ไม่บังคับ)

ความน่าจะเป็นสะสมสูงสุดของโทเค็นที่ต้องพิจารณาเมื่อทำการสุ่มตัวอย่าง

seed integer  (ไม่บังคับ)

Seed ที่ใช้ในการถอดรหัสเพื่อความสามารถในการทำซ้ำ

stop_sequences array (string)  (ไม่บังคับ)

รายการลำดับอักขระที่จะหยุดการโต้ตอบเอาต์พุต

thinking_level ThinkingLevel  (ไม่บังคับ)

ระดับโทเค็นความคิดที่โมเดลควรสร้าง

ค่าที่เป็นไปได้ มีดังนี้

  • minimal
  • low
  • medium
  • high

thinking_summaries ThinkingSummaries  (ไม่บังคับ)

จะรวมสรุปความคิดในคำตอบหรือไม่

ค่าที่เป็นไปได้ มีดังนี้

  • auto
  • none

max_output_tokens integer  (ไม่บังคับ)

จำนวนโทเค็นสูงสุดที่จะรวมไว้ในการตอบกลับ

speech_config SpeechConfig  (ไม่บังคับ)

การกำหนดค่าสำหรับการโต้ตอบด้วยเสียง

การกำหนดค่าสำหรับการโต้ตอบด้วยคำพูด

ช่อง

เสียง สตริง  (ไม่บังคับ)

เสียงของผู้พูด

language string  (ไม่บังคับ)

ภาษาของคำพูด

speaker string  (ไม่บังคับ)

ชื่อผู้พูดควรตรงกับชื่อผู้พูดที่ระบุในพรอมต์

image_config ImageConfig  (ไม่บังคับ)

การกำหนดค่าสำหรับการโต้ตอบกับรูปภาพ

การกำหนดค่าสำหรับการโต้ตอบกับรูปภาพ

ช่อง

aspect_ratio enum (string)  (ไม่บังคับ)

ไม่มีคำอธิบาย

ค่าที่เป็นไปได้ มีดังนี้

  • 1:1
  • 2:3
  • 3:2
  • 3:4
  • 4:3
  • 4:5
  • 5:4
  • 9:16
  • 16:9
  • 21:9
  • 1:8
  • 8:1
  • 1:4
  • 4:1
image_size enum (string)  (ไม่บังคับ)

ไม่มีคำอธิบาย

ค่าที่เป็นไปได้ มีดังนี้

  • 1K
  • 2K
  • 4K
  • 512
tool_choice ToolChoiceConfig หรือ ToolChoiceType  (ไม่บังคับ)

การกำหนดค่าการเลือกเครื่องมือ

agent_config object  (ไม่บังคับ)

การกำหนดค่า Agent
การกำหนดค่าสำหรับ Agent
ทางเลือกแทน `generation_config` ใช้ได้เฉพาะเมื่อตั้งค่า `agent`

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบหลายรูปแบบ: type

DynamicAgentConfig

การกำหนดค่าสำหรับเอเจนต์แบบไดนามิก

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "dynamic" เสมอ

DeepResearchAgentConfig

การกำหนดค่าสำหรับตัวแทน Deep Research

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "deep-research" เสมอ

thinking_summaries ThinkingSummaries  (ไม่บังคับ)

จะรวมสรุปความคิดในคำตอบหรือไม่

ค่าที่เป็นไปได้ มีดังนี้

  • auto
  • none

visualization enum (string)  (ไม่บังคับ)

รวมภาพข้อมูลในการตอบกลับไหม

ค่าที่เป็นไปได้ มีดังนี้

  • off
  • auto
collaborative_planning boolean  (ไม่บังคับ)

ช่วยให้การวางแผนแบบ Human-in-the-Loop สำหรับตัวแทน Deep Research หากตั้งค่าเป็น true เอเจนต์ Deep Research จะระบุแผนการค้นคว้าข้อมูลในการตอบกลับ จากนั้นตัวแทนจะดำเนินการต่อก็ต่อเมื่อผู้ใช้ยืนยันแผนในเทิร์นถัดไป

previous_interaction_id string  (ไม่บังคับ)

รหัสของการโต้ตอบก่อนหน้า (หากมี)

response_modalities ResponseModality  (ไม่บังคับ)

รูปแบบการตอบกลับที่ขอ (TEXT, IMAGE, AUDIO)

ค่าที่เป็นไปได้ มีดังนี้

  • text
  • image
  • audio
  • video
  • document

service_tier enum (string)  (ไม่บังคับ)

ระดับบริการสำหรับการโต้ตอบ

ค่าที่เป็นไปได้ มีดังนี้

  • flex
  • standard
  • priority

การตอบกลับ

แสดงผลทรัพยากร Interaction

คำขออย่างง่าย

ตัวอย่างการตอบกลับ

{
  "created": "2025-11-26T12:25:15Z",
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "object": "interaction",
  "outputs": [
    {
      "text": "Hello! I'm functioning perfectly and ready to assist you.\n\nHow are you doing today?",
      "type": "text"
    }
  ],
  "role": "model",
  "status": "completed",
  "updated": "2025-11-26T12:25:15Z",
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 7
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 7,
    "total_output_tokens": 20,
    "total_thought_tokens": 22,
    "total_tokens": 49,
    "total_tool_use_tokens": 0
  }
}

หลายรอบ

ตัวอย่างการตอบกลับ

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "role": "model",
  "outputs": [
    {
      "type": "text",
      "text": "The capital of France is Paris."
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 50
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 50,
    "total_output_tokens": 10,
    "total_thought_tokens": 0,
    "total_tokens": 60,
    "total_tool_use_tokens": 0
  }
}

อินพุตรูปภาพ

ตัวอย่างการตอบกลับ

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "role": "model",
  "outputs": [
    {
      "type": "text",
      "text": "A white humanoid robot with glowing blue eyes stands holding a red skateboard."
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 10
      },
      {
        "modality": "image",
        "tokens": 258
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 268,
    "total_output_tokens": 20,
    "total_thought_tokens": 0,
    "total_tokens": 288,
    "total_tool_use_tokens": 0
  }
}

การเรียกใช้ฟังก์ชัน

ตัวอย่างการตอบกลับ

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "requires_action",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "role": "model",
  "outputs": [
    {
      "type": "function_call",
      "id": "gth23981",
      "name": "get_weather",
      "arguments": {
        "location": "Boston, MA"
      }
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 100
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 100,
    "total_output_tokens": 25,
    "total_thought_tokens": 0,
    "total_tokens": 125,
    "total_tool_use_tokens": 50
  }
}

Deep Research

ตัวอย่างการตอบกลับ

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "agent": "deep-research-pro-preview-12-2025",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "role": "agent",
  "outputs": [
    {
      "type": "text",
      "text": "Here is a comprehensive research report on the current state of cancer research..."
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 20
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 20,
    "total_output_tokens": 1000,
    "total_thought_tokens": 500,
    "total_tokens": 1520,
    "total_tool_use_tokens": 0
  }
}

การดึงข้อมูลการโต้ตอบ

get https://generativelanguage.googleapis.com/v1beta/interactions/{id}

เรียกข้อมูลแบบละเอียดทั้งหมดของการโต้ตอบรายการเดียวตาม `Interaction.id`

พารามิเตอร์เส้นทาง / การค้นหา

id string  (ต้องระบุ)

ตัวระบุที่ไม่ซ้ำกันของการโต้ตอบที่จะดึงข้อมูล

stream boolean  (ไม่บังคับ)

หากตั้งค่าเป็น "จริง" ระบบจะสตรีมเนื้อหาที่สร้างขึ้นทีละส่วน

ค่าเริ่มต้นคือ False

last_event_id string  (ไม่บังคับ)

ไม่บังคับ หากตั้งค่าไว้ จะเริ่มสตรีมการโต้ตอบจากก้อนข้อมูลถัดไปหลังจากเหตุการณ์ที่ทำเครื่องหมายด้วยรหัสเหตุการณ์ ใช้ได้เฉพาะในกรณีที่ `stream` เป็นจริง

include_input boolean  (ไม่บังคับ)

หากตั้งค่าเป็น "จริง" จะรวมอินพุตไว้ในการตอบกลับ

ค่าเริ่มต้นคือ False

api_version string  (ไม่บังคับ)

เวอร์ชันของ API ที่จะใช้

การตอบกลับ

แสดงผลทรัพยากร Interaction

รับการโต้ตอบ

ตัวอย่างการตอบกลับ

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:25:15Z",
  "updated": "2025-11-26T12:25:15Z",
  "role": "model",
  "outputs": [
    {
      "type": "text",
      "text": "I'm doing great, thank you for asking! How can I help you today?"
    }
  ]
}

การลบการโต้ตอบ

delete https://generativelanguage.googleapis.com/v1beta/interactions/{id}

ลบการโต้ตอบตามรหัส

พารามิเตอร์เส้นทาง / การค้นหา

id string  (ต้องระบุ)

ตัวระบุที่ไม่ซ้ำกันของการโต้ตอบที่จะลบ

api_version string  (ไม่บังคับ)

เวอร์ชันของ API ที่จะใช้

การตอบกลับ

หากทำสำเร็จ การตอบกลับจะว่างเปล่า

ลบการโต้ตอบ

การยกเลิกการโต้ตอบ

post https://generativelanguage.googleapis.com/v1beta/interactions/{id}/cancel

ยกเลิกการโต้ตอบตามรหัส โดยจะมีผลกับการโต้ตอบในเบื้องหลังที่ยังทำงานอยู่เท่านั้น

พารามิเตอร์เส้นทาง / การค้นหา

id string  (ต้องระบุ)

ตัวระบุที่ไม่ซ้ำกันของการโต้ตอบที่จะยกเลิก

api_version string  (ไม่บังคับ)

เวอร์ชันของ API ที่จะใช้

การตอบกลับ

แสดงผลทรัพยากร Interaction

ยกเลิกการโต้ตอบ

ตัวอย่างการตอบกลับ

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "agent": "deep-research-pro-preview-12-2025",
  "status": "cancelled",
  "object": "interaction",
  "created": "2025-11-26T12:25:15Z",
  "updated": "2025-11-26T12:25:15Z",
  "role": "agent"
}

แหล่งข้อมูล

การโต้ตอบ

ทรัพยากรการโต้ตอบ

ช่อง

model ModelOption  (ไม่บังคับ)

ชื่อของ `Model` ที่ใช้ในการสร้างการโต้ตอบ

ค่าที่เป็นไปได้ มีดังนี้

  • gemini-2.5-computer-use-preview-10-2025

    โมเดลความสามารถแบบเป็น Agent ที่ออกแบบมาสำหรับการโต้ตอบกับอินเทอร์เฟซโดยตรง ซึ่งช่วยให้ Gemini รับรู้และไปยังส่วนต่างๆ ของสภาพแวดล้อมดิจิทัลได้

  • gemini-2.5-flash

    โมเดลการให้เหตุผลแบบไฮบริดรุ่นแรกของเราซึ่งรองรับหน้าต่างบริบทขนาด 1 ล้านโทเค็นและมีงบประมาณสำหรับการคิด

  • gemini-2.5-flash-image

    โมเดลการสร้างรูปภาพในตัวของเราที่ได้รับการเพิ่มประสิทธิภาพเพื่อความเร็ว ความยืดหยุ่น และความเข้าใจบริบท ระบบจะคิดราคาอินพุตและเอาต์พุตข้อความเหมือนกับ 2.5 Flash

  • gemini-2.5-flash-lite

    โมเดลที่มีขนาดเล็กที่สุดและคุ้มค่าที่สุดของเรา ซึ่งสร้างขึ้นเพื่อการใช้งานในวงกว้าง

  • gemini-2.5-flash-lite-preview-09-2025

    โมเดลล่าสุดที่อิงตาม Gemini 2.5 Flash lite ซึ่งได้รับการเพิ่มประสิทธิภาพเพื่อความคุ้มค่า การส่งข้อความปริมาณมาก และคุณภาพสูง

  • gemini-2.5-flash-native-audio-preview-12-2025

    โมเดลเสียงดั้งเดิมของเราได้รับการเพิ่มประสิทธิภาพเพื่อเอาต์พุตเสียงคุณภาพสูงขึ้นพร้อมการเว้นวรรคที่ดีขึ้น ความเป็นธรรมชาติของเสียง ความละเอียด และอารมณ์

  • gemini-2.5-flash-preview-09-2025

    โมเดลล่าสุดที่อิงตามโมเดล 2.5 Flash 2.5 Flash Preview เหมาะที่สุดสำหรับการประมวลผลขนาดใหญ่ งานที่มีเวลาในการตอบสนองต่ำและมีปริมาณมากซึ่งต้องใช้ความคิด และกรณีการใช้งานแบบเอเจนต์

  • gemini-2.5-flash-preview-tts

    โมเดลข้อความเป็นคำพูด 2.5 Flash ของเราได้รับการเพิ่มประสิทธิภาพเพื่อการสร้างคำพูดที่ควบคุมได้ซึ่งมีประสิทธิภาพและมีความหน่วงต่ำ

  • gemini-2.5-pro

    โมเดลอเนกประสงค์ที่ล้ำสมัยของเรา ซึ่งโดดเด่นด้านการเขียนโค้ดและงานการให้เหตุผลที่ซับซ้อน

  • gemini-2.5-pro-preview-tts

    โมเดลเสียงอ่านออกเสียงข้อความ 2.5 Pro ของเราได้รับการเพิ่มประสิทธิภาพเพื่อการสร้างเสียงพูดที่ทรงพลังและมีเวลาในการตอบสนองต่ำ เพื่อให้ได้ผลลัพธ์ที่เป็นธรรมชาติมากขึ้นและควบคุมพรอมต์ได้ง่ายขึ้น

  • gemini-3-flash-preview

    โมเดลที่ชาญฉลาดที่สุดของเราสร้างขึ้นเพื่อเน้นความเร็ว โดยผสานความชาญฉลาดระดับแนวหน้าเข้ากับการค้นหาและการเชื่อมต่อแหล่งข้อมูลที่เหนือกว่า

  • gemini-3-pro-image-preview

    โมเดลการสร้างและแก้ไขรูปภาพที่ล้ำสมัย

  • gemini-3-pro-preview

    โมเดลที่ชาญฉลาดที่สุดของเราซึ่งมีการให้เหตุผลและทำความเข้าใจข้อมูลหลายรูปแบบระดับ SOTA รวมถึงความสามารถในการเขียนโค้ดแบบเป็น Agent และ Vibe Coding ที่ทรงพลัง

  • gemini-3.1-pro-preview

    โมเดลการให้เหตุผล SOTA ล่าสุดของเราที่มีความลึกซึ้งและเฉดสีที่ไม่เคยมีมาก่อน รวมถึงความสามารถในการทำความเข้าใจข้อมูลหลายรูปแบบและการเขียนโค้ดที่ทรงพลัง

  • gemini-3.1-flash-image-preview

    ความสามารถด้านภาพระดับมืออาชีพที่มีประสิทธิภาพระดับ Flash และความสามารถในการสร้างที่อิงตามความเป็นจริง

  • gemini-3.1-flash-lite-preview

    โมเดลที่มีประสิทธิภาพด้านต้นทุนมากที่สุดของเรา ซึ่งได้รับการเพิ่มประสิทธิภาพสำหรับงานที่ต้องใช้ Agent จำนวนมาก การแปล และการประมวลผลข้อมูลอย่างง่าย

  • gemini-3.1-flash-tts-preview

    TTS ของ Gemini 3.1 Flash: การสร้างคำพูดที่ทรงพลังและมีเวลาในการตอบสนองต่ำ เพลิดเพลินกับเอาต์พุตที่เป็นธรรมชาติ พรอมต์ที่ควบคุมได้ และแท็กเสียงแบบใหม่ที่สื่ออารมณ์เพื่อการควบคุมการบรรยายที่แม่นยำ

  • lyria-3-clip-preview

    โมเดลการสร้างเพลงที่มีเวลาในการตอบสนองต่ำของเราได้รับการเพิ่มประสิทธิภาพสำหรับคลิปเสียงที่มีความละเอียดสูงและการควบคุมจังหวะที่แม่นยำ

  • lyria-3-pro-preview

    โมเดล Generative สำหรับเพลงเต็มขั้นสูงของเราที่มีความเข้าใจด้านการเรียบเรียงเพลงอย่างลึกซึ้ง ซึ่งได้รับการเพิ่มประสิทธิภาพเพื่อการควบคุมโครงสร้างที่แม่นยำและการเปลี่ยนผ่านที่ซับซ้อนในสไตล์ดนตรีที่หลากหลาย

โมเดลที่จะเติมข้อความของคุณให้สมบูรณ์\n\nดูรายละเอียดเพิ่มเติมได้ที่ [models](https://ai.google.dev/gemini-api/docs/models)

agent AgentOption  (ไม่บังคับ)

ชื่อของ `Agent` ที่ใช้สร้างการโต้ตอบ

ค่าที่เป็นไปได้ มีดังนี้

  • deep-research-pro-preview-12-2025

    เอเจนต์ Deep Research ของ Gemini

  • deep-research-preview-04-2026

    เอเจนต์ Deep Research ของ Gemini

  • deep-research-max-preview-04-2026

    Gemini Deep Research Max Agent

ตัวแทนที่จะโต้ตอบด้วย

id string  (ไม่บังคับ)

ต้องระบุ เอาต์พุตเท่านั้น ตัวระบุที่ไม่ซ้ำกันสำหรับการโต้ตอบที่เสร็จสมบูรณ์

status enum (string)  (ไม่บังคับ)

ต้องระบุ เอาต์พุตเท่านั้น สถานะของการโต้ตอบ

ค่าที่เป็นไปได้ มีดังนี้

  • in_progress
  • requires_action
  • completed
  • failed
  • cancelled
  • incomplete
created string  (ไม่บังคับ)

ต้องระบุ เอาต์พุตเท่านั้น เวลาที่สร้างคำตอบในรูปแบบ ISO 8601 (YYYY-MM-DDThh:mm:ssZ)

updated string  (ไม่บังคับ)

ต้องระบุ เอาต์พุตเท่านั้น เวลาที่อัปเดตคำตอบครั้งล่าสุดในรูปแบบ ISO 8601 (YYYY-MM-DDThh:mm:ssZ)

role string  (ไม่บังคับ)

เอาต์พุตเท่านั้น บทบาทของการโต้ตอบ

outputs อาร์เรย์ (Content)  (ไม่บังคับ)

เอาต์พุตเท่านั้น คำตอบจากโมเดล

system_instruction string  (ไม่บังคับ)

คำสั่งของระบบสำหรับการโต้ตอบ

เครื่องมือ อาร์เรย์ (เครื่องมือ)  (ไม่บังคับ)

รายการการประกาศเครื่องมือที่โมเดลอาจเรียกใช้ระหว่างการโต้ตอบ

usage Usage  (ไม่บังคับ)

เอาต์พุตเท่านั้น สถิติการใช้โทเค็นของคำขอโต้ตอบ

สถิติการใช้โทเค็นของคำขอการโต้ตอบ

ช่อง

total_input_tokens integer  (ไม่บังคับ)

จำนวนโทเค็นในพรอมต์ (บริบท)

input_tokens_by_modality ModalityTokens  (ไม่บังคับ)

รายละเอียดการใช้โทเค็นอินพุตตามรูปแบบ

จำนวนโทเค็นสำหรับรูปแบบการตอบกลับเดียว

ช่อง

modality ResponseModality  (ไม่บังคับ)

รูปแบบที่เชื่อมโยงกับจำนวนโทเค็น

ค่าที่เป็นไปได้ มีดังนี้

  • text
  • image
  • audio
  • video
  • document

โทเค็น จำนวนเต็ม  (ไม่บังคับ)

จำนวนโทเค็นสำหรับรูปแบบ

total_cached_tokens integer  (ไม่บังคับ)

จํานวนโทเค็นในส่วนที่แคชของพรอมต์ (เนื้อหาที่แคช)

cached_tokens_by_modality ModalityTokens  (ไม่บังคับ)

รายละเอียดการใช้โทเค็นที่แคชไว้ตามรูปแบบ

จำนวนโทเค็นสำหรับรูปแบบการตอบกลับเดียว

ช่อง

modality ResponseModality  (ไม่บังคับ)

รูปแบบที่เชื่อมโยงกับจำนวนโทเค็น

ค่าที่เป็นไปได้ มีดังนี้

  • text
  • image
  • audio
  • video
  • document

โทเค็น จำนวนเต็ม  (ไม่บังคับ)

จำนวนโทเค็นสำหรับรูปแบบ

total_output_tokens integer  (ไม่บังคับ)

จำนวนโทเค็นทั้งหมดในการตอบกลับที่สร้างขึ้นทั้งหมด

output_tokens_by_modality ModalityTokens  (ไม่บังคับ)

รายละเอียดการใช้โทเค็นเอาต์พุตตามรูปแบบ

จำนวนโทเค็นสำหรับรูปแบบการตอบกลับเดียว

ช่อง

modality ResponseModality  (ไม่บังคับ)

รูปแบบที่เชื่อมโยงกับจำนวนโทเค็น

ค่าที่เป็นไปได้ มีดังนี้

  • text
  • image
  • audio
  • video
  • document

โทเค็น จำนวนเต็ม  (ไม่บังคับ)

จำนวนโทเค็นสำหรับรูปแบบ

total_tool_use_tokens integer  (ไม่บังคับ)

จำนวนโทเค็นที่อยู่ในพรอมต์การใช้เครื่องมือ

tool_use_tokens_by_modality ModalityTokens  (ไม่บังคับ)

รายละเอียดการใช้โทเค็นเครื่องมือตามรูปแบบ

จำนวนโทเค็นสำหรับรูปแบบการตอบกลับเดียว

ช่อง

modality ResponseModality  (ไม่บังคับ)

รูปแบบที่เชื่อมโยงกับจำนวนโทเค็น

ค่าที่เป็นไปได้ มีดังนี้

  • text
  • image
  • audio
  • video
  • document

โทเค็น จำนวนเต็ม  (ไม่บังคับ)

จำนวนโทเค็นสำหรับรูปแบบ

total_thought_tokens integer  (ไม่บังคับ)

จำนวนโทเค็นของความคิดสำหรับโมเดลการคิด

total_tokens integer  (ไม่บังคับ)

จำนวนโทเค็นทั้งหมดสำหรับคำขอการโต้ตอบ (พรอมต์ + คำตอบ + โทเค็นภายในอื่นๆ )

response_modalities ResponseModality  (ไม่บังคับ)

รูปแบบการตอบกลับที่ขอ (TEXT, IMAGE, AUDIO)

ค่าที่เป็นไปได้ มีดังนี้

  • text
  • image
  • audio
  • video
  • document

response_format object  (ไม่บังคับ)

บังคับให้การตอบกลับที่สร้างขึ้นเป็นออบเจ็กต์ JSON ที่เป็นไปตามสคีมา JSON ที่ระบุในฟิลด์นี้

response_mime_type string  (ไม่บังคับ)

ประเภท MIME ของการตอบกลับ ต้องระบุหากตั้งค่า response_format

previous_interaction_id string  (ไม่บังคับ)

รหัสของการโต้ตอบก่อนหน้า (หากมี)

service_tier enum (string)  (ไม่บังคับ)

ระดับบริการสำหรับการโต้ตอบ

ค่าที่เป็นไปได้ มีดังนี้

  • flex
  • standard
  • priority
input เนื้อหาหรืออาร์เรย์ (เนื้อหา) หรืออาร์เรย์ (เปิด) หรือสตริง  (ไม่บังคับ)

อินพุตสำหรับการโต้ตอบ

agent_config object  (ไม่บังคับ)

พารามิเตอร์การกำหนดค่าสำหรับการโต้ตอบของตัวแทน

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบหลายรูปแบบ: type

DynamicAgentConfig

การกำหนดค่าสำหรับเอเจนต์แบบไดนามิก

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "dynamic" เสมอ

DeepResearchAgentConfig

การกำหนดค่าสำหรับตัวแทน Deep Research

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "deep-research" เสมอ

thinking_summaries ThinkingSummaries  (ไม่บังคับ)

จะรวมสรุปความคิดในคำตอบหรือไม่

ค่าที่เป็นไปได้ มีดังนี้

  • auto
  • none

visualization enum (string)  (ไม่บังคับ)

รวมภาพข้อมูลในการตอบกลับไหม

ค่าที่เป็นไปได้ มีดังนี้

  • off
  • auto
collaborative_planning boolean  (ไม่บังคับ)

ช่วยให้การวางแผนแบบ Human-in-the-Loop สำหรับตัวแทน Deep Research หากตั้งค่าเป็น true เอเจนต์ Deep Research จะระบุแผนการค้นคว้าข้อมูลในการตอบกลับ จากนั้นตัวแทนจะดำเนินการต่อก็ต่อเมื่อผู้ใช้ยืนยันแผนในเทิร์นถัดไป

ตัวอย่าง

ตัวอย่าง

{
  "created": "2025-12-04T15:01:45Z",
  "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg",
  "model": "gemini-3-flash-preview",
  "object": "interaction",
  "outputs": [
    {
      "text": "Hello! I'm doing well, functioning as expected. Thank you for asking! How are you doing today?",
      "type": "text"
    }
  ],
  "role": "model",
  "status": "completed",
  "updated": "2025-12-04T15:01:45Z",
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 7
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 7,
    "total_output_tokens": 23,
    "total_thought_tokens": 49,
    "total_tokens": 79,
    "total_tool_use_tokens": 0
  }
}

โมเดลข้อมูล

เนื้อหา

เนื้อหาของการตอบกลับ

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบหลายรูปแบบ: type

TextContent

บล็อกเนื้อหาข้อความ

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "text" เสมอ

ข้อความ สตริง  (ต้องระบุ)

ต้องระบุ เนื้อหาข้อความ

annotations Annotation  (ไม่บังคับ)

ข้อมูลการอ้างอิงสำหรับเนื้อหาที่โมเดลสร้างขึ้น

ข้อมูลการอ้างอิงสำหรับเนื้อหาที่โมเดลสร้างขึ้น

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบหลายรูปแบบ: type

UrlCitation

คำอธิบายประกอบการอ้างอิง URL

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "url_citation" เสมอ

url string  (ไม่บังคับ)

URL

title string  (ไม่บังคับ)

ชื่อของ URL

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

FileCitation

คำอธิบายประกอบการอ้างอิงไฟล์

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "file_citation" เสมอ

document_uri string  (ไม่บังคับ)

URI ของไฟล์

file_name string  (ไม่บังคับ)

ชื่อไฟล์

แหล่งที่มา สตริง  (ไม่บังคับ)

แหล่งที่มาของข้อความบางส่วน

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

PlaceCitation

คำอธิบายประกอบการอ้างอิงสถานที่

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "place_citation" เสมอ

place_id string  (ไม่บังคับ)

รหัสของสถานที่ในรูปแบบ `places/{place_id}`

name string  (ไม่บังคับ)

ชื่อสถานที่

url string  (ไม่บังคับ)

ข้อมูลอ้างอิง URI ของสถานที่

review_snippets ReviewSnippet  (ไม่บังคับ)

ข้อมูลรีวิวที่ใช้ในการสร้างคำตอบเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps

แคปซูลข้อมูลรีวิวของผู้ใช้ที่ตอบคำถามเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps

ช่อง

title string  (ไม่บังคับ)

ชื่อของรีวิว

url string  (ไม่บังคับ)

ลิงก์ที่สอดคล้องกับรีวิวของผู้ใช้ใน Google Maps

review_id string  (ไม่บังคับ)

รหัสของตัวอย่างรีวิว

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

ImageContent

บล็อกเนื้อหารูปภาพ

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "image" เสมอ

data string  (ไม่บังคับ)

เนื้อหารูปภาพ

uri สตริง  (ไม่บังคับ)

URI ของรูปภาพ

mime_type enum (string)  (ไม่บังคับ)

ประเภท MIME ของรูปภาพ

ค่าที่เป็นไปได้ มีดังนี้

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
  • image/gif
  • image/bmp
  • image/tiff
resolution MediaResolution  (ไม่บังคับ)

ความละเอียดของสื่อ

ค่าที่เป็นไปได้ มีดังนี้

  • low
  • medium
  • high
  • ultra_high

AudioContent

บล็อกเนื้อหาเสียง

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "audio" เสมอ

data string  (ไม่บังคับ)

เนื้อหาเสียง

uri สตริง  (ไม่บังคับ)

URI ของเสียง

mime_type enum (string)  (ไม่บังคับ)

ประเภท MIME ของเสียง

ค่าที่เป็นไปได้ มีดังนี้

  • audio/wav
  • audio/mp3
  • audio/aiff
  • audio/aac
  • audio/ogg
  • audio/flac
  • audio/mpeg
  • audio/m4a
  • audio/l16
  • audio/opus
  • audio/alaw
  • audio/mulaw
rate integer  (ไม่บังคับ)

อัตราการสุ่มตัวอย่างของเสียง

channels integer  (ไม่บังคับ)

จำนวนช่องเสียง

DocumentContent

บล็อกเนื้อหาของเอกสาร

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "document" เสมอ

data string  (ไม่บังคับ)

เนื้อหาเอกสาร

uri สตริง  (ไม่บังคับ)

URI ของเอกสาร

mime_type enum (string)  (ไม่บังคับ)

ประเภท MIME ของเอกสาร

ค่าที่เป็นไปได้ มีดังนี้

  • application/pdf
VideoContent

บล็อกเนื้อหาวิดีโอ

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "video" เสมอ

data string  (ไม่บังคับ)

เนื้อหาวิดีโอ

uri สตริง  (ไม่บังคับ)

URI ของวิดีโอ

mime_type enum (string)  (ไม่บังคับ)

ประเภท MIME ของวิดีโอ

ค่าที่เป็นไปได้ มีดังนี้

  • video/mp4
  • video/mpeg
  • video/mpg
  • video/mov
  • video/avi
  • video/x-flv
  • video/webm
  • video/wmv
  • video/3gpp
resolution MediaResolution  (ไม่บังคับ)

ความละเอียดของสื่อ

ค่าที่เป็นไปได้ มีดังนี้

  • low
  • medium
  • high
  • ultra_high

ThoughtContent

บล็อกเนื้อหาความคิด

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "thought" เสมอ

ลายเซ็น สตริง  (ไม่บังคับ)

ลายเซ็นที่ตรงกับแหล่งข้อมูลแบ็กเอนด์เพื่อเป็นส่วนหนึ่งของการสร้าง

summary ThoughtSummaryContent  (ไม่บังคับ)

สรุปความคิด

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบหลายรูปแบบ: type

TextContent

บล็อกเนื้อหาข้อความ

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "text" เสมอ

ข้อความ สตริง  (ต้องระบุ)

ต้องระบุ เนื้อหาข้อความ

annotations Annotation  (ไม่บังคับ)

ข้อมูลการอ้างอิงสำหรับเนื้อหาที่โมเดลสร้างขึ้น

ข้อมูลการอ้างอิงสำหรับเนื้อหาที่โมเดลสร้างขึ้น

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบหลายรูปแบบ: type

UrlCitation

คำอธิบายประกอบการอ้างอิง URL

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "url_citation" เสมอ

url string  (ไม่บังคับ)

URL

title string  (ไม่บังคับ)

ชื่อของ URL

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

FileCitation

คำอธิบายประกอบการอ้างอิงไฟล์

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "file_citation" เสมอ

document_uri string  (ไม่บังคับ)

URI ของไฟล์

file_name string  (ไม่บังคับ)

ชื่อไฟล์

แหล่งที่มา สตริง  (ไม่บังคับ)

แหล่งที่มาของข้อความบางส่วน

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

PlaceCitation

คำอธิบายประกอบการอ้างอิงสถานที่

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "place_citation" เสมอ

place_id string  (ไม่บังคับ)

รหัสของสถานที่ในรูปแบบ `places/{place_id}`

name string  (ไม่บังคับ)

ชื่อสถานที่

url string  (ไม่บังคับ)

ข้อมูลอ้างอิง URI ของสถานที่

review_snippets ReviewSnippet  (ไม่บังคับ)

ข้อมูลรีวิวที่ใช้ในการสร้างคำตอบเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps

แคปซูลข้อมูลรีวิวของผู้ใช้ที่ตอบคำถามเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps

ช่อง

title string  (ไม่บังคับ)

ชื่อของรีวิว

url string  (ไม่บังคับ)

ลิงก์ที่สอดคล้องกับรีวิวของผู้ใช้ใน Google Maps

review_id string  (ไม่บังคับ)

รหัสของตัวอย่างรีวิว

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

ImageContent

บล็อกเนื้อหารูปภาพ

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "image" เสมอ

data string  (ไม่บังคับ)

เนื้อหารูปภาพ

uri สตริง  (ไม่บังคับ)

URI ของรูปภาพ

mime_type enum (string)  (ไม่บังคับ)

ประเภท MIME ของรูปภาพ

ค่าที่เป็นไปได้ มีดังนี้

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
  • image/gif
  • image/bmp
  • image/tiff
resolution MediaResolution  (ไม่บังคับ)

ความละเอียดของสื่อ

ค่าที่เป็นไปได้ มีดังนี้

  • low
  • medium
  • high
  • ultra_high

FunctionCallContent

บล็อกเนื้อหาการเรียกใช้เครื่องมือฟังก์ชัน

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "function_call" เสมอ

name string  (ต้องระบุ)

ต้องระบุ ชื่อของเครื่องมือที่จะเรียกใช้

อาร์กิวเมนต์ object  (ต้องระบุ)

ต้องระบุ อาร์กิวเมนต์ที่จะส่งไปยังฟังก์ชัน

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

CodeExecutionCallContent

เนื้อหาการรันโค้ด

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "code_execution_call" เสมอ

arguments CodeExecutionCallArguments  (ต้องระบุ)

ต้องระบุ อาร์กิวเมนต์ที่จะส่งผ่านไปยังการเรียกใช้โค้ด

อาร์กิวเมนต์ที่จะส่งผ่านไปยังการเรียกใช้โค้ด

ช่อง

language enum (string)  (ไม่บังคับ)

ภาษาโปรแกรมของ `code`

ค่าที่เป็นไปได้ มีดังนี้

  • python
รหัส สตริง  (ไม่บังคับ)

โค้ดที่จะดำเนินการ

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

UrlContextCallContent

เนื้อหาบริบท URL

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "url_context_call" เสมอ

arguments UrlContextCallArguments  (ต้องระบุ)

ต้องระบุ อาร์กิวเมนต์ที่จะส่งไปยังบริบท URL

อาร์กิวเมนต์ที่จะส่งไปยังบริบท URL

ช่อง

urls array (string)  (ไม่บังคับ)

URL ที่จะดึงข้อมูล

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

McpServerToolCallContent

เนื้อหาการเรียกใช้เครื่องมือ MCPServer

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "mcp_server_tool_call" เสมอ

name string  (ต้องระบุ)

ต้องระบุ ชื่อของเครื่องมือที่เรียกใช้

server_name string  (ต้องระบุ)

ต้องระบุ ชื่อเซิร์ฟเวอร์ MCP ที่ใช้

อาร์กิวเมนต์ object  (ต้องระบุ)

ต้องระบุ ออบเจ็กต์ JSON ของอาร์กิวเมนต์สำหรับฟังก์ชัน

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

GoogleSearchCallContent

เนื้อหาของ Google Search

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "google_search_call" เสมอ

arguments GoogleSearchCallArguments  (ต้องระบุ)

ต้องระบุ อาร์กิวเมนต์ที่จะส่งไปยัง Google Search

อาร์กิวเมนต์ที่จะส่งไปยัง Google Search

ช่อง

queries อาร์เรย์ (สตริง)  (ไม่บังคับ)

คำค้นหาใน Web Search สำหรับการค้นหาเว็บเพิ่มเติม

search_type enum (string)  (ไม่บังคับ)

ประเภทการเชื่อมต่อแหล่งข้อมูลการค้นหาที่เปิดใช้

ค่าที่เป็นไปได้ มีดังนี้

  • web_search
  • image_search
  • enterprise_web_search
id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

FileSearchCallContent

เนื้อหาการค้นหาไฟล์

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "file_search_call" เสมอ

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

GoogleMapsCallContent

เนื้อหาของ Google Maps

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "google_maps_call" เสมอ

arguments GoogleMapsCallArguments  (ไม่บังคับ)

อาร์กิวเมนต์ที่จะส่งไปยังเครื่องมือ Google Maps

อาร์กิวเมนต์ที่จะส่งไปยังเครื่องมือ Google Maps

ช่อง

queries อาร์เรย์ (สตริง)  (ไม่บังคับ)

คำค้นหาที่จะดำเนินการ

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

FunctionResultContent

บล็อกเนื้อหาผลลัพธ์ของเครื่องมือฟังก์ชัน

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "function_result" เสมอ

name string  (ไม่บังคับ)

ชื่อของเครื่องมือที่เรียกใช้

is_error boolean  (ไม่บังคับ)

การเรียกใช้เครื่องมือทำให้เกิดข้อผิดพลาดหรือไม่

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

result array (FunctionResultSubcontent) หรือสตริง  (ต้องระบุ)

ผลลัพธ์ของการเรียกใช้เครื่องมือ

CodeExecutionResultContent

เนื้อหาผลการรันโค้ด

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "code_execution_result" เสมอ

result string  (ต้องระบุ)

ต้องระบุ เอาต์พุตของการเรียกใช้โค้ด

is_error boolean  (ไม่บังคับ)

การดำเนินการโค้ดส่งผลให้เกิดข้อผิดพลาดหรือไม่

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

UrlContextResultContent

เนื้อหาผลลัพธ์ของบริบท URL

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "url_context_result" เสมอ

result UrlContextResult  (ต้องระบุ)

ต้องระบุ ผลลัพธ์ของบริบท URL

ผลลัพธ์ของบริบท URL

ช่อง

url string  (ไม่บังคับ)

URL ที่ดึงข้อมูล

status enum (string)  (ไม่บังคับ)

สถานะของการดึงข้อมูล URL

ค่าที่เป็นไปได้ มีดังนี้

  • success
  • error
  • paywall
  • unsafe
is_error boolean  (ไม่บังคับ)

ไม่ว่าบริบท URL จะทำให้เกิดข้อผิดพลาดหรือไม่

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

GoogleSearchResultContent

เนื้อหาผลการค้นหาของ Google

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "google_search_result" เสมอ

result GoogleSearchResult  (ต้องระบุ)

ต้องระบุ ผลการค้นหาของ Google Search

ผลการค้นหาของ Google Search

ช่อง

search_suggestions string  (ไม่บังคับ)

ข้อมูลโค้ดเนื้อหาเว็บที่ฝังในหน้าเว็บหรือ WebView ของแอปได้

is_error boolean  (ไม่บังคับ)

ไม่ว่า Google Search จะทำให้เกิดข้อผิดพลาดหรือไม่

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

McpServerToolResultContent

เนื้อหาผลลัพธ์ของเครื่องมือ MCPServer

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "mcp_server_tool_result" เสมอ

name string  (ไม่บังคับ)

ชื่อของเครื่องมือที่เรียกใช้สำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

server_name string  (ไม่บังคับ)

ชื่อเซิร์ฟเวอร์ MCP ที่ใช้

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

result array (FunctionResultSubcontent) หรือสตริง  (ต้องระบุ)

เอาต์พุตจากการเรียกเซิร์ฟเวอร์ MCP อาจเป็นข้อความธรรมดาหรือข้อมูลอย่างละเอียด

FileSearchResultContent

เนื้อหาผลการค้นหาของ File Search

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "file_search_result" เสมอ

result FileSearchResult  (ต้องระบุ)

ต้องระบุ ผลการค้นหาไฟล์

ผลการค้นหาไฟล์

ช่อง

custom_metadata array (object)  (ไม่บังคับ)

ข้อมูลเมตาที่ผู้ใช้ระบุเกี่ยวกับ FileSearchResult

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

GoogleMapsResultContent

เนื้อหาผลการค้นหาของ Google Maps

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "google_maps_result" เสมอ

result GoogleMapsResult  (ต้องระบุ)

ต้องระบุ ผลลัพธ์ของ Google Maps

ผลลัพธ์ของ Google Maps

ช่อง

places Places  (ไม่บังคับ)

สถานที่ที่พบ

ช่อง

place_id string  (ไม่บังคับ)

รหัสของสถานที่ในรูปแบบ `places/{place_id}`

name string  (ไม่บังคับ)

ชื่อสถานที่

url string  (ไม่บังคับ)

ข้อมูลอ้างอิง URI ของสถานที่

review_snippets ReviewSnippet  (ไม่บังคับ)

ข้อมูลรีวิวที่ใช้ในการสร้างคำตอบเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps

แคปซูลข้อมูลรีวิวของผู้ใช้ที่ตอบคำถามเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps

ช่อง

title string  (ไม่บังคับ)

ชื่อของรีวิว

url string  (ไม่บังคับ)

ลิงก์ที่สอดคล้องกับรีวิวของผู้ใช้ใน Google Maps

review_id string  (ไม่บังคับ)

รหัสของตัวอย่างรีวิว

widget_context_token string  (ไม่บังคับ)

ชื่อทรัพยากรของโทเค็นบริบทของวิดเจ็ต Google Maps

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

ตัวอย่าง

ข้อความ

{
  "type": "text",
  "text": "Hello, how are you?"
}

รูปภาพ

{
  "type": "image",
  "data": "BASE64_ENCODED_IMAGE",
  "mime_type": "image/png"
}

เสียง

{
  "type": "audio",
  "data": "BASE64_ENCODED_AUDIO",
  "mime_type": "audio/wav"
}

เอกสาร

{
  "type": "document",
  "data": "BASE64_ENCODED_DOCUMENT",
  "mime_type": "application/pdf"
}

วิดีโอ

{
  "type": "video",
  "uri": "https://www.youtube.com/watch?v=9hE5-98ZeCg"
}

ความคิด

{
  "type": "thought",
  "summary": [
    {
      "type": "text",
      "text": "The user is asking about the weather. I should use the get_weather tool."
    }
  ],
  "signature": "CoMDAXLI2nynRYojJIy6B1Jh9os2crpWLfB0+19xcLsGG46bd8wjkF/6RNlRUdvHrXyjsHkG0BZFcuO/bPOyA6Xh5jANNgx82wPHjGExN8A4ZQn56FlMwyZoqFVQz0QyY1lfibFJ2zU3J87uw26OewzcuVX0KEcs+GIsZa3EA6WwqhbsOd3wtZB3Ua2Qf98VAWZTS5y/tWpql7jnU3/CU7pouxQr/Bwft3hwnJNesQ9/dDJTuaQ8Zprh9VRWf1aFFjpIueOjBRrlT3oW6/y/eRl/Gt9BQXCYTqg/38vHFUU4Wo/d9dUpvfCe/a3o97t2Jgxp34oFKcsVb4S5WJrykIkw+14DzVnTpCpbQNFckqvFLuqnJCkL0EQFtunBXI03FJpPu3T1XU6id8S7ojoJQZSauGUCgmaLqUGdMrd08oo81ecoJSLs51Re9N/lISGmjWFPGpqJLoGq6uo4FHz58hmeyXCgHG742BHz2P3MiH1CXHUT2J8mF6zLhf3SR9Qb3lkrobAh"
}

Function Call

{
  "type": "function_call",
  "name": "get_weather",
  "id": "gth23981",
  "arguments": {
    "location": "Boston, MA"
  }
}

การเรียกใช้การรันโค้ด

{
  "type": "code_execution_call",
  "id": "call_123456",
  "arguments": {
    "language": "python",
    "code": "print('hello world')"
  }
}

การเรียกบริบท URL

{
  "type": "url_context_call",
  "id": "call_123456",
  "arguments": {
    "urls": [
      "https://www.example.com"
    ]
  }
}

การเรียกใช้เครื่องมือเซิร์ฟเวอร์ MCP

{
  "type": "mcp_server_tool_call",
  "id": "call_123456",
  "name": "get_forecast",
  "server_name": "weather_server",
  "arguments": {
    "city": "London"
  }
}

การโทรผ่าน Google Search

{
  "type": "google_search_call",
  "id": "call_123456",
  "arguments": {
    "queries": [
      "weather in Boston"
    ]
  }
}

การเรียกค้นหาไฟล์

{
  "type": "file_search_call",
  "id": "call_123456"
}

การโทรผ่าน Google Maps

{
  "type": "google_maps_call",
  "id": "call_123456",
  "arguments": {
    "query": "best food near me"
  }
}

ผลลัพธ์ของฟังก์ชัน

{
  "type": "function_result",
  "name": "get_weather",
  "call_id": "gth23981",
  "result": [
    {
      "type": "text",
      "text": "{\"weather\":\"sunny\"}"
    }
  ]
}

ผลการดำเนินการโค้ด

{
  "type": "code_execution_result",
  "call_id": "call_123456",
  "result": "hello world"
}

ผลลัพธ์บริบท URL

{
  "type": "url_context_result",
  "call_id": "call_123456",
  "result": [
    {
      "url": "https://www.example.com",
      "status": "SUCCESS"
    }
  ]
}

ผลการค้นหาของ Google

{
  "type": "google_search_result",
  "call_id": "call_123456",
  "result": [
    {
      "url": "https://www.google.com/search?q=weather+in+Boston",
      "title": "Weather in Boston"
    }
  ]
}

ผลลัพธ์ของเครื่องมือเซิร์ฟเวอร์ MCP

{
  "type": "mcp_server_tool_result",
  "name": "get_forecast",
  "server_name": "weather_server",
  "call_id": "call_123456",
  "result": "sunny"
}

ผลการค้นหาไฟล์

{
  "type": "file_search_result",
  "call_id": "call_123456",
  "result": [
    {
      "text": "search result chunk",
      "file_search_store": "file_search_store"
    }
  ]
}

ผลการค้นหาของ Google Maps

{
  "type": "google_maps_result",
  "call_id": "call_123456",
  "result": [
    {
      "places": [
        {
          "url": "https://www.google.com/maps/search/best+food+near+me",
          "name": "Tasty Restaurant"
        }
      ]
    }
  ]
}

เครื่องมือ

เครื่องมือที่โมเดลใช้ได้

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบหลายรูปแบบ: type

ฟังก์ชัน

เครื่องมือที่โมเดลใช้ได้

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "function" เสมอ

name string  (ไม่บังคับ)

ชื่อฟังก์ชัน

description string  (ไม่บังคับ)

คำอธิบายฟังก์ชัน

พารามิเตอร์ ออบเจ็กต์  (ไม่บังคับ)

สคีมา JSON สำหรับพารามิเตอร์ของฟังก์ชัน

CodeExecution

เครื่องมือที่โมเดลใช้ดำเนินการกับโค้ดได้

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "code_execution" เสมอ

UrlContext

เครื่องมือที่โมเดลใช้เพื่อดึงบริบท URL ได้

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "url_context" เสมอ

ComputerUse

เครื่องมือที่โมเดลใช้โต้ตอบกับคอมพิวเตอร์ได้

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "computer_use" เสมอ

environment enum (string)  (ไม่บังคับ)

สภาพแวดล้อมที่ดำเนินการ

ค่าที่เป็นไปได้ มีดังนี้

  • browser
excludedPredefinedFunctions array (string)  (ไม่บังคับ)

รายการฟังก์ชันที่กำหนดไว้ล่วงหน้าซึ่งยกเว้นจากการเรียกโมเดล

McpServer

MCPServer คือเซิร์ฟเวอร์ที่โมเดลเรียกใช้เพื่อดำเนินการได้

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "mcp_server" เสมอ

name string  (ไม่บังคับ)

ชื่อของ MCPServer

url string  (ไม่บังคับ)

URL แบบเต็มสำหรับปลายทาง MCPServer ตัวอย่างเช่น "https://api.example.com/mcp"

ส่วนหัว ออบเจ็กต์  (ไม่บังคับ)

ไม่บังคับ: ช่องสำหรับส่วนหัวการตรวจสอบสิทธิ์ การหมดเวลา ฯลฯ หากจำเป็น

allowed_tools AllowedTools  (ไม่บังคับ)

เครื่องมือที่อนุญาต

การกำหนดค่าสำหรับเครื่องมือที่อนุญาต

ช่อง

mode ToolChoiceType  (ไม่บังคับ)

โหมดการเลือกเครื่องมือ

ค่าที่เป็นไปได้ มีดังนี้

  • auto
  • any
  • none
  • validated

เครื่องมือ อาร์เรย์ (สตริง)  (ไม่บังคับ)

ชื่อของเครื่องมือที่อนุญาต

GoogleSearch

เครื่องมือที่โมเดลใช้ค้นหาใน Google ได้

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "google_search" เสมอ

search_types array (enum (string))  (ไม่บังคับ)

ประเภทของการเชื่อมต่อแหล่งข้อมูลการค้นหาที่จะเปิดใช้

ค่าที่เป็นไปได้ มีดังนี้

  • web_search
  • image_search
  • enterprise_web_search
FileSearch

เครื่องมือที่โมเดลใช้ค้นหาไฟล์ได้

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "file_search" เสมอ

file_search_store_names array (string)  (ไม่บังคับ)

ไฟล์จะจัดเก็บชื่อที่ใช้ค้นหา

top_k integer  (ไม่บังคับ)

จำนวนกลุ่มการดึงข้อมูลเชิงความหมายที่จะดึงข้อมูล

metadata_filter string  (ไม่บังคับ)

ตัวกรองข้อมูลเมตาที่จะใช้กับเอกสารและการแบ่งกลุ่มการดึงข้อมูลเชิงความหมาย

GoogleMaps

เครื่องมือที่โมเดลใช้เรียก Google Maps ได้

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "google_maps" เสมอ

enable_widget boolean  (ไม่บังคับ)

ระบุว่าจะแสดงโทเค็นบริบทของวิดเจ็ตในผลการเรียกใช้เครื่องมือของ การตอบกลับหรือไม่

latitude number  (ไม่บังคับ)

ละติจูดของตำแหน่งของผู้ใช้

longitude number  (ไม่บังคับ)

ลองจิจูดของตำแหน่งของผู้ใช้

การดึงข้อมูล

เครื่องมือที่โมเดลใช้เพื่อดึงข้อมูลไฟล์

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "retrieval" เสมอ

retrieval_types array (enum (string))  (ไม่บังคับ)

ประเภทการดึงข้อมูลไฟล์ที่จะเปิดใช้

ค่าที่เป็นไปได้ มีดังนี้

  • vertex_ai_search
vertex_ai_search_config VertexAISearchConfig  (ไม่บังคับ)

ใช้เพื่อระบุการกำหนดค่าสำหรับ VertexAISearch

ใช้เพื่อระบุการกำหนดค่าสำหรับ VertexAISearch

ช่อง

engine string  (ไม่บังคับ)

ไม่บังคับ ใช้เพื่อระบุ Vertex AI Search

datastores อาร์เรย์ (สตริง)  (ไม่บังคับ)

ไม่บังคับ ใช้เพื่อระบุพื้นที่เก็บข้อมูล Vertex AI Search

ตัวอย่าง

ฟังก์ชัน

CodeExecution

UrlContext

ComputerUse

McpServer

GoogleSearch

FileSearch

GoogleMaps

การดึงข้อมูล

ไม่มีตัวอย่างสำหรับประเภทนี้

เปิดหรือปิด

ช่อง

role string  (ไม่บังคับ)

ผู้เริ่มการสนทนานี้ ต้องเป็นผู้ใช้สำหรับอินพุตหรือโมเดลสำหรับ เอาต์พุตโมเดล

content array (Content) หรือ string  (ไม่บังคับ)

ไม่มีคำอธิบาย

ตัวอย่าง

เทิร์นของผู้ใช้

{
  "role": "user",
  "content": [
    {
      "type": "text",
      "text": "user turn"
    }
  ]
}

ผลัดกันตอบ

{
  "role": "model",
  "content": [
    {
      "type": "text",
      "text": "model turn"
    }
  ]
}

InteractionSseEvent

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบหลายรูปแบบ: event_type

InteractionStartEvent

event_type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "interaction.start" เสมอ

interaction Interaction  (ต้องระบุ)

ไม่มีคำอธิบาย

event_id string  (ไม่บังคับ)

โทเค็น event_id ที่จะใช้เพื่อดำเนินการต่อในสตรีมการโต้ตอบจากเหตุการณ์นี้

InteractionCompleteEvent

event_type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "interaction.complete" เสมอ

interaction Interaction  (ต้องระบุ)

ต้องระบุ การโต้ตอบที่เสร็จสมบูรณ์โดยมีเอาต์พุตว่างเปล่าเพื่อลดขนาดเพย์โหลด ใช้เหตุการณ์ ContentDelta ก่อนหน้าสำหรับเอาต์พุตจริง

event_id string  (ไม่บังคับ)

โทเค็น event_id ที่จะใช้เพื่อดำเนินการต่อในสตรีมการโต้ตอบจากเหตุการณ์นี้

InteractionStatusUpdate

event_type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "interaction.status_update" เสมอ

interaction_id string  (ต้องระบุ)

ไม่มีคำอธิบาย

สถานะ enum (string)  (ต้องระบุ)

ไม่มีคำอธิบาย

ค่าที่เป็นไปได้ มีดังนี้

  • in_progress
  • requires_action
  • completed
  • failed
  • cancelled
  • incomplete
event_id string  (ไม่บังคับ)

โทเค็น event_id ที่จะใช้เพื่อดำเนินการต่อในสตรีมการโต้ตอบจากเหตุการณ์นี้

ContentStart

event_type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "content.start" เสมอ

index integer  (ต้องระบุ)

ไม่มีคำอธิบาย

เนื้อหา เนื้อหา  (ต้องระบุ)

ไม่มีคำอธิบาย

event_id string  (ไม่บังคับ)

โทเค็น event_id ที่จะใช้เพื่อดำเนินการต่อในสตรีมการโต้ตอบจากเหตุการณ์นี้

ContentDelta

event_type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "content.delta" เสมอ

index integer  (ต้องระบุ)

ไม่มีคำอธิบาย

delta ContentDeltaData  (ต้องระบุ)

ไม่มีคำอธิบาย

ข้อมูลเนื้อหาเดลต้าสำหรับบล็อกเนื้อหา

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบหลายรูปแบบ: type

TextDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "text" เสมอ

ข้อความ สตริง  (ต้องระบุ)

ไม่มีคำอธิบาย

ImageDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "image" เสมอ

data string  (ไม่บังคับ)

ไม่มีคำอธิบาย

uri สตริง  (ไม่บังคับ)

ไม่มีคำอธิบาย

mime_type enum (string)  (ไม่บังคับ)

ไม่มีคำอธิบาย

ค่าที่เป็นไปได้ มีดังนี้

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
  • image/gif
  • image/bmp
  • image/tiff
resolution MediaResolution  (ไม่บังคับ)

ความละเอียดของสื่อ

ค่าที่เป็นไปได้ มีดังนี้

  • low
  • medium
  • high
  • ultra_high

AudioDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "audio" เสมอ

data string  (ไม่บังคับ)

ไม่มีคำอธิบาย

uri สตริง  (ไม่บังคับ)

ไม่มีคำอธิบาย

mime_type enum (string)  (ไม่บังคับ)

ไม่มีคำอธิบาย

ค่าที่เป็นไปได้ มีดังนี้

  • audio/wav
  • audio/mp3
  • audio/aiff
  • audio/aac
  • audio/ogg
  • audio/flac
  • audio/mpeg
  • audio/m4a
  • audio/l16
  • audio/opus
  • audio/alaw
  • audio/mulaw
rate integer  (ไม่บังคับ)

อัตราการสุ่มตัวอย่างของเสียง

channels integer  (ไม่บังคับ)

จำนวนช่องเสียง

DocumentDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "document" เสมอ

data string  (ไม่บังคับ)

ไม่มีคำอธิบาย

uri สตริง  (ไม่บังคับ)

ไม่มีคำอธิบาย

mime_type enum (string)  (ไม่บังคับ)

ไม่มีคำอธิบาย

ค่าที่เป็นไปได้ มีดังนี้

  • application/pdf
VideoDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "video" เสมอ

data string  (ไม่บังคับ)

ไม่มีคำอธิบาย

uri สตริง  (ไม่บังคับ)

ไม่มีคำอธิบาย

mime_type enum (string)  (ไม่บังคับ)

ไม่มีคำอธิบาย

ค่าที่เป็นไปได้ มีดังนี้

  • video/mp4
  • video/mpeg
  • video/mpg
  • video/mov
  • video/avi
  • video/x-flv
  • video/webm
  • video/wmv
  • video/3gpp
resolution MediaResolution  (ไม่บังคับ)

ความละเอียดของสื่อ

ค่าที่เป็นไปได้ มีดังนี้

  • low
  • medium
  • high
  • ultra_high

ThoughtSummaryDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "thought_summary" เสมอ

content ThoughtSummaryContent  (ไม่บังคับ)

รายการสรุปใหม่ที่จะเพิ่มลงในความคิด

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบหลายรูปแบบ: type

TextContent

บล็อกเนื้อหาข้อความ

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "text" เสมอ

ข้อความ สตริง  (ต้องระบุ)

ต้องระบุ เนื้อหาข้อความ

annotations Annotation  (ไม่บังคับ)

ข้อมูลการอ้างอิงสำหรับเนื้อหาที่โมเดลสร้างขึ้น

ข้อมูลการอ้างอิงสำหรับเนื้อหาที่โมเดลสร้างขึ้น

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบหลายรูปแบบ: type

UrlCitation

คำอธิบายประกอบการอ้างอิง URL

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "url_citation" เสมอ

url string  (ไม่บังคับ)

URL

title string  (ไม่บังคับ)

ชื่อของ URL

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

FileCitation

คำอธิบายประกอบการอ้างอิงไฟล์

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "file_citation" เสมอ

document_uri string  (ไม่บังคับ)

URI ของไฟล์

file_name string  (ไม่บังคับ)

ชื่อไฟล์

แหล่งที่มา สตริง  (ไม่บังคับ)

แหล่งที่มาของข้อความบางส่วน

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

PlaceCitation

คำอธิบายประกอบการอ้างอิงสถานที่

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "place_citation" เสมอ

place_id string  (ไม่บังคับ)

รหัสของสถานที่ในรูปแบบ `places/{place_id}`

name string  (ไม่บังคับ)

ชื่อสถานที่

url string  (ไม่บังคับ)

ข้อมูลอ้างอิง URI ของสถานที่

review_snippets ReviewSnippet  (ไม่บังคับ)

ข้อมูลรีวิวที่ใช้ในการสร้างคำตอบเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps

แคปซูลข้อมูลรีวิวของผู้ใช้ที่ตอบคำถามเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps

ช่อง

title string  (ไม่บังคับ)

ชื่อของรีวิว

url string  (ไม่บังคับ)

ลิงก์ที่สอดคล้องกับรีวิวของผู้ใช้ใน Google Maps

review_id string  (ไม่บังคับ)

รหัสของตัวอย่างรีวิว

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

ImageContent

บล็อกเนื้อหารูปภาพ

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "image" เสมอ

data string  (ไม่บังคับ)

เนื้อหารูปภาพ

uri สตริง  (ไม่บังคับ)

URI ของรูปภาพ

mime_type enum (string)  (ไม่บังคับ)

ประเภท MIME ของรูปภาพ

ค่าที่เป็นไปได้ มีดังนี้

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
  • image/gif
  • image/bmp
  • image/tiff
resolution MediaResolution  (ไม่บังคับ)

ความละเอียดของสื่อ

ค่าที่เป็นไปได้ มีดังนี้

  • low
  • medium
  • high
  • ultra_high

ThoughtSignatureDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "thought_signature" เสมอ

ลายเซ็น สตริง  (ไม่บังคับ)

ลายเซ็นที่ตรงกับแหล่งข้อมูลแบ็กเอนด์เพื่อเป็นส่วนหนึ่งของการสร้าง

FunctionCallDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "function_call" เสมอ

name string  (ต้องระบุ)

ไม่มีคำอธิบาย

อาร์กิวเมนต์ object  (ต้องระบุ)

ไม่มีคำอธิบาย

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

CodeExecutionCallDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "code_execution_call" เสมอ

arguments CodeExecutionCallArguments  (ต้องระบุ)

ไม่มีคำอธิบาย

อาร์กิวเมนต์ที่จะส่งผ่านไปยังการเรียกใช้โค้ด

ช่อง

language enum (string)  (ไม่บังคับ)

ภาษาโปรแกรมของ `code`

ค่าที่เป็นไปได้ มีดังนี้

  • python
รหัส สตริง  (ไม่บังคับ)

โค้ดที่จะดำเนินการ

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

UrlContextCallDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "url_context_call" เสมอ

arguments UrlContextCallArguments  (ต้องระบุ)

ไม่มีคำอธิบาย

อาร์กิวเมนต์ที่จะส่งไปยังบริบท URL

ช่อง

urls array (string)  (ไม่บังคับ)

URL ที่จะดึงข้อมูล

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

GoogleSearchCallDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "google_search_call" เสมอ

arguments GoogleSearchCallArguments  (ต้องระบุ)

ไม่มีคำอธิบาย

อาร์กิวเมนต์ที่จะส่งไปยัง Google Search

ช่อง

queries อาร์เรย์ (สตริง)  (ไม่บังคับ)

คำค้นหาใน Web Search สำหรับการค้นหาเว็บเพิ่มเติม

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

McpServerToolCallDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "mcp_server_tool_call" เสมอ

name string  (ต้องระบุ)

ไม่มีคำอธิบาย

server_name string  (ต้องระบุ)

ไม่มีคำอธิบาย

อาร์กิวเมนต์ object  (ต้องระบุ)

ไม่มีคำอธิบาย

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

FileSearchCallDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "file_search_call" เสมอ

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

GoogleMapsCallDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "google_maps_call" เสมอ

arguments GoogleMapsCallArguments  (ไม่บังคับ)

อาร์กิวเมนต์ที่จะส่งไปยังเครื่องมือ Google Maps

อาร์กิวเมนต์ที่จะส่งไปยังเครื่องมือ Google Maps

ช่อง

queries อาร์เรย์ (สตริง)  (ไม่บังคับ)

คำค้นหาที่จะดำเนินการ

id string  (ต้องระบุ)

ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

FunctionResultDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "function_result" เสมอ

name string  (ไม่บังคับ)

ไม่มีคำอธิบาย

is_error boolean  (ไม่บังคับ)

ไม่มีคำอธิบาย

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

result array (FunctionResultSubcontent) หรือสตริง  (ต้องระบุ)

ไม่มีคำอธิบาย

CodeExecutionResultDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "code_execution_result" เสมอ

result string  (ต้องระบุ)

ไม่มีคำอธิบาย

is_error boolean  (ไม่บังคับ)

ไม่มีคำอธิบาย

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

UrlContextResultDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "url_context_result" เสมอ

result UrlContextResult  (ต้องระบุ)

ไม่มีคำอธิบาย

ผลลัพธ์ของบริบท URL

ช่อง

url string  (ไม่บังคับ)

URL ที่ดึงข้อมูล

status enum (string)  (ไม่บังคับ)

สถานะของการดึงข้อมูล URL

ค่าที่เป็นไปได้ มีดังนี้

  • success
  • error
  • paywall
  • unsafe
is_error boolean  (ไม่บังคับ)

ไม่มีคำอธิบาย

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

GoogleSearchResultDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "google_search_result" เสมอ

result GoogleSearchResult  (ต้องระบุ)

ไม่มีคำอธิบาย

ผลการค้นหาของ Google Search

ช่อง

search_suggestions string  (ไม่บังคับ)

ข้อมูลโค้ดเนื้อหาเว็บที่ฝังในหน้าเว็บหรือ WebView ของแอปได้

is_error boolean  (ไม่บังคับ)

ไม่มีคำอธิบาย

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

McpServerToolResultDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "mcp_server_tool_result" เสมอ

name string  (ไม่บังคับ)

ไม่มีคำอธิบาย

server_name string  (ไม่บังคับ)

ไม่มีคำอธิบาย

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

result array (FunctionResultSubcontent) หรือสตริง  (ต้องระบุ)

ไม่มีคำอธิบาย

FileSearchResultDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "file_search_result" เสมอ

result FileSearchResult  (ต้องระบุ)

ไม่มีคำอธิบาย

ผลการค้นหาไฟล์

ช่อง

custom_metadata array (object)  (ไม่บังคับ)

ข้อมูลเมตาที่ผู้ใช้ระบุเกี่ยวกับ FileSearchResult

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

GoogleMapsResultDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "google_maps_result" เสมอ

result GoogleMapsResult  (ไม่บังคับ)

ผลลัพธ์ของ Google Maps

ผลลัพธ์ของ Google Maps

ช่อง

places Places  (ไม่บังคับ)

สถานที่ที่พบ

ช่อง

place_id string  (ไม่บังคับ)

รหัสของสถานที่ในรูปแบบ `places/{place_id}`

name string  (ไม่บังคับ)

ชื่อสถานที่

url string  (ไม่บังคับ)

ข้อมูลอ้างอิง URI ของสถานที่

review_snippets ReviewSnippet  (ไม่บังคับ)

ข้อมูลรีวิวที่ใช้ในการสร้างคำตอบเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps

แคปซูลข้อมูลรีวิวของผู้ใช้ที่ตอบคำถามเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps

ช่อง

title string  (ไม่บังคับ)

ชื่อของรีวิว

url string  (ไม่บังคับ)

ลิงก์ที่สอดคล้องกับรีวิวของผู้ใช้ใน Google Maps

review_id string  (ไม่บังคับ)

รหัสของตัวอย่างรีวิว

widget_context_token string  (ไม่บังคับ)

ชื่อทรัพยากรของโทเค็นบริบทของวิดเจ็ต Google Maps

call_id string  (ต้องระบุ)

ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน

ลายเซ็น สตริง  (ไม่บังคับ)

แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์

TextAnnotationDelta

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "text_annotation" เสมอ

annotations Annotation  (ไม่บังคับ)

ข้อมูลการอ้างอิงสำหรับเนื้อหาที่โมเดลสร้างขึ้น

ข้อมูลการอ้างอิงสำหรับเนื้อหาที่โมเดลสร้างขึ้น

ประเภทที่เป็นไปได้

ตัวแยกประเภทแบบหลายรูปแบบ: type

UrlCitation

คำอธิบายประกอบการอ้างอิง URL

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "url_citation" เสมอ

url string  (ไม่บังคับ)

URL

title string  (ไม่บังคับ)

ชื่อของ URL

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

FileCitation

คำอธิบายประกอบการอ้างอิงไฟล์

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "file_citation" เสมอ

document_uri string  (ไม่บังคับ)

URI ของไฟล์

file_name string  (ไม่บังคับ)

ชื่อไฟล์

แหล่งที่มา สตริง  (ไม่บังคับ)

แหล่งที่มาของข้อความบางส่วน

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

PlaceCitation

คำอธิบายประกอบการอ้างอิงสถานที่

type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "place_citation" เสมอ

place_id string  (ไม่บังคับ)

รหัสของสถานที่ในรูปแบบ `places/{place_id}`

name string  (ไม่บังคับ)

ชื่อสถานที่

url string  (ไม่บังคับ)

ข้อมูลอ้างอิง URI ของสถานที่

review_snippets ReviewSnippet  (ไม่บังคับ)

ข้อมูลรีวิวที่ใช้ในการสร้างคำตอบเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps

แคปซูลข้อมูลรีวิวของผู้ใช้ที่ตอบคำถามเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps

ช่อง

title string  (ไม่บังคับ)

ชื่อของรีวิว

url string  (ไม่บังคับ)

ลิงก์ที่สอดคล้องกับรีวิวของผู้ใช้ใน Google Maps

review_id string  (ไม่บังคับ)

รหัสของตัวอย่างรีวิว

start_index integer  (ไม่บังคับ)

จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์

end_index integer  (ไม่บังคับ)

จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)

event_id string  (ไม่บังคับ)

โทเค็น event_id ที่จะใช้เพื่อดำเนินการต่อในสตรีมการโต้ตอบจากเหตุการณ์นี้

ContentStop

event_type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "content.stop" เสมอ

index integer  (ต้องระบุ)

ไม่มีคำอธิบาย

event_id string  (ไม่บังคับ)

โทเค็น event_id ที่จะใช้เพื่อดำเนินการต่อในสตรีมการโต้ตอบจากเหตุการณ์นี้

ErrorEvent

event_type object  (ต้องระบุ)

ไม่มีคำอธิบาย

ตั้งค่าเป็น "error" เสมอ

ข้อผิดพลาด ข้อผิดพลาด  (ไม่บังคับ)

ไม่มีคำอธิบาย

ข้อความแสดงข้อผิดพลาดจากการโต้ตอบ

ช่อง

รหัส สตริง  (ไม่บังคับ)

URI ที่ระบุประเภทข้อผิดพลาด

ข้อความ สตริง  (ไม่บังคับ)

ข้อความแสดงข้อผิดพลาดที่มนุษย์อ่านได้

event_id string  (ไม่บังคับ)

โทเค็น event_id ที่จะใช้เพื่อดำเนินการต่อในสตรีมการโต้ตอบจากเหตุการณ์นี้

ตัวอย่าง

เริ่มการโต้ตอบ

{
  "event_type": "interaction.start",
  "interaction": {
    "id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM",
    "model": "gemini-3-flash-preview",
    "object": "interaction",
    "status": "in_progress"
  }
}

การโต้ตอบเสร็จสมบูรณ์

{
  "event_type": "interaction.complete",
  "interaction": {
    "created": "2025-12-09T18:45:40Z",
    "id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM",
    "model": "gemini-3-flash-preview",
    "object": "interaction",
    "role": "model",
    "status": "completed",
    "updated": "2025-12-09T18:45:40Z",
    "usage": {
      "input_tokens_by_modality": [
        {
          "modality": "text",
          "tokens": 11
        }
      ],
      "total_cached_tokens": 0,
      "total_input_tokens": 11,
      "total_output_tokens": 364,
      "total_thought_tokens": 1120,
      "total_tokens": 1495,
      "total_tool_use_tokens": 0
    }
  }
}

การอัปเดตสถานะการโต้ตอบ

{
  "event_type": "interaction.status_update",
  "interaction_id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM",
  "status": "in_progress"
}

เริ่มเนื้อหา

{
  "event_type": "content.start",
  "content": {
    "type": "text"
  },
  "index": 1
}

การเปลี่ยนแปลงของเนื้อหา

{
  "event_type": "content.delta",
  "delta": {
    "type": "text",
    "text": "Elara\u2019s life was a symphony of quiet moments. A librarian, she found solace in the hushed aisles, the scent of aged paper, and the predictable rhythm of her days. Her small apartment, meticulously ordered, reflected this internal calm, save"
  },
  "index": 1
}

หยุดเนื้อหา

{
  "event_type": "content.stop",
  "index": 1
}

เหตุการณ์ข้อผิดพลาด

{
  "event_type": "error",
  "error": {
    "message": "Failed to get completed interaction: Result not found.",
    "code": "not_found"
  }
}