Gemini Interactions API เป็น API เวอร์ชันทดลองที่ช่วยให้นักพัฒนาซอฟต์แวร์สร้างแอปพลิเคชัน Generative AI โดยใช้โมเดล Gemini ได้ Gemini เป็นโมเดลที่มีความสามารถมากที่สุดของเรา ซึ่งสร้างขึ้นมาใหม่ให้ทำงานกับข้อมูลหลายรูปแบบ สามารถสรุปและทำความเข้าใจ ทำงานท่ามกลางความหลากของข้อมูล และรวมข้อมูลประเภทต่างๆ เข้าด้วยกันได้อย่างราบรื่น ทั้งภาษา รูปภาพ เสียง วิดีโอ และโค้ด คุณสามารถใช้ Gemini API สำหรับ Use Case ต่างๆ เช่น การให้เหตุผลในข้อความและรูปภาพ การสร้างเนื้อหา เอเจนต์โต้ตอบ ระบบสรุปและจัดประเภท และอื่นๆ
การสร้างการโต้ตอบ
สร้างการโต้ตอบใหม่
เนื้อความของคำขอ
เนื้อหาของคำขอมีข้อมูลซึ่งมีโครงสร้างดังต่อไปนี้
model ModelOption (ไม่บังคับ)
ชื่อของ `Model` ที่ใช้ในการสร้างการโต้ตอบ
ต้องระบุหากไม่ได้ระบุ `agent`
ค่าที่เป็นไปได้ มีดังนี้
-
gemini-2.5-computer-use-preview-10-2025โมเดลความสามารถแบบเป็น Agent ที่ออกแบบมาสำหรับการโต้ตอบกับอินเทอร์เฟซโดยตรง ซึ่งช่วยให้ Gemini รับรู้และไปยังส่วนต่างๆ ของสภาพแวดล้อมดิจิทัลได้
-
gemini-2.5-flashโมเดลการให้เหตุผลแบบไฮบริดรุ่นแรกของเราซึ่งรองรับหน้าต่างบริบทขนาด 1 ล้านโทเค็นและมีงบประมาณสำหรับการคิด
-
gemini-2.5-flash-imageโมเดลการสร้างรูปภาพในตัวของเราที่ได้รับการเพิ่มประสิทธิภาพเพื่อความเร็ว ความยืดหยุ่น และความเข้าใจบริบท ระบบจะคิดราคาอินพุตและเอาต์พุตข้อความเหมือนกับ 2.5 Flash
-
gemini-2.5-flash-liteโมเดลที่มีขนาดเล็กที่สุดและคุ้มค่าที่สุดของเรา ซึ่งสร้างขึ้นเพื่อการใช้งานในวงกว้าง
-
gemini-2.5-flash-lite-preview-09-2025โมเดลล่าสุดที่อิงตาม Gemini 2.5 Flash lite ซึ่งได้รับการเพิ่มประสิทธิภาพเพื่อความคุ้มค่า การส่งข้อความปริมาณมาก และคุณภาพสูง
-
gemini-2.5-flash-native-audio-preview-12-2025โมเดลเสียงดั้งเดิมของเราได้รับการเพิ่มประสิทธิภาพเพื่อเอาต์พุตเสียงคุณภาพสูงขึ้นพร้อมการเว้นวรรคที่ดีขึ้น ความเป็นธรรมชาติของเสียง ความละเอียด และอารมณ์
-
gemini-2.5-flash-preview-09-2025โมเดลล่าสุดที่อิงตามโมเดล 2.5 Flash 2.5 Flash Preview เหมาะที่สุดสำหรับการประมวลผลขนาดใหญ่ งานที่มีเวลาในการตอบสนองต่ำและมีปริมาณมากซึ่งต้องใช้ความคิด และกรณีการใช้งานแบบเอเจนต์
-
gemini-2.5-flash-preview-ttsโมเดลข้อความเป็นคำพูด 2.5 Flash ของเราได้รับการเพิ่มประสิทธิภาพเพื่อการสร้างคำพูดที่ควบคุมได้ซึ่งมีประสิทธิภาพและมีความหน่วงต่ำ
-
gemini-2.5-proโมเดลอเนกประสงค์ที่ล้ำสมัยของเรา ซึ่งโดดเด่นด้านการเขียนโค้ดและงานการให้เหตุผลที่ซับซ้อน
-
gemini-2.5-pro-preview-ttsโมเดลเสียงอ่านออกเสียงข้อความ 2.5 Pro ของเราได้รับการเพิ่มประสิทธิภาพเพื่อการสร้างเสียงพูดที่ทรงพลังและมีเวลาในการตอบสนองต่ำ เพื่อให้ได้ผลลัพธ์ที่เป็นธรรมชาติมากขึ้นและควบคุมพรอมต์ได้ง่ายขึ้น
-
gemini-3-flash-previewโมเดลที่ชาญฉลาดที่สุดของเราสร้างขึ้นเพื่อเน้นความเร็ว โดยผสานความชาญฉลาดระดับแนวหน้าเข้ากับการค้นหาและการเชื่อมต่อแหล่งข้อมูลที่เหนือกว่า
-
gemini-3-pro-image-previewโมเดลการสร้างและแก้ไขรูปภาพที่ล้ำสมัย
-
gemini-3-pro-previewโมเดลที่ชาญฉลาดที่สุดของเราซึ่งมีการให้เหตุผลและทำความเข้าใจข้อมูลหลายรูปแบบระดับ SOTA รวมถึงความสามารถในการเขียนโค้ดแบบเป็น Agent และ Vibe Coding ที่ทรงพลัง
-
gemini-3.1-pro-previewโมเดลการให้เหตุผล SOTA ล่าสุดของเราที่มีความลึกซึ้งและเฉดสีที่ไม่เคยมีมาก่อน รวมถึงความสามารถในการทำความเข้าใจข้อมูลหลายรูปแบบและการเขียนโค้ดที่ทรงพลัง
-
gemini-3.1-flash-image-previewความสามารถด้านภาพระดับมืออาชีพที่มีประสิทธิภาพระดับ Flash และความสามารถในการสร้างที่อิงตามความเป็นจริง
-
gemini-3.1-flash-lite-previewโมเดลที่มีประสิทธิภาพด้านต้นทุนมากที่สุดของเรา ซึ่งได้รับการเพิ่มประสิทธิภาพสำหรับงานที่ต้องใช้ Agent จำนวนมาก การแปล และการประมวลผลข้อมูลอย่างง่าย
-
gemini-3.1-flash-tts-previewTTS ของ Gemini 3.1 Flash: การสร้างคำพูดที่ทรงพลังและมีเวลาในการตอบสนองต่ำ เพลิดเพลินกับเอาต์พุตที่เป็นธรรมชาติ พรอมต์ที่ควบคุมได้ และแท็กเสียงแบบใหม่ที่สื่ออารมณ์เพื่อการควบคุมการบรรยายที่แม่นยำ
-
lyria-3-clip-previewโมเดลการสร้างเพลงที่มีเวลาในการตอบสนองต่ำของเราได้รับการเพิ่มประสิทธิภาพสำหรับคลิปเสียงที่มีความละเอียดสูงและการควบคุมจังหวะที่แม่นยำ
-
lyria-3-pro-previewโมเดล Generative สำหรับเพลงเต็มขั้นสูงของเราที่มีความเข้าใจด้านการเรียบเรียงเพลงอย่างลึกซึ้ง ซึ่งได้รับการเพิ่มประสิทธิภาพเพื่อการควบคุมโครงสร้างที่แม่นยำและการเปลี่ยนผ่านที่ซับซ้อนในสไตล์ดนตรีที่หลากหลาย
agent AgentOption (ไม่บังคับ)
ชื่อของ `Agent` ที่ใช้สร้างการโต้ตอบ
ต้องระบุหากไม่ได้ระบุ `model`
ค่าที่เป็นไปได้ มีดังนี้
-
deep-research-pro-preview-12-2025เอเจนต์ Deep Research ของ Gemini
-
deep-research-preview-04-2026เอเจนต์ Deep Research ของ Gemini
-
deep-research-max-preview-04-2026Gemini Deep Research Max Agent
อินพุตสำหรับการโต้ตอบ (ใช้ร่วมกันทั้งโมเดลและเอเจนต์)
คำสั่งของระบบสำหรับการโต้ตอบ
รายการการประกาศเครื่องมือที่โมเดลอาจเรียกใช้ระหว่างการโต้ตอบ
บังคับให้การตอบกลับที่สร้างขึ้นเป็นออบเจ็กต์ JSON ที่เป็นไปตามสคีมา JSON ที่ระบุในฟิลด์นี้
ประเภท MIME ของการตอบกลับ ต้องระบุหากตั้งค่า response_format
อินพุตเท่านั้น จะมีการสตรีมการโต้ตอบหรือไม่
อินพุตเท่านั้น จะจัดเก็บคำตอบและคำขอเพื่อเรียกข้อมูลในภายหลังหรือไม่
อินพุตเท่านั้น ว่าจะเรียกใช้การโต้ตอบกับโมเดลในเบื้องหลังหรือไม่
generation_config GenerationConfig (ไม่บังคับ)
การกำหนดค่าโมเดล
พารามิเตอร์การกำหนดค่าสำหรับการโต้ตอบกับโมเดล
ทางเลือกแทน `agent_config` ใช้ได้เฉพาะเมื่อตั้งค่า `model`
ช่อง
ควบคุมความสุ่มของเอาต์พุต
ความน่าจะเป็นสะสมสูงสุดของโทเค็นที่ต้องพิจารณาเมื่อทำการสุ่มตัวอย่าง
Seed ที่ใช้ในการถอดรหัสเพื่อความสามารถในการทำซ้ำ
รายการลำดับอักขระที่จะหยุดการโต้ตอบเอาต์พุต
thinking_level ThinkingLevel (ไม่บังคับ)
ระดับโทเค็นความคิดที่โมเดลควรสร้าง
ค่าที่เป็นไปได้ มีดังนี้
-
minimal -
low -
medium -
high
thinking_summaries ThinkingSummaries (ไม่บังคับ)
จะรวมสรุปความคิดในคำตอบหรือไม่
ค่าที่เป็นไปได้ มีดังนี้
-
auto -
none
จำนวนโทเค็นสูงสุดที่จะรวมไว้ในการตอบกลับ
speech_config SpeechConfig (ไม่บังคับ)
การกำหนดค่าสำหรับการโต้ตอบด้วยเสียง
ช่อง
เสียงของผู้พูด
ภาษาของคำพูด
ชื่อผู้พูดควรตรงกับชื่อผู้พูดที่ระบุในพรอมต์
image_config ImageConfig (ไม่บังคับ)
การกำหนดค่าสำหรับการโต้ตอบกับรูปภาพ
ช่อง
ไม่มีคำอธิบาย
ค่าที่เป็นไปได้ มีดังนี้
-
1:1 -
2:3 -
3:2 -
3:4 -
4:3 -
4:5 -
5:4 -
9:16 -
16:9 -
21:9 -
1:8 -
8:1 -
1:4 -
4:1
ไม่มีคำอธิบาย
ค่าที่เป็นไปได้ มีดังนี้
-
1K -
2K -
4K -
512
การกำหนดค่าการเลือกเครื่องมือ
agent_config object (ไม่บังคับ)
การกำหนดค่า Agent
การกำหนดค่าสำหรับ Agent
ทางเลือกแทน `generation_config` ใช้ได้เฉพาะเมื่อตั้งค่า `agent`
ประเภทที่เป็นไปได้
ตัวแยกประเภทแบบหลายรูปแบบ: type
DynamicAgentConfig
การกำหนดค่าสำหรับเอเจนต์แบบไดนามิก
ไม่มีคำอธิบาย
ตั้งค่าเป็น "dynamic" เสมอ
DeepResearchAgentConfig
การกำหนดค่าสำหรับตัวแทน Deep Research
ไม่มีคำอธิบาย
ตั้งค่าเป็น "deep-research" เสมอ
thinking_summaries ThinkingSummaries (ไม่บังคับ)
จะรวมสรุปความคิดในคำตอบหรือไม่
ค่าที่เป็นไปได้ มีดังนี้
-
auto -
none
รวมภาพข้อมูลในการตอบกลับไหม
ค่าที่เป็นไปได้ มีดังนี้
-
off -
auto
ช่วยให้การวางแผนแบบ Human-in-the-Loop สำหรับตัวแทน Deep Research หากตั้งค่าเป็น true เอเจนต์ Deep Research จะระบุแผนการค้นคว้าข้อมูลในการตอบกลับ จากนั้นตัวแทนจะดำเนินการต่อก็ต่อเมื่อผู้ใช้ยืนยันแผนในเทิร์นถัดไป
รหัสของการโต้ตอบก่อนหน้า (หากมี)
response_modalities ResponseModality (ไม่บังคับ)
รูปแบบการตอบกลับที่ขอ (TEXT, IMAGE, AUDIO)
ค่าที่เป็นไปได้ มีดังนี้
-
text -
image -
audio -
video -
document
ระดับบริการสำหรับการโต้ตอบ
ค่าที่เป็นไปได้ มีดังนี้
-
flex -
standard -
priority
การตอบกลับ
แสดงผลทรัพยากร Interaction
คำขออย่างง่าย
ตัวอย่างการตอบกลับ
{ "created": "2025-11-26T12:25:15Z", "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "object": "interaction", "outputs": [ { "text": "Hello! I'm functioning perfectly and ready to assist you.\n\nHow are you doing today?", "type": "text" } ], "role": "model", "status": "completed", "updated": "2025-11-26T12:25:15Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 7 } ], "total_cached_tokens": 0, "total_input_tokens": 7, "total_output_tokens": 20, "total_thought_tokens": 22, "total_tokens": 49, "total_tool_use_tokens": 0 } }
หลายรอบ
ตัวอย่างการตอบกลับ
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "role": "model", "outputs": [ { "type": "text", "text": "The capital of France is Paris." } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 50 } ], "total_cached_tokens": 0, "total_input_tokens": 50, "total_output_tokens": 10, "total_thought_tokens": 0, "total_tokens": 60, "total_tool_use_tokens": 0 } }
อินพุตรูปภาพ
ตัวอย่างการตอบกลับ
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "role": "model", "outputs": [ { "type": "text", "text": "A white humanoid robot with glowing blue eyes stands holding a red skateboard." } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 10 }, { "modality": "image", "tokens": 258 } ], "total_cached_tokens": 0, "total_input_tokens": 268, "total_output_tokens": 20, "total_thought_tokens": 0, "total_tokens": 288, "total_tool_use_tokens": 0 } }
การเรียกใช้ฟังก์ชัน
ตัวอย่างการตอบกลับ
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "requires_action", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "role": "model", "outputs": [ { "type": "function_call", "id": "gth23981", "name": "get_weather", "arguments": { "location": "Boston, MA" } } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 100 } ], "total_cached_tokens": 0, "total_input_tokens": 100, "total_output_tokens": 25, "total_thought_tokens": 0, "total_tokens": 125, "total_tool_use_tokens": 50 } }
Deep Research
ตัวอย่างการตอบกลับ
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "agent": "deep-research-pro-preview-12-2025", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "role": "agent", "outputs": [ { "type": "text", "text": "Here is a comprehensive research report on the current state of cancer research..." } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 20 } ], "total_cached_tokens": 0, "total_input_tokens": 20, "total_output_tokens": 1000, "total_thought_tokens": 500, "total_tokens": 1520, "total_tool_use_tokens": 0 } }
การดึงข้อมูลการโต้ตอบ
เรียกข้อมูลแบบละเอียดทั้งหมดของการโต้ตอบรายการเดียวตาม `Interaction.id`
พารามิเตอร์เส้นทาง / การค้นหา
ตัวระบุที่ไม่ซ้ำกันของการโต้ตอบที่จะดึงข้อมูล
หากตั้งค่าเป็น "จริง" ระบบจะสตรีมเนื้อหาที่สร้างขึ้นทีละส่วน
ค่าเริ่มต้นคือ False
ไม่บังคับ หากตั้งค่าไว้ จะเริ่มสตรีมการโต้ตอบจากก้อนข้อมูลถัดไปหลังจากเหตุการณ์ที่ทำเครื่องหมายด้วยรหัสเหตุการณ์ ใช้ได้เฉพาะในกรณีที่ `stream` เป็นจริง
หากตั้งค่าเป็น "จริง" จะรวมอินพุตไว้ในการตอบกลับ
ค่าเริ่มต้นคือ False
เวอร์ชันของ API ที่จะใช้
การตอบกลับ
แสดงผลทรัพยากร Interaction
รับการโต้ตอบ
ตัวอย่างการตอบกลับ
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:25:15Z", "updated": "2025-11-26T12:25:15Z", "role": "model", "outputs": [ { "type": "text", "text": "I'm doing great, thank you for asking! How can I help you today?" } ] }
การลบการโต้ตอบ
ลบการโต้ตอบตามรหัส
พารามิเตอร์เส้นทาง / การค้นหา
ตัวระบุที่ไม่ซ้ำกันของการโต้ตอบที่จะลบ
เวอร์ชันของ API ที่จะใช้
การตอบกลับ
หากทำสำเร็จ การตอบกลับจะว่างเปล่า
ลบการโต้ตอบ
การยกเลิกการโต้ตอบ
ยกเลิกการโต้ตอบตามรหัส โดยจะมีผลกับการโต้ตอบในเบื้องหลังที่ยังทำงานอยู่เท่านั้น
พารามิเตอร์เส้นทาง / การค้นหา
ตัวระบุที่ไม่ซ้ำกันของการโต้ตอบที่จะยกเลิก
เวอร์ชันของ API ที่จะใช้
การตอบกลับ
แสดงผลทรัพยากร Interaction
ยกเลิกการโต้ตอบ
ตัวอย่างการตอบกลับ
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "agent": "deep-research-pro-preview-12-2025", "status": "cancelled", "object": "interaction", "created": "2025-11-26T12:25:15Z", "updated": "2025-11-26T12:25:15Z", "role": "agent" }
แหล่งข้อมูล
การโต้ตอบ
ทรัพยากรการโต้ตอบ
ช่อง
model ModelOption (ไม่บังคับ)
ชื่อของ `Model` ที่ใช้ในการสร้างการโต้ตอบ
ค่าที่เป็นไปได้ มีดังนี้
-
gemini-2.5-computer-use-preview-10-2025โมเดลความสามารถแบบเป็น Agent ที่ออกแบบมาสำหรับการโต้ตอบกับอินเทอร์เฟซโดยตรง ซึ่งช่วยให้ Gemini รับรู้และไปยังส่วนต่างๆ ของสภาพแวดล้อมดิจิทัลได้
-
gemini-2.5-flashโมเดลการให้เหตุผลแบบไฮบริดรุ่นแรกของเราซึ่งรองรับหน้าต่างบริบทขนาด 1 ล้านโทเค็นและมีงบประมาณสำหรับการคิด
-
gemini-2.5-flash-imageโมเดลการสร้างรูปภาพในตัวของเราที่ได้รับการเพิ่มประสิทธิภาพเพื่อความเร็ว ความยืดหยุ่น และความเข้าใจบริบท ระบบจะคิดราคาอินพุตและเอาต์พุตข้อความเหมือนกับ 2.5 Flash
-
gemini-2.5-flash-liteโมเดลที่มีขนาดเล็กที่สุดและคุ้มค่าที่สุดของเรา ซึ่งสร้างขึ้นเพื่อการใช้งานในวงกว้าง
-
gemini-2.5-flash-lite-preview-09-2025โมเดลล่าสุดที่อิงตาม Gemini 2.5 Flash lite ซึ่งได้รับการเพิ่มประสิทธิภาพเพื่อความคุ้มค่า การส่งข้อความปริมาณมาก และคุณภาพสูง
-
gemini-2.5-flash-native-audio-preview-12-2025โมเดลเสียงดั้งเดิมของเราได้รับการเพิ่มประสิทธิภาพเพื่อเอาต์พุตเสียงคุณภาพสูงขึ้นพร้อมการเว้นวรรคที่ดีขึ้น ความเป็นธรรมชาติของเสียง ความละเอียด และอารมณ์
-
gemini-2.5-flash-preview-09-2025โมเดลล่าสุดที่อิงตามโมเดล 2.5 Flash 2.5 Flash Preview เหมาะที่สุดสำหรับการประมวลผลขนาดใหญ่ งานที่มีเวลาในการตอบสนองต่ำและมีปริมาณมากซึ่งต้องใช้ความคิด และกรณีการใช้งานแบบเอเจนต์
-
gemini-2.5-flash-preview-ttsโมเดลข้อความเป็นคำพูด 2.5 Flash ของเราได้รับการเพิ่มประสิทธิภาพเพื่อการสร้างคำพูดที่ควบคุมได้ซึ่งมีประสิทธิภาพและมีความหน่วงต่ำ
-
gemini-2.5-proโมเดลอเนกประสงค์ที่ล้ำสมัยของเรา ซึ่งโดดเด่นด้านการเขียนโค้ดและงานการให้เหตุผลที่ซับซ้อน
-
gemini-2.5-pro-preview-ttsโมเดลเสียงอ่านออกเสียงข้อความ 2.5 Pro ของเราได้รับการเพิ่มประสิทธิภาพเพื่อการสร้างเสียงพูดที่ทรงพลังและมีเวลาในการตอบสนองต่ำ เพื่อให้ได้ผลลัพธ์ที่เป็นธรรมชาติมากขึ้นและควบคุมพรอมต์ได้ง่ายขึ้น
-
gemini-3-flash-previewโมเดลที่ชาญฉลาดที่สุดของเราสร้างขึ้นเพื่อเน้นความเร็ว โดยผสานความชาญฉลาดระดับแนวหน้าเข้ากับการค้นหาและการเชื่อมต่อแหล่งข้อมูลที่เหนือกว่า
-
gemini-3-pro-image-previewโมเดลการสร้างและแก้ไขรูปภาพที่ล้ำสมัย
-
gemini-3-pro-previewโมเดลที่ชาญฉลาดที่สุดของเราซึ่งมีการให้เหตุผลและทำความเข้าใจข้อมูลหลายรูปแบบระดับ SOTA รวมถึงความสามารถในการเขียนโค้ดแบบเป็น Agent และ Vibe Coding ที่ทรงพลัง
-
gemini-3.1-pro-previewโมเดลการให้เหตุผล SOTA ล่าสุดของเราที่มีความลึกซึ้งและเฉดสีที่ไม่เคยมีมาก่อน รวมถึงความสามารถในการทำความเข้าใจข้อมูลหลายรูปแบบและการเขียนโค้ดที่ทรงพลัง
-
gemini-3.1-flash-image-previewความสามารถด้านภาพระดับมืออาชีพที่มีประสิทธิภาพระดับ Flash และความสามารถในการสร้างที่อิงตามความเป็นจริง
-
gemini-3.1-flash-lite-previewโมเดลที่มีประสิทธิภาพด้านต้นทุนมากที่สุดของเรา ซึ่งได้รับการเพิ่มประสิทธิภาพสำหรับงานที่ต้องใช้ Agent จำนวนมาก การแปล และการประมวลผลข้อมูลอย่างง่าย
-
gemini-3.1-flash-tts-previewTTS ของ Gemini 3.1 Flash: การสร้างคำพูดที่ทรงพลังและมีเวลาในการตอบสนองต่ำ เพลิดเพลินกับเอาต์พุตที่เป็นธรรมชาติ พรอมต์ที่ควบคุมได้ และแท็กเสียงแบบใหม่ที่สื่ออารมณ์เพื่อการควบคุมการบรรยายที่แม่นยำ
-
lyria-3-clip-previewโมเดลการสร้างเพลงที่มีเวลาในการตอบสนองต่ำของเราได้รับการเพิ่มประสิทธิภาพสำหรับคลิปเสียงที่มีความละเอียดสูงและการควบคุมจังหวะที่แม่นยำ
-
lyria-3-pro-previewโมเดล Generative สำหรับเพลงเต็มขั้นสูงของเราที่มีความเข้าใจด้านการเรียบเรียงเพลงอย่างลึกซึ้ง ซึ่งได้รับการเพิ่มประสิทธิภาพเพื่อการควบคุมโครงสร้างที่แม่นยำและการเปลี่ยนผ่านที่ซับซ้อนในสไตล์ดนตรีที่หลากหลาย
agent AgentOption (ไม่บังคับ)
ชื่อของ `Agent` ที่ใช้สร้างการโต้ตอบ
ค่าที่เป็นไปได้ มีดังนี้
-
deep-research-pro-preview-12-2025เอเจนต์ Deep Research ของ Gemini
-
deep-research-preview-04-2026เอเจนต์ Deep Research ของ Gemini
-
deep-research-max-preview-04-2026Gemini Deep Research Max Agent
ต้องระบุ เอาต์พุตเท่านั้น ตัวระบุที่ไม่ซ้ำกันสำหรับการโต้ตอบที่เสร็จสมบูรณ์
ต้องระบุ เอาต์พุตเท่านั้น สถานะของการโต้ตอบ
ค่าที่เป็นไปได้ มีดังนี้
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
ต้องระบุ เอาต์พุตเท่านั้น เวลาที่สร้างคำตอบในรูปแบบ ISO 8601 (YYYY-MM-DDThh:mm:ssZ)
ต้องระบุ เอาต์พุตเท่านั้น เวลาที่อัปเดตคำตอบครั้งล่าสุดในรูปแบบ ISO 8601 (YYYY-MM-DDThh:mm:ssZ)
เอาต์พุตเท่านั้น บทบาทของการโต้ตอบ
เอาต์พุตเท่านั้น คำตอบจากโมเดล
คำสั่งของระบบสำหรับการโต้ตอบ
รายการการประกาศเครื่องมือที่โมเดลอาจเรียกใช้ระหว่างการโต้ตอบ
usage Usage (ไม่บังคับ)
เอาต์พุตเท่านั้น สถิติการใช้โทเค็นของคำขอโต้ตอบ
ช่อง
จำนวนโทเค็นในพรอมต์ (บริบท)
input_tokens_by_modality ModalityTokens (ไม่บังคับ)
รายละเอียดการใช้โทเค็นอินพุตตามรูปแบบ
ช่อง
modality ResponseModality (ไม่บังคับ)
รูปแบบที่เชื่อมโยงกับจำนวนโทเค็น
ค่าที่เป็นไปได้ มีดังนี้
-
text -
image -
audio -
video -
document
จำนวนโทเค็นสำหรับรูปแบบ
จํานวนโทเค็นในส่วนที่แคชของพรอมต์ (เนื้อหาที่แคช)
cached_tokens_by_modality ModalityTokens (ไม่บังคับ)
รายละเอียดการใช้โทเค็นที่แคชไว้ตามรูปแบบ
ช่อง
modality ResponseModality (ไม่บังคับ)
รูปแบบที่เชื่อมโยงกับจำนวนโทเค็น
ค่าที่เป็นไปได้ มีดังนี้
-
text -
image -
audio -
video -
document
จำนวนโทเค็นสำหรับรูปแบบ
จำนวนโทเค็นทั้งหมดในการตอบกลับที่สร้างขึ้นทั้งหมด
output_tokens_by_modality ModalityTokens (ไม่บังคับ)
รายละเอียดการใช้โทเค็นเอาต์พุตตามรูปแบบ
ช่อง
modality ResponseModality (ไม่บังคับ)
รูปแบบที่เชื่อมโยงกับจำนวนโทเค็น
ค่าที่เป็นไปได้ มีดังนี้
-
text -
image -
audio -
video -
document
จำนวนโทเค็นสำหรับรูปแบบ
จำนวนโทเค็นที่อยู่ในพรอมต์การใช้เครื่องมือ
tool_use_tokens_by_modality ModalityTokens (ไม่บังคับ)
รายละเอียดการใช้โทเค็นเครื่องมือตามรูปแบบ
ช่อง
modality ResponseModality (ไม่บังคับ)
รูปแบบที่เชื่อมโยงกับจำนวนโทเค็น
ค่าที่เป็นไปได้ มีดังนี้
-
text -
image -
audio -
video -
document
จำนวนโทเค็นสำหรับรูปแบบ
จำนวนโทเค็นของความคิดสำหรับโมเดลการคิด
จำนวนโทเค็นทั้งหมดสำหรับคำขอการโต้ตอบ (พรอมต์ + คำตอบ + โทเค็นภายในอื่นๆ )
response_modalities ResponseModality (ไม่บังคับ)
รูปแบบการตอบกลับที่ขอ (TEXT, IMAGE, AUDIO)
ค่าที่เป็นไปได้ มีดังนี้
-
text -
image -
audio -
video -
document
บังคับให้การตอบกลับที่สร้างขึ้นเป็นออบเจ็กต์ JSON ที่เป็นไปตามสคีมา JSON ที่ระบุในฟิลด์นี้
ประเภท MIME ของการตอบกลับ ต้องระบุหากตั้งค่า response_format
รหัสของการโต้ตอบก่อนหน้า (หากมี)
ระดับบริการสำหรับการโต้ตอบ
ค่าที่เป็นไปได้ มีดังนี้
-
flex -
standard -
priority
agent_config object (ไม่บังคับ)
พารามิเตอร์การกำหนดค่าสำหรับการโต้ตอบของตัวแทน
ประเภทที่เป็นไปได้
ตัวแยกประเภทแบบหลายรูปแบบ: type
DynamicAgentConfig
การกำหนดค่าสำหรับเอเจนต์แบบไดนามิก
ไม่มีคำอธิบาย
ตั้งค่าเป็น "dynamic" เสมอ
DeepResearchAgentConfig
การกำหนดค่าสำหรับตัวแทน Deep Research
ไม่มีคำอธิบาย
ตั้งค่าเป็น "deep-research" เสมอ
thinking_summaries ThinkingSummaries (ไม่บังคับ)
จะรวมสรุปความคิดในคำตอบหรือไม่
ค่าที่เป็นไปได้ มีดังนี้
-
auto -
none
รวมภาพข้อมูลในการตอบกลับไหม
ค่าที่เป็นไปได้ มีดังนี้
-
off -
auto
ช่วยให้การวางแผนแบบ Human-in-the-Loop สำหรับตัวแทน Deep Research หากตั้งค่าเป็น true เอเจนต์ Deep Research จะระบุแผนการค้นคว้าข้อมูลในการตอบกลับ จากนั้นตัวแทนจะดำเนินการต่อก็ต่อเมื่อผู้ใช้ยืนยันแผนในเทิร์นถัดไป
ตัวอย่าง
ตัวอย่าง
{ "created": "2025-12-04T15:01:45Z", "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg", "model": "gemini-3-flash-preview", "object": "interaction", "outputs": [ { "text": "Hello! I'm doing well, functioning as expected. Thank you for asking! How are you doing today?", "type": "text" } ], "role": "model", "status": "completed", "updated": "2025-12-04T15:01:45Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 7 } ], "total_cached_tokens": 0, "total_input_tokens": 7, "total_output_tokens": 23, "total_thought_tokens": 49, "total_tokens": 79, "total_tool_use_tokens": 0 } }
โมเดลข้อมูล
เนื้อหา
เนื้อหาของการตอบกลับ
ประเภทที่เป็นไปได้
ตัวแยกประเภทแบบหลายรูปแบบ: type
TextContent
บล็อกเนื้อหาข้อความ
ไม่มีคำอธิบาย
ตั้งค่าเป็น "text" เสมอ
ต้องระบุ เนื้อหาข้อความ
annotations Annotation (ไม่บังคับ)
ข้อมูลการอ้างอิงสำหรับเนื้อหาที่โมเดลสร้างขึ้น
ประเภทที่เป็นไปได้
ตัวแยกประเภทแบบหลายรูปแบบ: type
UrlCitation
คำอธิบายประกอบการอ้างอิง URL
ไม่มีคำอธิบาย
ตั้งค่าเป็น "url_citation" เสมอ
URL
ชื่อของ URL
จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์
จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)
FileCitation
คำอธิบายประกอบการอ้างอิงไฟล์
ไม่มีคำอธิบาย
ตั้งค่าเป็น "file_citation" เสมอ
URI ของไฟล์
ชื่อไฟล์
แหล่งที่มาของข้อความบางส่วน
จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์
จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)
PlaceCitation
คำอธิบายประกอบการอ้างอิงสถานที่
ไม่มีคำอธิบาย
ตั้งค่าเป็น "place_citation" เสมอ
รหัสของสถานที่ในรูปแบบ `places/{place_id}`
ชื่อสถานที่
ข้อมูลอ้างอิง URI ของสถานที่
review_snippets ReviewSnippet (ไม่บังคับ)
ข้อมูลรีวิวที่ใช้ในการสร้างคำตอบเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps
ช่อง
ชื่อของรีวิว
ลิงก์ที่สอดคล้องกับรีวิวของผู้ใช้ใน Google Maps
รหัสของตัวอย่างรีวิว
จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์
จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)
ImageContent
บล็อกเนื้อหารูปภาพ
ไม่มีคำอธิบาย
ตั้งค่าเป็น "image" เสมอ
เนื้อหารูปภาพ
URI ของรูปภาพ
ประเภท MIME ของรูปภาพ
ค่าที่เป็นไปได้ มีดังนี้
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (ไม่บังคับ)
ความละเอียดของสื่อ
ค่าที่เป็นไปได้ มีดังนี้
-
low -
medium -
high -
ultra_high
AudioContent
บล็อกเนื้อหาเสียง
ไม่มีคำอธิบาย
ตั้งค่าเป็น "audio" เสมอ
เนื้อหาเสียง
URI ของเสียง
ประเภท MIME ของเสียง
ค่าที่เป็นไปได้ มีดังนี้
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
อัตราการสุ่มตัวอย่างของเสียง
จำนวนช่องเสียง
DocumentContent
บล็อกเนื้อหาของเอกสาร
ไม่มีคำอธิบาย
ตั้งค่าเป็น "document" เสมอ
เนื้อหาเอกสาร
URI ของเอกสาร
ประเภท MIME ของเอกสาร
ค่าที่เป็นไปได้ มีดังนี้
-
application/pdf
VideoContent
บล็อกเนื้อหาวิดีโอ
ไม่มีคำอธิบาย
ตั้งค่าเป็น "video" เสมอ
เนื้อหาวิดีโอ
URI ของวิดีโอ
ประเภท MIME ของวิดีโอ
ค่าที่เป็นไปได้ มีดังนี้
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
resolution MediaResolution (ไม่บังคับ)
ความละเอียดของสื่อ
ค่าที่เป็นไปได้ มีดังนี้
-
low -
medium -
high -
ultra_high
ThoughtContent
บล็อกเนื้อหาความคิด
ไม่มีคำอธิบาย
ตั้งค่าเป็น "thought" เสมอ
ลายเซ็นที่ตรงกับแหล่งข้อมูลแบ็กเอนด์เพื่อเป็นส่วนหนึ่งของการสร้าง
summary ThoughtSummaryContent (ไม่บังคับ)
สรุปความคิด
ประเภทที่เป็นไปได้
ตัวแยกประเภทแบบหลายรูปแบบ: type
TextContent
บล็อกเนื้อหาข้อความ
ไม่มีคำอธิบาย
ตั้งค่าเป็น "text" เสมอ
ต้องระบุ เนื้อหาข้อความ
annotations Annotation (ไม่บังคับ)
ข้อมูลการอ้างอิงสำหรับเนื้อหาที่โมเดลสร้างขึ้น
ประเภทที่เป็นไปได้
ตัวแยกประเภทแบบหลายรูปแบบ: type
UrlCitation
คำอธิบายประกอบการอ้างอิง URL
ไม่มีคำอธิบาย
ตั้งค่าเป็น "url_citation" เสมอ
URL
ชื่อของ URL
จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์
จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)
FileCitation
คำอธิบายประกอบการอ้างอิงไฟล์
ไม่มีคำอธิบาย
ตั้งค่าเป็น "file_citation" เสมอ
URI ของไฟล์
ชื่อไฟล์
แหล่งที่มาของข้อความบางส่วน
จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์
จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)
PlaceCitation
คำอธิบายประกอบการอ้างอิงสถานที่
ไม่มีคำอธิบาย
ตั้งค่าเป็น "place_citation" เสมอ
รหัสของสถานที่ในรูปแบบ `places/{place_id}`
ชื่อสถานที่
ข้อมูลอ้างอิง URI ของสถานที่
review_snippets ReviewSnippet (ไม่บังคับ)
ข้อมูลรีวิวที่ใช้ในการสร้างคำตอบเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps
ช่อง
ชื่อของรีวิว
ลิงก์ที่สอดคล้องกับรีวิวของผู้ใช้ใน Google Maps
รหัสของตัวอย่างรีวิว
จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์
จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)
ImageContent
บล็อกเนื้อหารูปภาพ
ไม่มีคำอธิบาย
ตั้งค่าเป็น "image" เสมอ
เนื้อหารูปภาพ
URI ของรูปภาพ
ประเภท MIME ของรูปภาพ
ค่าที่เป็นไปได้ มีดังนี้
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (ไม่บังคับ)
ความละเอียดของสื่อ
ค่าที่เป็นไปได้ มีดังนี้
-
low -
medium -
high -
ultra_high
FunctionCallContent
บล็อกเนื้อหาการเรียกใช้เครื่องมือฟังก์ชัน
ไม่มีคำอธิบาย
ตั้งค่าเป็น "function_call" เสมอ
ต้องระบุ ชื่อของเครื่องมือที่จะเรียกใช้
ต้องระบุ อาร์กิวเมนต์ที่จะส่งไปยังฟังก์ชัน
ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
CodeExecutionCallContent
เนื้อหาการรันโค้ด
ไม่มีคำอธิบาย
ตั้งค่าเป็น "code_execution_call" เสมอ
arguments CodeExecutionCallArguments (ต้องระบุ)
ต้องระบุ อาร์กิวเมนต์ที่จะส่งผ่านไปยังการเรียกใช้โค้ด
ช่อง
ภาษาโปรแกรมของ `code`
ค่าที่เป็นไปได้ มีดังนี้
-
python
โค้ดที่จะดำเนินการ
ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
UrlContextCallContent
เนื้อหาบริบท URL
ไม่มีคำอธิบาย
ตั้งค่าเป็น "url_context_call" เสมอ
arguments UrlContextCallArguments (ต้องระบุ)
ต้องระบุ อาร์กิวเมนต์ที่จะส่งไปยังบริบท URL
ช่อง
URL ที่จะดึงข้อมูล
ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
McpServerToolCallContent
เนื้อหาการเรียกใช้เครื่องมือ MCPServer
ไม่มีคำอธิบาย
ตั้งค่าเป็น "mcp_server_tool_call" เสมอ
ต้องระบุ ชื่อของเครื่องมือที่เรียกใช้
ต้องระบุ ชื่อเซิร์ฟเวอร์ MCP ที่ใช้
ต้องระบุ ออบเจ็กต์ JSON ของอาร์กิวเมนต์สำหรับฟังก์ชัน
ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
GoogleSearchCallContent
เนื้อหาของ Google Search
ไม่มีคำอธิบาย
ตั้งค่าเป็น "google_search_call" เสมอ
arguments GoogleSearchCallArguments (ต้องระบุ)
ต้องระบุ อาร์กิวเมนต์ที่จะส่งไปยัง Google Search
ช่อง
คำค้นหาใน Web Search สำหรับการค้นหาเว็บเพิ่มเติม
ประเภทการเชื่อมต่อแหล่งข้อมูลการค้นหาที่เปิดใช้
ค่าที่เป็นไปได้ มีดังนี้
-
web_search -
image_search -
enterprise_web_search
ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
FileSearchCallContent
เนื้อหาการค้นหาไฟล์
ไม่มีคำอธิบาย
ตั้งค่าเป็น "file_search_call" เสมอ
ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
GoogleMapsCallContent
เนื้อหาของ Google Maps
ไม่มีคำอธิบาย
ตั้งค่าเป็น "google_maps_call" เสมอ
arguments GoogleMapsCallArguments (ไม่บังคับ)
อาร์กิวเมนต์ที่จะส่งไปยังเครื่องมือ Google Maps
ช่อง
คำค้นหาที่จะดำเนินการ
ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
FunctionResultContent
บล็อกเนื้อหาผลลัพธ์ของเครื่องมือฟังก์ชัน
ไม่มีคำอธิบาย
ตั้งค่าเป็น "function_result" เสมอ
ชื่อของเครื่องมือที่เรียกใช้
การเรียกใช้เครื่องมือทำให้เกิดข้อผิดพลาดหรือไม่
ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
ผลลัพธ์ของการเรียกใช้เครื่องมือ
CodeExecutionResultContent
เนื้อหาผลการรันโค้ด
ไม่มีคำอธิบาย
ตั้งค่าเป็น "code_execution_result" เสมอ
ต้องระบุ เอาต์พุตของการเรียกใช้โค้ด
การดำเนินการโค้ดส่งผลให้เกิดข้อผิดพลาดหรือไม่
ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
UrlContextResultContent
เนื้อหาผลลัพธ์ของบริบท URL
ไม่มีคำอธิบาย
ตั้งค่าเป็น "url_context_result" เสมอ
result UrlContextResult (ต้องระบุ)
ต้องระบุ ผลลัพธ์ของบริบท URL
ช่อง
URL ที่ดึงข้อมูล
สถานะของการดึงข้อมูล URL
ค่าที่เป็นไปได้ มีดังนี้
-
success -
error -
paywall -
unsafe
ไม่ว่าบริบท URL จะทำให้เกิดข้อผิดพลาดหรือไม่
ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
GoogleSearchResultContent
เนื้อหาผลการค้นหาของ Google
ไม่มีคำอธิบาย
ตั้งค่าเป็น "google_search_result" เสมอ
result GoogleSearchResult (ต้องระบุ)
ต้องระบุ ผลการค้นหาของ Google Search
ช่อง
ข้อมูลโค้ดเนื้อหาเว็บที่ฝังในหน้าเว็บหรือ WebView ของแอปได้
ไม่ว่า Google Search จะทำให้เกิดข้อผิดพลาดหรือไม่
ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
McpServerToolResultContent
เนื้อหาผลลัพธ์ของเครื่องมือ MCPServer
ไม่มีคำอธิบาย
ตั้งค่าเป็น "mcp_server_tool_result" เสมอ
ชื่อของเครื่องมือที่เรียกใช้สำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ
ชื่อเซิร์ฟเวอร์ MCP ที่ใช้
ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
เอาต์พุตจากการเรียกเซิร์ฟเวอร์ MCP อาจเป็นข้อความธรรมดาหรือข้อมูลอย่างละเอียด
FileSearchResultContent
เนื้อหาผลการค้นหาของ File Search
ไม่มีคำอธิบาย
ตั้งค่าเป็น "file_search_result" เสมอ
result FileSearchResult (ต้องระบุ)
ต้องระบุ ผลการค้นหาไฟล์
ช่อง
ข้อมูลเมตาที่ผู้ใช้ระบุเกี่ยวกับ FileSearchResult
ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
GoogleMapsResultContent
เนื้อหาผลการค้นหาของ Google Maps
ไม่มีคำอธิบาย
ตั้งค่าเป็น "google_maps_result" เสมอ
result GoogleMapsResult (ต้องระบุ)
ต้องระบุ ผลลัพธ์ของ Google Maps
ช่อง
places Places (ไม่บังคับ)
สถานที่ที่พบ
ช่อง
รหัสของสถานที่ในรูปแบบ `places/{place_id}`
ชื่อสถานที่
ข้อมูลอ้างอิง URI ของสถานที่
review_snippets ReviewSnippet (ไม่บังคับ)
ข้อมูลรีวิวที่ใช้ในการสร้างคำตอบเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps
ช่อง
ชื่อของรีวิว
ลิงก์ที่สอดคล้องกับรีวิวของผู้ใช้ใน Google Maps
รหัสของตัวอย่างรีวิว
ชื่อทรัพยากรของโทเค็นบริบทของวิดเจ็ต Google Maps
ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
ตัวอย่าง
ข้อความ
{ "type": "text", "text": "Hello, how are you?" }
รูปภาพ
{ "type": "image", "data": "BASE64_ENCODED_IMAGE", "mime_type": "image/png" }
เสียง
{ "type": "audio", "data": "BASE64_ENCODED_AUDIO", "mime_type": "audio/wav" }
เอกสาร
{ "type": "document", "data": "BASE64_ENCODED_DOCUMENT", "mime_type": "application/pdf" }
วิดีโอ
{ "type": "video", "uri": "https://www.youtube.com/watch?v=9hE5-98ZeCg" }
ความคิด
{ "type": "thought", "summary": [ { "type": "text", "text": "The user is asking about the weather. I should use the get_weather tool." } ], "signature": "CoMDAXLI2nynRYojJIy6B1Jh9os2crpWLfB0+19xcLsGG46bd8wjkF/6RNlRUdvHrXyjsHkG0BZFcuO/bPOyA6Xh5jANNgx82wPHjGExN8A4ZQn56FlMwyZoqFVQz0QyY1lfibFJ2zU3J87uw26OewzcuVX0KEcs+GIsZa3EA6WwqhbsOd3wtZB3Ua2Qf98VAWZTS5y/tWpql7jnU3/CU7pouxQr/Bwft3hwnJNesQ9/dDJTuaQ8Zprh9VRWf1aFFjpIueOjBRrlT3oW6/y/eRl/Gt9BQXCYTqg/38vHFUU4Wo/d9dUpvfCe/a3o97t2Jgxp34oFKcsVb4S5WJrykIkw+14DzVnTpCpbQNFckqvFLuqnJCkL0EQFtunBXI03FJpPu3T1XU6id8S7ojoJQZSauGUCgmaLqUGdMrd08oo81ecoJSLs51Re9N/lISGmjWFPGpqJLoGq6uo4FHz58hmeyXCgHG742BHz2P3MiH1CXHUT2J8mF6zLhf3SR9Qb3lkrobAh" }
Function Call
{ "type": "function_call", "name": "get_weather", "id": "gth23981", "arguments": { "location": "Boston, MA" } }
การเรียกใช้การรันโค้ด
{ "type": "code_execution_call", "id": "call_123456", "arguments": { "language": "python", "code": "print('hello world')" } }
การเรียกบริบท URL
{ "type": "url_context_call", "id": "call_123456", "arguments": { "urls": [ "https://www.example.com" ] } }
การเรียกใช้เครื่องมือเซิร์ฟเวอร์ MCP
{ "type": "mcp_server_tool_call", "id": "call_123456", "name": "get_forecast", "server_name": "weather_server", "arguments": { "city": "London" } }
การโทรผ่าน Google Search
{ "type": "google_search_call", "id": "call_123456", "arguments": { "queries": [ "weather in Boston" ] } }
การเรียกค้นหาไฟล์
{ "type": "file_search_call", "id": "call_123456" }
การโทรผ่าน Google Maps
{ "type": "google_maps_call", "id": "call_123456", "arguments": { "query": "best food near me" } }
ผลลัพธ์ของฟังก์ชัน
{ "type": "function_result", "name": "get_weather", "call_id": "gth23981", "result": [ { "type": "text", "text": "{\"weather\":\"sunny\"}" } ] }
ผลการดำเนินการโค้ด
{ "type": "code_execution_result", "call_id": "call_123456", "result": "hello world" }
ผลลัพธ์บริบท URL
{ "type": "url_context_result", "call_id": "call_123456", "result": [ { "url": "https://www.example.com", "status": "SUCCESS" } ] }
ผลการค้นหาของ Google
{ "type": "google_search_result", "call_id": "call_123456", "result": [ { "url": "https://www.google.com/search?q=weather+in+Boston", "title": "Weather in Boston" } ] }
ผลลัพธ์ของเครื่องมือเซิร์ฟเวอร์ MCP
{ "type": "mcp_server_tool_result", "name": "get_forecast", "server_name": "weather_server", "call_id": "call_123456", "result": "sunny" }
ผลการค้นหาไฟล์
{ "type": "file_search_result", "call_id": "call_123456", "result": [ { "text": "search result chunk", "file_search_store": "file_search_store" } ] }
ผลการค้นหาของ Google Maps
{ "type": "google_maps_result", "call_id": "call_123456", "result": [ { "places": [ { "url": "https://www.google.com/maps/search/best+food+near+me", "name": "Tasty Restaurant" } ] } ] }
เครื่องมือ
เครื่องมือที่โมเดลใช้ได้
ประเภทที่เป็นไปได้
ตัวแยกประเภทแบบหลายรูปแบบ: type
ฟังก์ชัน
เครื่องมือที่โมเดลใช้ได้
ไม่มีคำอธิบาย
ตั้งค่าเป็น "function" เสมอ
ชื่อฟังก์ชัน
คำอธิบายฟังก์ชัน
สคีมา JSON สำหรับพารามิเตอร์ของฟังก์ชัน
CodeExecution
เครื่องมือที่โมเดลใช้ดำเนินการกับโค้ดได้
ไม่มีคำอธิบาย
ตั้งค่าเป็น "code_execution" เสมอ
UrlContext
เครื่องมือที่โมเดลใช้เพื่อดึงบริบท URL ได้
ไม่มีคำอธิบาย
ตั้งค่าเป็น "url_context" เสมอ
ComputerUse
เครื่องมือที่โมเดลใช้โต้ตอบกับคอมพิวเตอร์ได้
ไม่มีคำอธิบาย
ตั้งค่าเป็น "computer_use" เสมอ
สภาพแวดล้อมที่ดำเนินการ
ค่าที่เป็นไปได้ มีดังนี้
-
browser
รายการฟังก์ชันที่กำหนดไว้ล่วงหน้าซึ่งยกเว้นจากการเรียกโมเดล
McpServer
MCPServer คือเซิร์ฟเวอร์ที่โมเดลเรียกใช้เพื่อดำเนินการได้
ไม่มีคำอธิบาย
ตั้งค่าเป็น "mcp_server" เสมอ
ชื่อของ MCPServer
URL แบบเต็มสำหรับปลายทาง MCPServer ตัวอย่างเช่น "https://api.example.com/mcp"
ไม่บังคับ: ช่องสำหรับส่วนหัวการตรวจสอบสิทธิ์ การหมดเวลา ฯลฯ หากจำเป็น
allowed_tools AllowedTools (ไม่บังคับ)
เครื่องมือที่อนุญาต
ช่อง
mode ToolChoiceType (ไม่บังคับ)
โหมดการเลือกเครื่องมือ
ค่าที่เป็นไปได้ มีดังนี้
-
auto -
any -
none -
validated
ชื่อของเครื่องมือที่อนุญาต
GoogleSearch
เครื่องมือที่โมเดลใช้ค้นหาใน Google ได้
ไม่มีคำอธิบาย
ตั้งค่าเป็น "google_search" เสมอ
ประเภทของการเชื่อมต่อแหล่งข้อมูลการค้นหาที่จะเปิดใช้
ค่าที่เป็นไปได้ มีดังนี้
-
web_search -
image_search -
enterprise_web_search
FileSearch
เครื่องมือที่โมเดลใช้ค้นหาไฟล์ได้
ไม่มีคำอธิบาย
ตั้งค่าเป็น "file_search" เสมอ
ไฟล์จะจัดเก็บชื่อที่ใช้ค้นหา
จำนวนกลุ่มการดึงข้อมูลเชิงความหมายที่จะดึงข้อมูล
ตัวกรองข้อมูลเมตาที่จะใช้กับเอกสารและการแบ่งกลุ่มการดึงข้อมูลเชิงความหมาย
GoogleMaps
เครื่องมือที่โมเดลใช้เรียก Google Maps ได้
ไม่มีคำอธิบาย
ตั้งค่าเป็น "google_maps" เสมอ
ระบุว่าจะแสดงโทเค็นบริบทของวิดเจ็ตในผลการเรียกใช้เครื่องมือของ การตอบกลับหรือไม่
ละติจูดของตำแหน่งของผู้ใช้
ลองจิจูดของตำแหน่งของผู้ใช้
การดึงข้อมูล
เครื่องมือที่โมเดลใช้เพื่อดึงข้อมูลไฟล์
ไม่มีคำอธิบาย
ตั้งค่าเป็น "retrieval" เสมอ
ประเภทการดึงข้อมูลไฟล์ที่จะเปิดใช้
ค่าที่เป็นไปได้ มีดังนี้
-
vertex_ai_search
vertex_ai_search_config VertexAISearchConfig (ไม่บังคับ)
ใช้เพื่อระบุการกำหนดค่าสำหรับ VertexAISearch
ช่อง
ไม่บังคับ ใช้เพื่อระบุ Vertex AI Search
ไม่บังคับ ใช้เพื่อระบุพื้นที่เก็บข้อมูล Vertex AI Search
ตัวอย่าง
ฟังก์ชัน
CodeExecution
UrlContext
ComputerUse
McpServer
GoogleSearch
FileSearch
GoogleMaps
การดึงข้อมูล
ไม่มีตัวอย่างสำหรับประเภทนี้
เปิดหรือปิด
ช่อง
ผู้เริ่มการสนทนานี้ ต้องเป็นผู้ใช้สำหรับอินพุตหรือโมเดลสำหรับ เอาต์พุตโมเดล
ไม่มีคำอธิบาย
ตัวอย่าง
เทิร์นของผู้ใช้
{ "role": "user", "content": [ { "type": "text", "text": "user turn" } ] }
ผลัดกันตอบ
{ "role": "model", "content": [ { "type": "text", "text": "model turn" } ] }
InteractionSseEvent
ประเภทที่เป็นไปได้
ตัวแยกประเภทแบบหลายรูปแบบ: event_type
InteractionStartEvent
ไม่มีคำอธิบาย
ตั้งค่าเป็น "interaction.start" เสมอ
ไม่มีคำอธิบาย
โทเค็น event_id ที่จะใช้เพื่อดำเนินการต่อในสตรีมการโต้ตอบจากเหตุการณ์นี้
InteractionCompleteEvent
ไม่มีคำอธิบาย
ตั้งค่าเป็น "interaction.complete" เสมอ
ต้องระบุ การโต้ตอบที่เสร็จสมบูรณ์โดยมีเอาต์พุตว่างเปล่าเพื่อลดขนาดเพย์โหลด ใช้เหตุการณ์ ContentDelta ก่อนหน้าสำหรับเอาต์พุตจริง
โทเค็น event_id ที่จะใช้เพื่อดำเนินการต่อในสตรีมการโต้ตอบจากเหตุการณ์นี้
InteractionStatusUpdate
ไม่มีคำอธิบาย
ตั้งค่าเป็น "interaction.status_update" เสมอ
ไม่มีคำอธิบาย
ไม่มีคำอธิบาย
ค่าที่เป็นไปได้ มีดังนี้
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
โทเค็น event_id ที่จะใช้เพื่อดำเนินการต่อในสตรีมการโต้ตอบจากเหตุการณ์นี้
ContentStart
ไม่มีคำอธิบาย
ตั้งค่าเป็น "content.start" เสมอ
ไม่มีคำอธิบาย
ไม่มีคำอธิบาย
โทเค็น event_id ที่จะใช้เพื่อดำเนินการต่อในสตรีมการโต้ตอบจากเหตุการณ์นี้
ContentDelta
ไม่มีคำอธิบาย
ตั้งค่าเป็น "content.delta" เสมอ
ไม่มีคำอธิบาย
delta ContentDeltaData (ต้องระบุ)
ไม่มีคำอธิบาย
ประเภทที่เป็นไปได้
ตัวแยกประเภทแบบหลายรูปแบบ: type
TextDelta
ไม่มีคำอธิบาย
ตั้งค่าเป็น "text" เสมอ
ไม่มีคำอธิบาย
ImageDelta
ไม่มีคำอธิบาย
ตั้งค่าเป็น "image" เสมอ
ไม่มีคำอธิบาย
ไม่มีคำอธิบาย
ไม่มีคำอธิบาย
ค่าที่เป็นไปได้ มีดังนี้
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (ไม่บังคับ)
ความละเอียดของสื่อ
ค่าที่เป็นไปได้ มีดังนี้
-
low -
medium -
high -
ultra_high
AudioDelta
ไม่มีคำอธิบาย
ตั้งค่าเป็น "audio" เสมอ
ไม่มีคำอธิบาย
ไม่มีคำอธิบาย
ไม่มีคำอธิบาย
ค่าที่เป็นไปได้ มีดังนี้
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
อัตราการสุ่มตัวอย่างของเสียง
จำนวนช่องเสียง
DocumentDelta
ไม่มีคำอธิบาย
ตั้งค่าเป็น "document" เสมอ
ไม่มีคำอธิบาย
ไม่มีคำอธิบาย
ไม่มีคำอธิบาย
ค่าที่เป็นไปได้ มีดังนี้
-
application/pdf
VideoDelta
ไม่มีคำอธิบาย
ตั้งค่าเป็น "video" เสมอ
ไม่มีคำอธิบาย
ไม่มีคำอธิบาย
ไม่มีคำอธิบาย
ค่าที่เป็นไปได้ มีดังนี้
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
resolution MediaResolution (ไม่บังคับ)
ความละเอียดของสื่อ
ค่าที่เป็นไปได้ มีดังนี้
-
low -
medium -
high -
ultra_high
ThoughtSummaryDelta
ไม่มีคำอธิบาย
ตั้งค่าเป็น "thought_summary" เสมอ
content ThoughtSummaryContent (ไม่บังคับ)
รายการสรุปใหม่ที่จะเพิ่มลงในความคิด
ประเภทที่เป็นไปได้
ตัวแยกประเภทแบบหลายรูปแบบ: type
TextContent
บล็อกเนื้อหาข้อความ
ไม่มีคำอธิบาย
ตั้งค่าเป็น "text" เสมอ
ต้องระบุ เนื้อหาข้อความ
annotations Annotation (ไม่บังคับ)
ข้อมูลการอ้างอิงสำหรับเนื้อหาที่โมเดลสร้างขึ้น
ประเภทที่เป็นไปได้
ตัวแยกประเภทแบบหลายรูปแบบ: type
UrlCitation
คำอธิบายประกอบการอ้างอิง URL
ไม่มีคำอธิบาย
ตั้งค่าเป็น "url_citation" เสมอ
URL
ชื่อของ URL
จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์
จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)
FileCitation
คำอธิบายประกอบการอ้างอิงไฟล์
ไม่มีคำอธิบาย
ตั้งค่าเป็น "file_citation" เสมอ
URI ของไฟล์
ชื่อไฟล์
แหล่งที่มาของข้อความบางส่วน
จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์
จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)
PlaceCitation
คำอธิบายประกอบการอ้างอิงสถานที่
ไม่มีคำอธิบาย
ตั้งค่าเป็น "place_citation" เสมอ
รหัสของสถานที่ในรูปแบบ `places/{place_id}`
ชื่อสถานที่
ข้อมูลอ้างอิง URI ของสถานที่
review_snippets ReviewSnippet (ไม่บังคับ)
ข้อมูลรีวิวที่ใช้ในการสร้างคำตอบเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps
ช่อง
ชื่อของรีวิว
ลิงก์ที่สอดคล้องกับรีวิวของผู้ใช้ใน Google Maps
รหัสของตัวอย่างรีวิว
จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์
จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)
ImageContent
บล็อกเนื้อหารูปภาพ
ไม่มีคำอธิบาย
ตั้งค่าเป็น "image" เสมอ
เนื้อหารูปภาพ
URI ของรูปภาพ
ประเภท MIME ของรูปภาพ
ค่าที่เป็นไปได้ มีดังนี้
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (ไม่บังคับ)
ความละเอียดของสื่อ
ค่าที่เป็นไปได้ มีดังนี้
-
low -
medium -
high -
ultra_high
ThoughtSignatureDelta
ไม่มีคำอธิบาย
ตั้งค่าเป็น "thought_signature" เสมอ
ลายเซ็นที่ตรงกับแหล่งข้อมูลแบ็กเอนด์เพื่อเป็นส่วนหนึ่งของการสร้าง
FunctionCallDelta
ไม่มีคำอธิบาย
ตั้งค่าเป็น "function_call" เสมอ
ไม่มีคำอธิบาย
ไม่มีคำอธิบาย
ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
CodeExecutionCallDelta
ไม่มีคำอธิบาย
ตั้งค่าเป็น "code_execution_call" เสมอ
arguments CodeExecutionCallArguments (ต้องระบุ)
ไม่มีคำอธิบาย
ช่อง
ภาษาโปรแกรมของ `code`
ค่าที่เป็นไปได้ มีดังนี้
-
python
โค้ดที่จะดำเนินการ
ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
UrlContextCallDelta
ไม่มีคำอธิบาย
ตั้งค่าเป็น "url_context_call" เสมอ
arguments UrlContextCallArguments (ต้องระบุ)
ไม่มีคำอธิบาย
ช่อง
URL ที่จะดึงข้อมูล
ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
GoogleSearchCallDelta
ไม่มีคำอธิบาย
ตั้งค่าเป็น "google_search_call" เสมอ
arguments GoogleSearchCallArguments (ต้องระบุ)
ไม่มีคำอธิบาย
ช่อง
คำค้นหาใน Web Search สำหรับการค้นหาเว็บเพิ่มเติม
ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
McpServerToolCallDelta
ไม่มีคำอธิบาย
ตั้งค่าเป็น "mcp_server_tool_call" เสมอ
ไม่มีคำอธิบาย
ไม่มีคำอธิบาย
ไม่มีคำอธิบาย
ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
FileSearchCallDelta
ไม่มีคำอธิบาย
ตั้งค่าเป็น "file_search_call" เสมอ
ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
GoogleMapsCallDelta
ไม่มีคำอธิบาย
ตั้งค่าเป็น "google_maps_call" เสมอ
arguments GoogleMapsCallArguments (ไม่บังคับ)
อาร์กิวเมนต์ที่จะส่งไปยังเครื่องมือ Google Maps
ช่อง
คำค้นหาที่จะดำเนินการ
ต้องระบุ รหัสที่ไม่ซ้ำกันสำหรับการเรียกใช้เครื่องมือนี้โดยเฉพาะ
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
FunctionResultDelta
ไม่มีคำอธิบาย
ตั้งค่าเป็น "function_result" เสมอ
ไม่มีคำอธิบาย
ไม่มีคำอธิบาย
ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
ไม่มีคำอธิบาย
CodeExecutionResultDelta
ไม่มีคำอธิบาย
ตั้งค่าเป็น "code_execution_result" เสมอ
ไม่มีคำอธิบาย
ไม่มีคำอธิบาย
ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
UrlContextResultDelta
ไม่มีคำอธิบาย
ตั้งค่าเป็น "url_context_result" เสมอ
result UrlContextResult (ต้องระบุ)
ไม่มีคำอธิบาย
ช่อง
URL ที่ดึงข้อมูล
สถานะของการดึงข้อมูล URL
ค่าที่เป็นไปได้ มีดังนี้
-
success -
error -
paywall -
unsafe
ไม่มีคำอธิบาย
ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
GoogleSearchResultDelta
ไม่มีคำอธิบาย
ตั้งค่าเป็น "google_search_result" เสมอ
result GoogleSearchResult (ต้องระบุ)
ไม่มีคำอธิบาย
ช่อง
ข้อมูลโค้ดเนื้อหาเว็บที่ฝังในหน้าเว็บหรือ WebView ของแอปได้
ไม่มีคำอธิบาย
ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
McpServerToolResultDelta
ไม่มีคำอธิบาย
ตั้งค่าเป็น "mcp_server_tool_result" เสมอ
ไม่มีคำอธิบาย
ไม่มีคำอธิบาย
ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
ไม่มีคำอธิบาย
FileSearchResultDelta
ไม่มีคำอธิบาย
ตั้งค่าเป็น "file_search_result" เสมอ
result FileSearchResult (ต้องระบุ)
ไม่มีคำอธิบาย
ช่อง
ข้อมูลเมตาที่ผู้ใช้ระบุเกี่ยวกับ FileSearchResult
ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
GoogleMapsResultDelta
ไม่มีคำอธิบาย
ตั้งค่าเป็น "google_maps_result" เสมอ
result GoogleMapsResult (ไม่บังคับ)
ผลลัพธ์ของ Google Maps
ช่อง
places Places (ไม่บังคับ)
สถานที่ที่พบ
ช่อง
รหัสของสถานที่ในรูปแบบ `places/{place_id}`
ชื่อสถานที่
ข้อมูลอ้างอิง URI ของสถานที่
review_snippets ReviewSnippet (ไม่บังคับ)
ข้อมูลรีวิวที่ใช้ในการสร้างคำตอบเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps
ช่อง
ชื่อของรีวิว
ลิงก์ที่สอดคล้องกับรีวิวของผู้ใช้ใน Google Maps
รหัสของตัวอย่างรีวิว
ชื่อทรัพยากรของโทเค็นบริบทของวิดเจ็ต Google Maps
ต้องระบุ รหัสที่ตรงกับรหัสจากบล็อกการเรียกใช้ฟังก์ชัน
แฮชลายเซ็นสำหรับการตรวจสอบฝั่งแบ็กเอนด์
TextAnnotationDelta
ไม่มีคำอธิบาย
ตั้งค่าเป็น "text_annotation" เสมอ
annotations Annotation (ไม่บังคับ)
ข้อมูลการอ้างอิงสำหรับเนื้อหาที่โมเดลสร้างขึ้น
ประเภทที่เป็นไปได้
ตัวแยกประเภทแบบหลายรูปแบบ: type
UrlCitation
คำอธิบายประกอบการอ้างอิง URL
ไม่มีคำอธิบาย
ตั้งค่าเป็น "url_citation" เสมอ
URL
ชื่อของ URL
จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์
จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)
FileCitation
คำอธิบายประกอบการอ้างอิงไฟล์
ไม่มีคำอธิบาย
ตั้งค่าเป็น "file_citation" เสมอ
URI ของไฟล์
ชื่อไฟล์
แหล่งที่มาของข้อความบางส่วน
จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์
จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)
PlaceCitation
คำอธิบายประกอบการอ้างอิงสถานที่
ไม่มีคำอธิบาย
ตั้งค่าเป็น "place_citation" เสมอ
รหัสของสถานที่ในรูปแบบ `places/{place_id}`
ชื่อสถานที่
ข้อมูลอ้างอิง URI ของสถานที่
review_snippets ReviewSnippet (ไม่บังคับ)
ข้อมูลรีวิวที่ใช้ในการสร้างคำตอบเกี่ยวกับ ฟีเจอร์ของสถานที่หนึ่งๆ ใน Google Maps
ช่อง
ชื่อของรีวิว
ลิงก์ที่สอดคล้องกับรีวิวของผู้ใช้ใน Google Maps
รหัสของตัวอย่างรีวิว
จุดเริ่มต้นของส่วนของคำตอบที่มาจากแหล่งที่มานี้ ดัชนีระบุจุดเริ่มต้นของกลุ่ม โดยวัดเป็นไบต์
จุดสิ้นสุดของกลุ่มที่มาของการระบุแหล่งที่มา (ไม่รวมจุดสิ้นสุด)
โทเค็น event_id ที่จะใช้เพื่อดำเนินการต่อในสตรีมการโต้ตอบจากเหตุการณ์นี้
ContentStop
ไม่มีคำอธิบาย
ตั้งค่าเป็น "content.stop" เสมอ
ไม่มีคำอธิบาย
โทเค็น event_id ที่จะใช้เพื่อดำเนินการต่อในสตรีมการโต้ตอบจากเหตุการณ์นี้
ErrorEvent
ไม่มีคำอธิบาย
ตั้งค่าเป็น "error" เสมอ
ข้อผิดพลาด ข้อผิดพลาด (ไม่บังคับ)
ไม่มีคำอธิบาย
ช่อง
URI ที่ระบุประเภทข้อผิดพลาด
ข้อความแสดงข้อผิดพลาดที่มนุษย์อ่านได้
โทเค็น event_id ที่จะใช้เพื่อดำเนินการต่อในสตรีมการโต้ตอบจากเหตุการณ์นี้
ตัวอย่าง
เริ่มการโต้ตอบ
{ "event_type": "interaction.start", "interaction": { "id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM", "model": "gemini-3-flash-preview", "object": "interaction", "status": "in_progress" } }
การโต้ตอบเสร็จสมบูรณ์
{ "event_type": "interaction.complete", "interaction": { "created": "2025-12-09T18:45:40Z", "id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM", "model": "gemini-3-flash-preview", "object": "interaction", "role": "model", "status": "completed", "updated": "2025-12-09T18:45:40Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 11 } ], "total_cached_tokens": 0, "total_input_tokens": 11, "total_output_tokens": 364, "total_thought_tokens": 1120, "total_tokens": 1495, "total_tool_use_tokens": 0 } } }
การอัปเดตสถานะการโต้ตอบ
{ "event_type": "interaction.status_update", "interaction_id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM", "status": "in_progress" }
เริ่มเนื้อหา
{ "event_type": "content.start", "content": { "type": "text" }, "index": 1 }
การเปลี่ยนแปลงของเนื้อหา
{ "event_type": "content.delta", "delta": { "type": "text", "text": "Elara\u2019s life was a symphony of quiet moments. A librarian, she found solace in the hushed aisles, the scent of aged paper, and the predictable rhythm of her days. Her small apartment, meticulously ordered, reflected this internal calm, save" }, "index": 1 }
หยุดเนื้อหา
{ "event_type": "content.stop", "index": 1 }
เหตุการณ์ข้อผิดพลาด
{ "event_type": "error", "error": { "message": "Failed to get completed interaction: Result not found.", "code": "not_found" } }