رابط برنامهنویسی کاربردی Gemini Interactions یک رابط برنامهنویسی کاربردی آزمایشی است که به توسعهدهندگان اجازه میدهد تا با استفاده از مدلهای Gemini، برنامههای هوش مصنوعی مولد بسازند. Gemini توانمندترین مدل ما است که از پایه برای چندوجهی بودن ساخته شده است. این مدل میتواند انواع مختلف اطلاعات از جمله زبان، تصاویر، صدا، ویدئو و کد را تعمیم داده و به طور یکپارچه درک کند، در میان آنها عمل کند و ترکیب کند. میتوانید از API Gemini برای موارد استفاده مانند استدلال در متن و تصاویر، تولید محتوا، عاملهای گفتگو، سیستمهای خلاصهسازی و طبقهبندی و موارد دیگر استفاده کنید.
ایجاد تعامل
یک تعامل جدید ایجاد میکند.
درخواست بدنه
بدنه درخواست شامل دادههایی با ساختار زیر است:
مدل ModelOption (اختیاری)
نام «مدل» مورد استفاده برای تولید تعامل.
در صورت عدم ارائه «عامل»، الزامی است.
مقادیر ممکن:
-
gemini-2.5-computer-use-preview-10-2025یک مدل قابلیت عاملمحور که برای تعامل مستقیم رابط کاربری طراحی شده است و به Gemini اجازه میدهد محیطهای دیجیتال را درک و پیمایش کند.
-
gemini-2.5-flashاولین مدل استدلال ترکیبی ما که از یک پنجره زمینه ۱ میلیون توکنی پشتیبانی میکند و دارای بودجههای تفکر است.
-
gemini-2.5-flash-imageمدل تولید تصویر بومی ما، که برای سرعت، انعطافپذیری و درک متنی بهینه شده است. ورودی و خروجی متن با همان قیمت ۲.۵ فلش ارائه میشود.
-
gemini-2.5-flash-liteکوچکترین و مقرون به صرفه ترین مدل ما، ساخته شده برای استفاده در مقیاس بزرگ.
-
gemini-2.5-flash-lite-preview-09-2025جدیدترین مدل مبتنی بر Gemini 2.5 Flash lite که برای صرفهجویی در هزینه، توان عملیاتی بالا و کیفیت بالا بهینه شده است.
-
gemini-2.5-flash-native-audio-preview-12-2025مدلهای صوتی بومی ما برای خروجیهای صوتی با کیفیت بالاتر با ریتم بهتر، طبیعی بودن صدا، پرگویی و حس و حال بهتر بهینه شدهاند.
-
gemini-2.5-flash-preview-09-2025آخرین مدل مبتنی بر مدل فلش ۲.۵. پیشنمایش فلش ۲.۵ برای پردازش در مقیاس بزرگ، وظایف با تأخیر کم و حجم بالا که نیاز به تفکر دارند و موارد استفاده عاملمحور بهترین گزینه است.
-
gemini-2.5-flash-preview-ttsمدل تبدیل متن به گفتار ۲.۵ فلش ما برای تولید گفتار قابل کنترل قدرتمند و با تأخیر کم بهینه شده است.
-
gemini-2.5-proمدل چندمنظوره پیشرفته ما، که در کدنویسی و کارهای استدلالی پیچیده عالی عمل میکند.
-
gemini-2.5-pro-preview-ttsمدل صوتی متن به گفتار نسخه ۲.۵ پرو ما برای تولید گفتار قدرتمند و با تأخیر کم بهینه شده است تا خروجیهای طبیعیتر و هدایت آسانتر دستورات را فراهم کند.
-
gemini-3-flash-previewهوشمندترین مدل ما که برای سرعت ساخته شده است، هوش مرزی را با جستجو و ردیابی برتر ترکیب میکند.
-
gemini-3-pro-image-previewمدل پیشرفته تولید و ویرایش تصویر.
-
gemini-3-pro-previewهوشمندترین مدل ما با استدلال SOTA و درک چندوجهی، و قابلیتهای قدرتمند کدگذاری عاملی و ارتعاشی.
-
gemini-3.1-pro-previewجدیدترین مدل استدلال SOTA ما با عمق و ظرافت بیسابقه و قابلیتهای قدرتمند درک و کدنویسی چندوجهی.
-
gemini-3.1-flash-image-previewهوش بصری حرفهای با کارایی فوقالعاده و قابلیتهای تولید محتوای مبتنی بر واقعیت.
-
gemini-3.1-flash-lite-previewمقرونبهصرفهترین مدل ما، بهینهشده برای وظایف عاملمحور با حجم بالا، ترجمه و پردازش دادههای ساده.
-
gemini-3.1-flash-tts-previewGemini 3.1 Flash TTS: تولید گفتار قدرتمند و با تأخیر کم. از خروجیهای طبیعی، دستورات قابل هدایت و برچسبهای صوتی رسا برای کنترل دقیق روایت لذت ببرید.
-
lyria-3-clip-previewمدل تولید موسیقی با تأخیر کم ما برای کلیپهای صوتی با کیفیت بالا و کنترل دقیق ریتمیک بهینه شده است.
-
lyria-3-pro-previewمدل پیشرفته و کامل ما برای تولید آهنگ با درک عمیق از آهنگسازی، بهینه شده برای کنترل ساختاری دقیق و انتقالهای پیچیده در سبکهای مختلف موسیقی.
گزینه عامل (اختیاری)
نام «عامل» مورد استفاده برای ایجاد تعامل.
در صورت عدم ارائه «مدل»، الزامی است.
مقادیر ممکن:
-
deep-research-pro-preview-12-2025نماینده تحقیقات عمیق جمینی
-
deep-research-preview-04-2026نماینده تحقیقات عمیق جمینی
-
deep-research-max-preview-04-2026مامور مکس تحقیقات عمیق جمینی
ورودیهای تعامل (مشترک برای مدل و عامل).
دستورالعمل سیستم برای تعامل.
فهرستی از اعلانهای ابزار که مدل ممکن است در طول تعامل فراخوانی کند.
تأکید میکند که پاسخ تولید شده یک شیء JSON است که با طرحواره JSON مشخص شده در این فیلد مطابقت دارد.
نوع MIME پاسخ. در صورت تنظیم response_format، این مورد الزامی است.
فقط ورودی. اینکه آیا تعامل پخش زنده خواهد شد یا خیر.
فقط ورودی. آیا پاسخ و درخواست برای بازیابی بعدی ذخیره شود یا خیر.
فقط ورودی. اینکه آیا تعامل مدل در پسزمینه اجرا شود یا خیر.
generation_config GenerationConfig (اختیاری)
پیکربندی مدل
پارامترهای پیکربندی برای تعامل مدل.
جایگزینی برای `agent_config`. فقط زمانی قابل اجرا است که `model` تنظیم شده باشد.
فیلدها
تصادفی بودن خروجی را کنترل میکند.
حداکثر احتمال تجمعی توکنها که باید هنگام نمونهگیری در نظر گرفته شود.
بذر مورد استفاده در رمزگشایی برای تکرارپذیری.
فهرستی از توالیهای کاراکتری که تعامل خروجی را متوقف میکنند.
سطح_فکریسطح_فکری ( اختیاری )
سطح توکنهای فکری که مدل باید تولید کند.
مقادیر ممکن:
-
minimal -
low -
medium -
high
خلاصههای تفکر ( اختیاری)
اینکه آیا خلاصه نظرات در پاسخ گنجانده شود یا خیر.
مقادیر ممکن:
-
auto -
none
حداکثر تعداد توکنهایی که باید در پاسخ گنجانده شوند.
speech_config SpeechConfig (اختیاری)
پیکربندی برای تعامل گفتاری.
فیلدها
صدای گوینده.
زبان گفتار.
نام گوینده، باید با نام گوینده داده شده در سوال مطابقت داشته باشد.
image_config پیکربندی تصویر (اختیاری)
پیکربندی برای تعامل تصویر.
فیلدها
هیچ توضیحی ارائه نشده است.
مقادیر ممکن:
-
1:1 -
2:3 -
3:2 -
3:4 -
4:3 -
4:5 -
5:4 -
9:16 -
16:9 -
21:9 -
1:8 -
8:1 -
1:4 -
4:1
هیچ توضیحی ارائه نشده است.
مقادیر ممکن:
-
1K -
2K -
4K -
512
پیکربندی انتخاب ابزار.
شیء agent_config (اختیاری)
پیکربندی عامل
پیکربندی برای عامل.
جایگزینی برای `generation_config`. فقط زمانی قابل اجرا است که `agent` تنظیم شده باشد.
انواع ممکن
تفکیککننده چندریختی: type
پیکربندی DynamicAgent
پیکربندی برای عاملهای پویا
هیچ توضیحی ارائه نشده است.
همیشه روی "dynamic" تنظیم شود.
پیکربندی DeepResearchAgent
پیکربندی برای عامل تحقیقات عمیق.
هیچ توضیحی ارائه نشده است.
همیشه روی "deep-research" تنظیم شود.
خلاصههای تفکر ( اختیاری)
اینکه آیا خلاصه نظرات در پاسخ گنجانده شود یا خیر.
مقادیر ممکن:
-
auto -
none
اینکه آیا باید از تصاویر در پاسخ استفاده کرد یا خیر.
مقادیر ممکن:
-
off -
auto
برنامهریزی انسان در حلقه را برای عامل تحقیقات عمیق فعال میکند. اگر روی درست تنظیم شود، عامل تحقیقات عمیق در پاسخ خود یک طرح تحقیقاتی ارائه میدهد. سپس عامل تنها در صورتی ادامه میدهد که کاربر طرح را در نوبت بعدی تأیید کند.
شناسهی تعامل قبلی، در صورت وجود.
روش_پاسخ ( اختیاری )
روشهای درخواستی برای پاسخ (متن، تصویر، صدا).
مقادیر ممکن:
-
text -
image -
audio -
video -
document
لایه سرویس برای تعامل.
مقادیر ممکن:
-
flex -
standard -
priority
پاسخ
یک منبع تعامل (Interaction) را برمیگرداند.
درخواست ساده
پاسخ نمونه
{ "created": "2025-11-26T12:25:15Z", "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "object": "interaction", "outputs": [ { "text": "Hello! I'm functioning perfectly and ready to assist you.\n\nHow are you doing today?", "type": "text" } ], "role": "model", "status": "completed", "updated": "2025-11-26T12:25:15Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 7 } ], "total_cached_tokens": 0, "total_input_tokens": 7, "total_output_tokens": 20, "total_thought_tokens": 22, "total_tokens": 49, "total_tool_use_tokens": 0 } }
چند نوبتی
پاسخ نمونه
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "role": "model", "outputs": [ { "type": "text", "text": "The capital of France is Paris." } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 50 } ], "total_cached_tokens": 0, "total_input_tokens": 50, "total_output_tokens": 10, "total_thought_tokens": 0, "total_tokens": 60, "total_tool_use_tokens": 0 } }
ورودی تصویر
پاسخ نمونه
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "role": "model", "outputs": [ { "type": "text", "text": "A white humanoid robot with glowing blue eyes stands holding a red skateboard." } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 10 }, { "modality": "image", "tokens": 258 } ], "total_cached_tokens": 0, "total_input_tokens": 268, "total_output_tokens": 20, "total_thought_tokens": 0, "total_tokens": 288, "total_tool_use_tokens": 0 } }
فراخوانی تابع
پاسخ نمونه
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "requires_action", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "role": "model", "outputs": [ { "type": "function_call", "id": "gth23981", "name": "get_weather", "arguments": { "location": "Boston, MA" } } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 100 } ], "total_cached_tokens": 0, "total_input_tokens": 100, "total_output_tokens": 25, "total_thought_tokens": 0, "total_tokens": 125, "total_tool_use_tokens": 50 } }
تحقیقات عمیق
پاسخ نمونه
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "agent": "deep-research-pro-preview-12-2025", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "role": "agent", "outputs": [ { "type": "text", "text": "Here is a comprehensive research report on the current state of cancer research..." } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 20 } ], "total_cached_tokens": 0, "total_input_tokens": 20, "total_output_tokens": 1000, "total_thought_tokens": 500, "total_tokens": 1520, "total_tool_use_tokens": 0 } }
بازیابی یک تعامل
جزئیات کامل یک تعامل واحد را بر اساس `Interaction.id` آن بازیابی میکند.
پارامترهای مسیر/پرسوجو
شناسه منحصر به فرد تعاملی که قرار است بازیابی شود.
اگر روی درست تنظیم شود، محتوای تولید شده به صورت تدریجی پخش میشود.
پیشفرض: False
اختیاری. در صورت تنظیم، جریان تعامل را از بخش بعدی پس از رویداد مشخص شده توسط شناسه رویداد از سر میگیرد. فقط در صورتی قابل استفاده است که `stream` برابر با true باشد.
اگر روی true تنظیم شود، ورودی را در پاسخ لحاظ میکند.
پیشفرض: False
از کدام نسخه API استفاده کنیم.
پاسخ
یک منبع تعامل (Interaction) را برمیگرداند.
تعامل دریافت کنید
پاسخ نمونه
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:25:15Z", "updated": "2025-11-26T12:25:15Z", "role": "model", "outputs": [ { "type": "text", "text": "I'm doing great, thank you for asking! How can I help you today?" } ] }
حذف یک تعامل
تعامل را بر اساس شناسه حذف میکند.
پارامترهای مسیر/پرسوجو
شناسه منحصر به فرد تعاملی که باید حذف شود.
از کدام نسخه API استفاده کنیم.
پاسخ
در صورت موفقیت، پاسخ خالی است.
حذف تعامل
لغو یک تعامل
یک تعامل را بر اساس شناسه لغو میکند. این فقط برای تعاملات پسزمینهای که هنوز در حال اجرا هستند، اعمال میشود.
پارامترهای مسیر/پرسوجو
شناسه منحصر به فرد تعاملی که باید لغو شود.
از کدام نسخه API استفاده کنیم.
پاسخ
یک منبع تعامل (Interaction) را برمیگرداند.
لغو تعامل
پاسخ نمونه
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "agent": "deep-research-pro-preview-12-2025", "status": "cancelled", "object": "interaction", "created": "2025-11-26T12:25:15Z", "updated": "2025-11-26T12:25:15Z", "role": "agent" }
منابع
تعامل
منبع تعامل.
فیلدها
مدل ModelOption (اختیاری)
نام «مدل» مورد استفاده برای تولید تعامل.
مقادیر ممکن:
-
gemini-2.5-computer-use-preview-10-2025یک مدل قابلیت عاملمحور که برای تعامل مستقیم رابط کاربری طراحی شده است و به Gemini اجازه میدهد محیطهای دیجیتال را درک و پیمایش کند.
-
gemini-2.5-flashاولین مدل استدلال ترکیبی ما که از یک پنجره زمینه ۱ میلیون توکنی پشتیبانی میکند و دارای بودجههای تفکر است.
-
gemini-2.5-flash-imageمدل تولید تصویر بومی ما، که برای سرعت، انعطافپذیری و درک متنی بهینه شده است. ورودی و خروجی متن با همان قیمت ۲.۵ فلش ارائه میشود.
-
gemini-2.5-flash-liteکوچکترین و مقرون به صرفه ترین مدل ما، ساخته شده برای استفاده در مقیاس بزرگ.
-
gemini-2.5-flash-lite-preview-09-2025جدیدترین مدل مبتنی بر Gemini 2.5 Flash lite که برای صرفهجویی در هزینه، توان عملیاتی بالا و کیفیت بالا بهینه شده است.
-
gemini-2.5-flash-native-audio-preview-12-2025مدلهای صوتی بومی ما برای خروجیهای صوتی با کیفیت بالاتر با ریتم بهتر، طبیعی بودن صدا، پرگویی و حس و حال بهتر بهینه شدهاند.
-
gemini-2.5-flash-preview-09-2025آخرین مدل مبتنی بر مدل فلش ۲.۵. پیشنمایش فلش ۲.۵ برای پردازش در مقیاس بزرگ، وظایف با تأخیر کم و حجم بالا که نیاز به تفکر دارند و موارد استفاده عاملمحور بهترین گزینه است.
-
gemini-2.5-flash-preview-ttsمدل تبدیل متن به گفتار ۲.۵ فلش ما برای تولید گفتار قابل کنترل قدرتمند و با تأخیر کم بهینه شده است.
-
gemini-2.5-proمدل چندمنظوره پیشرفته ما، که در کدنویسی و کارهای استدلالی پیچیده عالی عمل میکند.
-
gemini-2.5-pro-preview-ttsمدل صوتی متن به گفتار نسخه ۲.۵ پرو ما برای تولید گفتار قدرتمند و با تأخیر کم بهینه شده است تا خروجیهای طبیعیتر و هدایت آسانتر دستورات را فراهم کند.
-
gemini-3-flash-previewهوشمندترین مدل ما که برای سرعت ساخته شده است، هوش مرزی را با جستجو و ردیابی برتر ترکیب میکند.
-
gemini-3-pro-image-previewمدل پیشرفته تولید و ویرایش تصویر.
-
gemini-3-pro-previewهوشمندترین مدل ما با استدلال SOTA و درک چندوجهی، و قابلیتهای قدرتمند کدگذاری عاملی و ارتعاشی.
-
gemini-3.1-pro-previewجدیدترین مدل استدلال SOTA ما با عمق و ظرافت بیسابقه و قابلیتهای قدرتمند درک و کدنویسی چندوجهی.
-
gemini-3.1-flash-image-previewهوش بصری حرفهای با کارایی فوقالعاده و قابلیتهای تولید محتوای مبتنی بر واقعیت.
-
gemini-3.1-flash-lite-previewمقرونبهصرفهترین مدل ما، بهینهشده برای وظایف عاملمحور با حجم بالا، ترجمه و پردازش دادههای ساده.
-
gemini-3.1-flash-tts-previewGemini 3.1 Flash TTS: تولید گفتار قدرتمند و با تأخیر کم. از خروجیهای طبیعی، دستورات قابل هدایت و برچسبهای صوتی رسا برای کنترل دقیق روایت لذت ببرید.
-
lyria-3-clip-previewمدل تولید موسیقی با تأخیر کم ما برای کلیپهای صوتی با کیفیت بالا و کنترل دقیق ریتمیک بهینه شده است.
-
lyria-3-pro-previewمدل پیشرفته و کامل ما برای تولید آهنگ با درک عمیق از آهنگسازی، بهینه شده برای کنترل ساختاری دقیق و انتقالهای پیچیده در سبکهای مختلف موسیقی.
گزینه عامل (اختیاری)
نام «عامل» مورد استفاده برای ایجاد تعامل.
مقادیر ممکن:
-
deep-research-pro-preview-12-2025نماینده تحقیقات عمیق جمینی
-
deep-research-preview-04-2026نماینده تحقیقات عمیق جمینی
-
deep-research-max-preview-04-2026مامور مکس تحقیقات عمیق جمینی
الزامی. فقط خروجی. یک شناسه منحصر به فرد برای تکمیل تعامل.
الزامی. فقط خروجی. وضعیت تعامل.
مقادیر ممکن:
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
الزامی. فقط خروجی. زمانی که پاسخ در قالب ISO 8601 (YYYY-MM-DDThh:mm:ssZ) ایجاد شده است.
الزامی. فقط خروجی. زمانی که پاسخ آخرین بار در قالب ISO 8601 (YYYY-MM-DDThh:mm:ssZ) بهروزرسانی شده است.
فقط خروجی. نقش تعامل.
فقط خروجی. پاسخها از مدل.
دستورالعمل سیستم برای تعامل.
فهرستی از اعلانهای ابزار که مدل ممکن است در طول تعامل فراخوانی کند.
کاربرد (اختیاری )
فقط خروجی. آمار مربوط به میزان استفاده از توکن درخواست تعامل.
فیلدها
تعداد توکنها در اعلان (زمینه).
ورودی_توکنها_براساس_مودالیتی توکنهای مودالیتی (اختیاری)
تفکیک استفاده از توکن ورودی بر اساس روش.
فیلدها
روش پاسخ (اختیاری)
روش مرتبط با شمارش توکنها.
مقادیر ممکن:
-
text -
image -
audio -
video -
document
تعداد توکنها برای روش.
تعداد توکنها در بخش ذخیرهشدهی اعلان (محتوای ذخیرهشده).
cached_tokens_by_modality توکنهای مودالیتی (اختیاری)
تفکیک میزان استفاده از توکنهای ذخیرهشده بر اساس روش.
فیلدها
روش پاسخ (اختیاری)
روش مرتبط با شمارش توکنها.
مقادیر ممکن:
-
text -
image -
audio -
video -
document
تعداد توکنها برای روش.
تعداد کل توکنها در تمام پاسخهای تولید شده.
خروجی_توکنها_براساس_مودالیتی توکنهای مودالیتی (اختیاری)
تفکیک استفاده از توکن خروجی بر اساس روش.
فیلدها
روش پاسخ (اختیاری)
روش مرتبط با شمارش توکنها.
مقادیر ممکن:
-
text -
image -
audio -
video -
document
تعداد توکنها برای روش.
تعداد توکنهای موجود در اعلان(های) استفاده از ابزار.
ابزار_استفاده_از_توکنها_توسط_مودالیتی توکنهای مودالیتی (اختیاری)
تفکیک میزان استفاده از توکنهای ابزار بر اساس روش.
فیلدها
روش پاسخ (اختیاری)
روش مرتبط با شمارش توکنها.
مقادیر ممکن:
-
text -
image -
audio -
video -
document
تعداد توکنها برای روش.
تعداد توکنهای افکار برای مدلهای تفکر.
تعداد کل توکنها برای درخواست تعامل (درخواست + پاسخها + سایر توکنهای داخلی).
روش_پاسخ ( اختیاری )
روشهای درخواستی برای پاسخ (متن، تصویر، صدا).
مقادیر ممکن:
-
text -
image -
audio -
video -
document
تأکید میکند که پاسخ تولید شده یک شیء JSON است که با طرحواره JSON مشخص شده در این فیلد مطابقت دارد.
نوع MIME پاسخ. در صورت تنظیم response_format، این مورد الزامی است.
شناسهی تعامل قبلی، در صورت وجود.
لایه سرویس برای تعامل.
مقادیر ممکن:
-
flex -
standard -
priority
شیء agent_config (اختیاری)
پارامترهای پیکربندی برای تعامل عامل.
انواع ممکن
تفکیککننده چندریختی: type
پیکربندی DynamicAgent
پیکربندی برای عاملهای پویا
هیچ توضیحی ارائه نشده است.
همیشه روی "dynamic" تنظیم شود.
پیکربندی DeepResearchAgent
پیکربندی برای عامل تحقیقات عمیق.
هیچ توضیحی ارائه نشده است.
همیشه روی "deep-research" تنظیم شود.
خلاصههای تفکر ( اختیاری)
اینکه آیا خلاصه نظرات در پاسخ گنجانده شود یا خیر.
مقادیر ممکن:
-
auto -
none
اینکه آیا باید از تصاویر در پاسخ استفاده کرد یا خیر.
مقادیر ممکن:
-
off -
auto
برنامهریزی انسان در حلقه را برای عامل تحقیقات عمیق فعال میکند. اگر روی درست تنظیم شود، عامل تحقیقات عمیق در پاسخ خود یک طرح تحقیقاتی ارائه میدهد. سپس عامل تنها در صورتی ادامه میدهد که کاربر طرح را در نوبت بعدی تأیید کند.
مثالها
مثال
{ "created": "2025-12-04T15:01:45Z", "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg", "model": "gemini-3-flash-preview", "object": "interaction", "outputs": [ { "text": "Hello! I'm doing well, functioning as expected. Thank you for asking! How are you doing today?", "type": "text" } ], "role": "model", "status": "completed", "updated": "2025-12-04T15:01:45Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 7 } ], "total_cached_tokens": 0, "total_input_tokens": 7, "total_output_tokens": 23, "total_thought_tokens": 49, "total_tokens": 79, "total_tool_use_tokens": 0 } }
مدلهای داده
محتوا
محتوای پاسخ.
انواع ممکن
تفکیککننده چندریختی: type
محتوای متن
یک بلوک محتوای متنی.
هیچ توضیحی ارائه نشده است.
همیشه روی "text" تنظیم شود.
محتوای متن الزامی است.
حاشیهنویسیها ( اختیاری )
اطلاعات استناد برای محتوای تولید شده توسط مدل.
انواع ممکن
تفکیککننده چندریختی: type
استناد به آدرس اینترنتی
حاشیهنویسی استناد URL.
هیچ توضیحی ارائه نشده است.
همیشه روی "url_citation" تنظیم شود.
آدرس اینترنتی (URL).
عنوان URL.
شروع بخش پاسخی که به این منبع نسبت داده میشود. اندیس، شروع بخش را نشان میدهد که بر حسب بایت اندازهگیری میشود.
پایان بخش منسوب، منحصر به فرد.
استناد به فایل
حاشیهنویسی استناد به فایل.
هیچ توضیحی ارائه نشده است.
همیشه روی "file_citation" تنظیم شود.
آدرس اینترنتی (URI) فایل.
نام فایل.
منبع برای بخشی از متن ذکر شده است.
شروع بخش پاسخی که به این منبع نسبت داده میشود. اندیس، شروع بخش را نشان میدهد که بر حسب بایت اندازهگیری میشود.
پایان بخش منسوب، منحصر به فرد.
استناد به مکان
حاشیهنویسی برای استناد به مکان.
هیچ توضیحی ارائه نشده است.
همیشه روی "place_citation" تنظیم شود.
شناسه مکان، با فرمت `places/{place_id}`.
عنوان مکان.
مرجع URI آن مکان.
review_snippets قطعه کد نقد و بررسی (اختیاری)
گزیدههایی از نظرات که برای تولید پاسخ در مورد ویژگیهای یک مکان مشخص در نقشههای گوگل استفاده میشوند.
فیلدها
عنوان نقد.
لینکی که مربوط به نظر کاربر در نقشه گوگل باشد.
شناسهی قطعه نقد و بررسی.
شروع بخش پاسخی که به این منبع نسبت داده میشود. اندیس، شروع بخش را نشان میدهد که بر حسب بایت اندازهگیری میشود.
پایان بخش منسوب، منحصر به فرد.
محتوای تصویر
یک بلوک محتوای تصویر.
هیچ توضیحی ارائه نشده است.
همیشه روی "image" تنظیم شود.
محتوای تصویر.
آدرس اینترنتی (URI) تصویر.
نوع مایم تصویر.
مقادیر ممکن:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
وضوح تصویر MediaResolution (اختیاری)
قطعنامه رسانهها.
مقادیر ممکن:
-
low -
medium -
high -
ultra_high
محتوای صوتی
یک بلوک محتوای صوتی.
هیچ توضیحی ارائه نشده است.
همیشه روی "audio" تنظیم شود.
محتوای صوتی.
آدرس اینترنتی (URI) فایل صوتی.
نوع مایم صدا.
مقادیر ممکن:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
نرخ نمونهبرداری صدا.
تعداد کانالهای صوتی
محتوای سند
یک بلوک محتوای سند.
هیچ توضیحی ارائه نشده است.
همیشه روی "document" تنظیم شود.
محتوای سند.
آدرس اینترنتی (URI) سند.
نوع MIME سند.
مقادیر ممکن:
-
application/pdf
محتوای ویدیویی
یک بلوک محتوای ویدیویی.
هیچ توضیحی ارائه نشده است.
همیشه روی "video" تنظیم شود.
محتوای ویدیویی.
آدرس اینترنتی (URI) ویدیو.
نوع میم (شبیهسازی) ویدیو.
مقادیر ممکن:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
وضوح تصویر MediaResolution (اختیاری)
قطعنامه رسانهها.
مقادیر ممکن:
-
low -
medium -
high -
ultra_high
محتوای فکری
یک بلوک محتوای فکری.
هیچ توضیحی ارائه نشده است.
همیشه روی "thought" تنظیم شود.
امضا برای مطابقت با منبع backend تا بخشی از نسل باشد.
خلاصه محتوای خلاصه اندیشه (اختیاری)
خلاصهای از اندیشه.
انواع ممکن
تفکیککننده چندریختی: type
محتوای متن
یک بلوک محتوای متنی.
هیچ توضیحی ارائه نشده است.
همیشه روی "text" تنظیم شود.
محتوای متن الزامی است.
حاشیهنویسیها ( اختیاری )
اطلاعات استناد برای محتوای تولید شده توسط مدل.
انواع ممکن
تفکیککننده چندریختی: type
استناد به آدرس اینترنتی
حاشیهنویسی استناد URL.
هیچ توضیحی ارائه نشده است.
همیشه روی "url_citation" تنظیم شود.
آدرس اینترنتی (URL).
عنوان URL.
شروع بخش پاسخی که به این منبع نسبت داده میشود. اندیس، شروع بخش را نشان میدهد که بر حسب بایت اندازهگیری میشود.
پایان بخش منسوب، منحصر به فرد.
استناد به فایل
حاشیهنویسی استناد به فایل.
هیچ توضیحی ارائه نشده است.
همیشه روی "file_citation" تنظیم شود.
آدرس اینترنتی (URI) فایل.
نام فایل.
منبع برای بخشی از متن ذکر شده است.
شروع بخش پاسخی که به این منبع نسبت داده میشود. اندیس، شروع بخش را نشان میدهد که بر حسب بایت اندازهگیری میشود.
پایان بخش منسوب، منحصر به فرد.
استناد به مکان
حاشیهنویسی برای استناد به مکان.
هیچ توضیحی ارائه نشده است.
همیشه روی "place_citation" تنظیم شود.
شناسه مکان، با فرمت `places/{place_id}`.
عنوان مکان.
مرجع URI آن مکان.
review_snippets قطعه کد نقد و بررسی (اختیاری)
گزیدههایی از نظرات که برای تولید پاسخ در مورد ویژگیهای یک مکان مشخص در نقشههای گوگل استفاده میشوند.
فیلدها
عنوان نقد.
لینکی که مربوط به نظر کاربر در نقشه گوگل باشد.
شناسهی قطعه نقد و بررسی.
شروع بخش پاسخی که به این منبع نسبت داده میشود. اندیس، شروع بخش را نشان میدهد که بر حسب بایت اندازهگیری میشود.
پایان بخش منسوب، منحصر به فرد.
محتوای تصویر
یک بلوک محتوای تصویر.
هیچ توضیحی ارائه نشده است.
همیشه روی "image" تنظیم شود.
محتوای تصویر.
آدرس اینترنتی (URI) تصویر.
نوع مایم تصویر.
مقادیر ممکن:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
وضوح تصویر MediaResolution (اختیاری)
قطعنامه رسانهها.
مقادیر ممکن:
-
low -
medium -
high -
ultra_high
محتوای فراخوانی تابع
یک بلوک محتوای فراخوانی ابزار تابع.
هیچ توضیحی ارائه نشده است.
همیشه روی "function_call" تنظیم شود.
الزامی. نام ابزاری که باید فراخوانی شود.
آرگومانهایی که باید به تابع ارسال شوند.
الزامی. یک شناسه منحصر به فرد برای این فراخوانی ابزار خاص.
یک هش امضا برای اعتبارسنجی backend.
اجرای کدفراخوانی محتوا
محتوای اجرای کد.
هیچ توضیحی ارائه نشده است.
همیشه روی "code_execution_call" تنظیم شود.
آرگومانهای CodeExecutionCallArguments (الزامی)
الزامی. آرگومانهایی که برای اجرای کد ارسال میشوند.
فیلدها
زبان برنامهنویسی «کد».
مقادیر ممکن:
-
python
کدی که قرار است اجرا شود.
الزامی. یک شناسه منحصر به فرد برای این فراخوانی ابزار خاص.
یک هش امضا برای اعتبارسنجی backend.
محتوا
محتوای زمینه URL.
هیچ توضیحی ارائه نشده است.
همیشه روی "url_context_call" تنظیم شود.
آرگومانهای UrlContextCallArguments (الزامی)
آرگومانهایی که باید به متن URL ارسال شوند.
فیلدها
آدرسهای اینترنتی (URL) برای دریافت.
الزامی. یک شناسه منحصر به فرد برای این فراخوانی ابزار خاص.
یک هش امضا برای اعتبارسنجی backend.
McpServerToolCallContent
محتوای فراخوانی ابزار MCPServer.
هیچ توضیحی ارائه نشده است.
همیشه روی "mcp_server_tool_call" تنظیم شود.
الزامی. نام ابزاری که فراخوانی شده است.
الزامی. نام سرور MCP مورد استفاده.
الزامی. شیء JSON آرگومانهای تابع.
الزامی. یک شناسه منحصر به فرد برای این فراخوانی ابزار خاص.
یک هش امضا برای اعتبارسنجی backend.
جستجوی گوگل، محتوای تماس
محتوای جستجوی گوگل
هیچ توضیحی ارائه نشده است.
همیشه روی "google_search_call" تنظیم شود.
آرگومانهای GoogleSearchCall (الزامی)
الزامی. آرگومانهایی که باید به جستجوی گوگل ارسال شوند.
فیلدها
عبارتهای جستجوی وب برای جستجوی وب بعدی.
نوع اتصال زمینی جستجو فعال شده.
مقادیر ممکن:
-
web_search -
image_search -
enterprise_web_search
الزامی. یک شناسه منحصر به فرد برای این فراخوانی ابزار خاص.
یک هش امضا برای اعتبارسنجی backend.
جستجوی فایلمحتوای تماس
محتوای جستجوی فایل
هیچ توضیحی ارائه نشده است.
همیشه روی "file_search_call" تنظیم شود.
الزامی. یک شناسه منحصر به فرد برای این فراخوانی ابزار خاص.
یک هش امضا برای اعتبارسنجی backend.
محتوای تماس نقشه گوگل
محتوای نقشههای گوگل
هیچ توضیحی ارائه نشده است.
همیشه روی "google_maps_call" تنظیم شود.
آرگومانهای GoogleMapsCallArguments (اختیاری)
آرگومانهایی که باید به ابزار نقشههای گوگل ارسال شوند.
فیلدها
کوئریهایی که باید اجرا شوند.
الزامی. یک شناسه منحصر به فرد برای این فراخوانی ابزار خاص.
یک هش امضا برای اعتبارسنجی backend.
محتوای نتیجه تابع
یک بلوک محتوای نتیجه ابزار تابع.
هیچ توضیحی ارائه نشده است.
همیشه روی "function_result" تنظیم شود.
نام ابزاری که نامیده شد.
اینکه آیا فراخوانی ابزار منجر به خطا شده است یا خیر.
الزامی. شناسهای که با شناسهی بلوک فراخوانی تابع مطابقت داشته باشد.
یک هش امضا برای اعتبارسنجی backend.
نتیجه فراخوانی ابزار.
محتوای نتیجه اجرای کد
محتوای نتیجه اجرای کد.
هیچ توضیحی ارائه نشده است.
همیشه روی "code_execution_result" تنظیم شود.
خروجی اجرای کد. الزامی.
اینکه آیا اجرای کد منجر به خطا شده است یا خیر.
الزامی. شناسهای که با شناسهی بلوک فراخوانی تابع مطابقت داشته باشد.
یک هش امضا برای اعتبارسنجی backend.
محتوای نتیجهی URL
محتوای نتیجهی زمینهی URL.
هیچ توضیحی ارائه نشده است.
همیشه روی "url_context_result" تنظیم شود.
نتیجه UrlContextResult (الزامی)
الزامی. نتایج زمینه URL.
فیلدها
آدرس اینترنتی (URL) که دریافت شده است.
وضعیت بازیابی URL.
مقادیر ممکن:
-
success -
error -
paywall -
unsafe
اینکه آیا زمینه URL منجر به خطا شده است یا خیر.
الزامی. شناسهای که با شناسهی بلوک فراخوانی تابع مطابقت داشته باشد.
یک هش امضا برای اعتبارسنجی backend.
محتوای نتایج جستجوی گوگل
محتوای نتایج جستجوی گوگل
هیچ توضیحی ارائه نشده است.
همیشه روی "google_search_result" تنظیم شود.
نتیجه جستجوی گوگل (الزامی)
الزامی. نتایج جستجوی گوگل.
فیلدها
قطعه محتوای وب که میتواند در یک صفحه وب یا نمای وب یک برنامه تعبیه شود.
اینکه آیا جستجوی گوگل منجر به خطا شده است یا خیر.
الزامی. شناسهای که با شناسهی بلوک فراخوانی تابع مطابقت داشته باشد.
یک هش امضا برای اعتبارسنجی backend.
محتوای نتیجه ابزار McpServerTool
محتوای نتایج ابزار MCPServer.
هیچ توضیحی ارائه نشده است.
همیشه روی "mcp_server_tool_result" تنظیم شود.
نام ابزاری که برای این فراخوانی ابزار خاص فراخوانی میشود.
نام سرور MCP مورد استفاده.
الزامی. شناسهای که با شناسهی بلوک فراخوانی تابع مطابقت داشته باشد.
یک هش امضا برای اعتبارسنجی backend.
خروجی حاصل از فراخوانی سرور MCP. میتواند متن ساده یا محتوای غنی باشد.
محتوای نتیجه جستجوی فایل
محتوای نتیجه جستجوی فایل.
هیچ توضیحی ارائه نشده است.
همیشه روی "file_search_result" تنظیم شود.
نتیجه جستجوی فایل (الزامی)
الزامی. نتایج جستجوی فایل.
فیلدها
کاربر، فرادادهای در مورد FileSearchResult ارائه کرده است.
الزامی. شناسهای که با شناسهی بلوک فراخوانی تابع مطابقت داشته باشد.
یک هش امضا برای اعتبارسنجی backend.
محتوای نتایج نقشه گوگل
محتوای نتایج نقشه گوگل
هیچ توضیحی ارائه نشده است.
همیشه روی "google_maps_result" تنظیم شود.
نتیجه GoogleMapsResult (الزامی)
الزامی. نتایج نقشههای گوگل.
فیلدها
مکانها مکانها (اختیاری)
جاهایی که پیدا شد.
فیلدها
شناسه مکان، با فرمت `places/{place_id}`.
عنوان مکان.
مرجع URI آن مکان.
review_snippets قطعه کد نقد و بررسی (اختیاری)
گزیدههایی از نظرات که برای تولید پاسخ در مورد ویژگیهای یک مکان مشخص در نقشههای گوگل استفاده میشوند.
فیلدها
عنوان نقد.
لینکی که مربوط به نظر کاربر در نقشه گوگل باشد.
شناسهی قطعه نقد و بررسی.
نام منبع توکن زمینه ویجت نقشههای گوگل.
الزامی. شناسهای که با شناسهی بلوک فراخوانی تابع مطابقت داشته باشد.
یک هش امضا برای اعتبارسنجی backend.
مثالها
متن
{ "type": "text", "text": "Hello, how are you?" }
تصویر
{ "type": "image", "data": "BASE64_ENCODED_IMAGE", "mime_type": "image/png" }
صوتی
{ "type": "audio", "data": "BASE64_ENCODED_AUDIO", "mime_type": "audio/wav" }
سند
{ "type": "document", "data": "BASE64_ENCODED_DOCUMENT", "mime_type": "application/pdf" }
ویدئو
{ "type": "video", "uri": "https://www.youtube.com/watch?v=9hE5-98ZeCg" }
فکر
{ "type": "thought", "summary": [ { "type": "text", "text": "The user is asking about the weather. I should use the get_weather tool." } ], "signature": "CoMDAXLI2nynRYojJIy6B1Jh9os2crpWLfB0+19xcLsGG46bd8wjkF/6RNlRUdvHrXyjsHkG0BZFcuO/bPOyA6Xh5jANNgx82wPHjGExN8A4ZQn56FlMwyZoqFVQz0QyY1lfibFJ2zU3J87uw26OewzcuVX0KEcs+GIsZa3EA6WwqhbsOd3wtZB3Ua2Qf98VAWZTS5y/tWpql7jnU3/CU7pouxQr/Bwft3hwnJNesQ9/dDJTuaQ8Zprh9VRWf1aFFjpIueOjBRrlT3oW6/y/eRl/Gt9BQXCYTqg/38vHFUU4Wo/d9dUpvfCe/a3o97t2Jgxp34oFKcsVb4S5WJrykIkw+14DzVnTpCpbQNFckqvFLuqnJCkL0EQFtunBXI03FJpPu3T1XU6id8S7ojoJQZSauGUCgmaLqUGdMrd08oo81ecoJSLs51Re9N/lISGmjWFPGpqJLoGq6uo4FHz58hmeyXCgHG742BHz2P3MiH1CXHUT2J8mF6zLhf3SR9Qb3lkrobAh" }
فراخوانی تابع
{ "type": "function_call", "name": "get_weather", "id": "gth23981", "arguments": { "location": "Boston, MA" } }
فراخوانی اجرای کد
{ "type": "code_execution_call", "id": "call_123456", "arguments": { "language": "python", "code": "print('hello world')" } }
فراخوانی متن URL
{ "type": "url_context_call", "id": "call_123456", "arguments": { "urls": [ "https://www.example.com" ] } }
ابزار سرور مکپد
{ "type": "mcp_server_tool_call", "id": "call_123456", "name": "get_forecast", "server_name": "weather_server", "arguments": { "city": "London" } }
تماس جستجوی گوگل
{ "type": "google_search_call", "id": "call_123456", "arguments": { "queries": [ "weather in Boston" ] } }
جستجوی فایل
{ "type": "file_search_call", "id": "call_123456" }
تماس با نقشه گوگل
{ "type": "google_maps_call", "id": "call_123456", "arguments": { "query": "best food near me" } }
نتیجه تابع
{ "type": "function_result", "name": "get_weather", "call_id": "gth23981", "result": [ { "type": "text", "text": "{\"weather\":\"sunny\"}" } ] }
نتیجه اجرای کد
{ "type": "code_execution_result", "call_id": "call_123456", "result": "hello world" }
نتیجه متن URL
{ "type": "url_context_result", "call_id": "call_123456", "result": [ { "url": "https://www.example.com", "status": "SUCCESS" } ] }
نتیجه جستجوی گوگل
{ "type": "google_search_result", "call_id": "call_123456", "result": [ { "url": "https://www.google.com/search?q=weather+in+Boston", "title": "Weather in Boston" } ] }
نتیجه ابزار سرور مکپد
{ "type": "mcp_server_tool_result", "name": "get_forecast", "server_name": "weather_server", "call_id": "call_123456", "result": "sunny" }
نتیجه جستجوی فایل
{ "type": "file_search_result", "call_id": "call_123456", "result": [ { "text": "search result chunk", "file_search_store": "file_search_store" } ] }
نتیجه نقشه گوگل
{ "type": "google_maps_result", "call_id": "call_123456", "result": [ { "places": [ { "url": "https://www.google.com/maps/search/best+food+near+me", "name": "Tasty Restaurant" } ] } ] }
ابزار
ابزاری که میتواند توسط مدل مورد استفاده قرار گیرد.
انواع ممکن
تفکیککننده چندریختی: type
عملکرد
ابزاری که میتواند توسط مدل مورد استفاده قرار گیرد.
هیچ توضیحی ارائه نشده است.
همیشه روی "function" تنظیم شود.
نام تابع.
شرحی از تابع.
طرحواره JSON برای پارامترهای تابع.
اجرای کد
ابزاری که میتواند توسط مدل برای اجرای کد استفاده شود.
هیچ توضیحی ارائه نشده است.
همیشه روی "code_execution" تنظیم شود.
متن آدرس
ابزاری که میتواند توسط مدل برای دریافت متن URL استفاده شود.
هیچ توضیحی ارائه نشده است.
همیشه روی "url_context" تنظیم شود.
استفاده از کامپیوتر
ابزاری که میتواند توسط مدل برای تعامل با کامپیوتر استفاده شود.
هیچ توضیحی ارائه نشده است.
همیشه روی "computer_use" تنظیم شود.
محیطی که در حال اجرا است.
مقادیر ممکن:
-
browser
فهرست توابع از پیش تعریف شدهای که از فراخوانی مدل مستثنی شدهاند.
مکپسرور
MCPServer سروری است که میتواند توسط مدل برای انجام اقدامات فراخوانی شود.
هیچ توضیحی ارائه نشده است.
همیشه روی "mcp_server" تنظیم شود.
نام سرور MCP.
آدرس کامل URL برای نقطه پایانی MCPServer. مثال: "https://api.example.com/mcp"
اختیاری: در صورت نیاز، فیلدهایی برای هدرهای احراز هویت، زمانهای انقضا و غیره.
ابزارهای مجاز (اختیاری)
ابزارهای مجاز.
فیلدها
حالت انتخاب ابزار (اختیاری)
حالت انتخاب ابزار.
مقادیر ممکن:
-
auto -
any -
none -
validated
نام ابزارهای مجاز
جستجوی گوگل
ابزاری که میتواند توسط مدل برای جستجو در گوگل استفاده شود.
هیچ توضیحی ارائه نشده است.
همیشه روی "google_search" تنظیم شود.
انواع زمینهسازی جستجو برای فعالسازی.
مقادیر ممکن:
-
web_search -
image_search -
enterprise_web_search
جستجوی فایل
ابزاری که میتواند توسط مدل برای جستجوی فایلها استفاده شود.
هیچ توضیحی ارائه نشده است.
همیشه روی "file_search" تنظیم شود.
جستجوی فایل، نامهای فروشگاه را برای جستجو ذخیره میکند.
تعداد تکههای بازیابی معنایی که باید بازیابی شوند.
فیلتر فراداده برای اعمال روی اسناد و تکههای بازیابی معنایی.
گوگل مپ
ابزاری که میتواند توسط مدل برای فراخوانی نقشههای گوگل استفاده شود.
هیچ توضیحی ارائه نشده است.
همیشه روی "google_maps" تنظیم شود.
اینکه آیا در نتیجه فراخوانی ابزار، توکن زمینه ویجت برگردانده شود یا خیر.
عرض جغرافیایی محل کاربر.
طول جغرافیایی موقعیت مکانی کاربر.
بازیابی
ابزاری که میتواند توسط مدل برای بازیابی فایلها استفاده شود.
هیچ توضیحی ارائه نشده است.
همیشه روی "retrieval" تنظیم شود.
انواع بازیابی فایل برای فعال کردن.
مقادیر ممکن:
-
vertex_ai_search
vertex_ai_search_config پیکربندی VertexAISearchConfig (اختیاری)
برای تعیین پیکربندی VertexAISearch استفاده میشود.
فیلدها
Optional. Used to specify Vertex AI Search engine.
Optional. Used to specify Vertex AI Search datastores.
مثالها
عملکرد
CodeExecution
UrlContext
ComputerUse
McpServer
GoogleSearch
FileSearch
GoogleMaps
بازیابی
No examples available for this type.
نوبت
فیلدها
The originator of this turn. Must be user for input or model for model output.
هیچ توضیحی ارائه نشده است.
مثالها
User Turn
{ "role": "user", "content": [ { "type": "text", "text": "user turn" } ] }
Model Turn
{ "role": "model", "content": [ { "type": "text", "text": "model turn" } ] }
InteractionSseEvent
Possible Types
Polymorphic discriminator: event_type
InteractionStartEvent
هیچ توضیحی ارائه نشده است.
Always set to "interaction.start" .
هیچ توضیحی ارائه نشده است.
The event_id token to be used to resume the interaction stream, from this event.
InteractionCompleteEvent
هیچ توضیحی ارائه نشده است.
Always set to "interaction.complete" .
Required. The completed interaction with empty outputs to reduce the payload size. Use the preceding ContentDelta events for the actual output.
The event_id token to be used to resume the interaction stream, from this event.
InteractionStatusUpdate
هیچ توضیحی ارائه نشده است.
Always set to "interaction.status_update" .
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
Possible values:
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
The event_id token to be used to resume the interaction stream, from this event.
ContentStart
هیچ توضیحی ارائه نشده است.
Always set to "content.start" .
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
The event_id token to be used to resume the interaction stream, from this event.
ContentDelta
هیچ توضیحی ارائه نشده است.
Always set to "content.delta" .
هیچ توضیحی ارائه نشده است.
delta ContentDeltaData (required)
هیچ توضیحی ارائه نشده است.
Possible Types
Polymorphic discriminator: type
TextDelta
هیچ توضیحی ارائه نشده است.
Always set to "text" .
هیچ توضیحی ارائه نشده است.
ImageDelta
هیچ توضیحی ارائه نشده است.
Always set to "image" .
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
Possible values:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (optional)
The resolution of the media.
Possible values:
-
low -
medium -
high -
ultra_high
AudioDelta
هیچ توضیحی ارائه نشده است.
Always set to "audio" .
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
Possible values:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
The sample rate of the audio.
The number of audio channels.
DocumentDelta
هیچ توضیحی ارائه نشده است.
Always set to "document" .
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
Possible values:
-
application/pdf
VideoDelta
هیچ توضیحی ارائه نشده است.
Always set to "video" .
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
Possible values:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
resolution MediaResolution (optional)
The resolution of the media.
Possible values:
-
low -
medium -
high -
ultra_high
ThoughtSummaryDelta
هیچ توضیحی ارائه نشده است.
Always set to "thought_summary" .
content ThoughtSummaryContent (optional)
A new summary item to be added to the thought.
Possible Types
Polymorphic discriminator: type
TextContent
A text content block.
هیچ توضیحی ارائه نشده است.
Always set to "text" .
Required. The text content.
annotations Annotation (optional)
Citation information for model-generated content.
Possible Types
Polymorphic discriminator: type
UrlCitation
A URL citation annotation.
هیچ توضیحی ارائه نشده است.
Always set to "url_citation" .
آدرس اینترنتی (URL).
The title of the URL.
Start of segment of the response that is attributed to this source. Index indicates the start of the segment, measured in bytes.
End of the attributed segment, exclusive.
FileCitation
A file citation annotation.
هیچ توضیحی ارائه نشده است.
Always set to "file_citation" .
The URI of the file.
The name of the file.
Source attributed for a portion of the text.
Start of segment of the response that is attributed to this source. Index indicates the start of the segment, measured in bytes.
End of the attributed segment, exclusive.
PlaceCitation
A place citation annotation.
هیچ توضیحی ارائه نشده است.
Always set to "place_citation" .
The ID of the place, in `places/{place_id}` format.
Title of the place.
URI reference of the place.
review_snippets ReviewSnippet (optional)
Snippets of reviews that are used to generate answers about the features of a given place in Google Maps.
فیلدها
Title of the review.
A link that corresponds to the user review on Google Maps.
The ID of the review snippet.
Start of segment of the response that is attributed to this source. Index indicates the start of the segment, measured in bytes.
End of the attributed segment, exclusive.
ImageContent
An image content block.
هیچ توضیحی ارائه نشده است.
Always set to "image" .
The image content.
The URI of the image.
The mime type of the image.
Possible values:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (optional)
The resolution of the media.
Possible values:
-
low -
medium -
high -
ultra_high
ThoughtSignatureDelta
هیچ توضیحی ارائه نشده است.
Always set to "thought_signature" .
Signature to match the backend source to be part of the generation.
FunctionCallDelta
هیچ توضیحی ارائه نشده است.
Always set to "function_call" .
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
Required. A unique ID for this specific tool call.
A signature hash for backend validation.
CodeExecutionCallDelta
هیچ توضیحی ارائه نشده است.
Always set to "code_execution_call" .
arguments CodeExecutionCallArguments (required)
هیچ توضیحی ارائه نشده است.
فیلدها
Programming language of the `code`.
Possible values:
-
python
The code to be executed.
Required. A unique ID for this specific tool call.
A signature hash for backend validation.
UrlContextCallDelta
هیچ توضیحی ارائه نشده است.
Always set to "url_context_call" .
arguments UrlContextCallArguments (required)
هیچ توضیحی ارائه نشده است.
فیلدها
The URLs to fetch.
Required. A unique ID for this specific tool call.
A signature hash for backend validation.
GoogleSearchCallDelta
هیچ توضیحی ارائه نشده است.
Always set to "google_search_call" .
arguments GoogleSearchCallArguments (required)
هیچ توضیحی ارائه نشده است.
فیلدها
Web search queries for the following-up web search.
Required. A unique ID for this specific tool call.
A signature hash for backend validation.
McpServerToolCallDelta
هیچ توضیحی ارائه نشده است.
Always set to "mcp_server_tool_call" .
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
Required. A unique ID for this specific tool call.
A signature hash for backend validation.
FileSearchCallDelta
هیچ توضیحی ارائه نشده است.
Always set to "file_search_call" .
Required. A unique ID for this specific tool call.
A signature hash for backend validation.
GoogleMapsCallDelta
هیچ توضیحی ارائه نشده است.
Always set to "google_maps_call" .
arguments GoogleMapsCallArguments (optional)
The arguments to pass to the Google Maps tool.
فیلدها
The queries to be executed.
Required. A unique ID for this specific tool call.
A signature hash for backend validation.
FunctionResultDelta
هیچ توضیحی ارائه نشده است.
Always set to "function_result" .
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
Required. ID to match the ID from the function call block.
A signature hash for backend validation.
هیچ توضیحی ارائه نشده است.
CodeExecutionResultDelta
هیچ توضیحی ارائه نشده است.
Always set to "code_execution_result" .
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
Required. ID to match the ID from the function call block.
A signature hash for backend validation.
UrlContextResultDelta
هیچ توضیحی ارائه نشده است.
Always set to "url_context_result" .
result UrlContextResult (required)
هیچ توضیحی ارائه نشده است.
فیلدها
The URL that was fetched.
The status of the URL retrieval.
Possible values:
-
success -
error -
paywall -
unsafe
هیچ توضیحی ارائه نشده است.
Required. ID to match the ID from the function call block.
A signature hash for backend validation.
GoogleSearchResultDelta
هیچ توضیحی ارائه نشده است.
Always set to "google_search_result" .
result GoogleSearchResult (required)
هیچ توضیحی ارائه نشده است.
فیلدها
Web content snippet that can be embedded in a web page or an app webview.
هیچ توضیحی ارائه نشده است.
Required. ID to match the ID from the function call block.
A signature hash for backend validation.
McpServerToolResultDelta
هیچ توضیحی ارائه نشده است.
Always set to "mcp_server_tool_result" .
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
Required. ID to match the ID from the function call block.
A signature hash for backend validation.
هیچ توضیحی ارائه نشده است.
FileSearchResultDelta
هیچ توضیحی ارائه نشده است.
Always set to "file_search_result" .
result FileSearchResult (required)
هیچ توضیحی ارائه نشده است.
فیلدها
User provided metadata about the FileSearchResult.
Required. ID to match the ID from the function call block.
A signature hash for backend validation.
GoogleMapsResultDelta
هیچ توضیحی ارائه نشده است.
Always set to "google_maps_result" .
result GoogleMapsResult (optional)
The results of the Google Maps.
فیلدها
places Places (optional)
The places that were found.
فیلدها
The ID of the place, in `places/{place_id}` format.
Title of the place.
URI reference of the place.
review_snippets ReviewSnippet (optional)
Snippets of reviews that are used to generate answers about the features of a given place in Google Maps.
فیلدها
Title of the review.
A link that corresponds to the user review on Google Maps.
The ID of the review snippet.
Resource name of the Google Maps widget context token.
Required. ID to match the ID from the function call block.
A signature hash for backend validation.
TextAnnotationDelta
هیچ توضیحی ارائه نشده است.
Always set to "text_annotation" .
annotations Annotation (optional)
Citation information for model-generated content.
Possible Types
Polymorphic discriminator: type
UrlCitation
A URL citation annotation.
هیچ توضیحی ارائه نشده است.
Always set to "url_citation" .
آدرس اینترنتی (URL).
The title of the URL.
Start of segment of the response that is attributed to this source. Index indicates the start of the segment, measured in bytes.
End of the attributed segment, exclusive.
FileCitation
A file citation annotation.
هیچ توضیحی ارائه نشده است.
Always set to "file_citation" .
The URI of the file.
The name of the file.
Source attributed for a portion of the text.
Start of segment of the response that is attributed to this source. Index indicates the start of the segment, measured in bytes.
End of the attributed segment, exclusive.
PlaceCitation
A place citation annotation.
هیچ توضیحی ارائه نشده است.
Always set to "place_citation" .
The ID of the place, in `places/{place_id}` format.
Title of the place.
URI reference of the place.
review_snippets ReviewSnippet (optional)
Snippets of reviews that are used to generate answers about the features of a given place in Google Maps.
فیلدها
Title of the review.
A link that corresponds to the user review on Google Maps.
The ID of the review snippet.
Start of segment of the response that is attributed to this source. Index indicates the start of the segment, measured in bytes.
End of the attributed segment, exclusive.
The event_id token to be used to resume the interaction stream, from this event.
ContentStop
هیچ توضیحی ارائه نشده است.
Always set to "content.stop" .
هیچ توضیحی ارائه نشده است.
The event_id token to be used to resume the interaction stream, from this event.
ErrorEvent
هیچ توضیحی ارائه نشده است.
Always set to "error" .
error Error (optional)
هیچ توضیحی ارائه نشده است.
فیلدها
A URI that identifies the error type.
A human-readable error message.
The event_id token to be used to resume the interaction stream, from this event.
مثالها
Interaction Start
{ "event_type": "interaction.start", "interaction": { "id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM", "model": "gemini-3-flash-preview", "object": "interaction", "status": "in_progress" } }
Interaction Complete
{ "event_type": "interaction.complete", "interaction": { "created": "2025-12-09T18:45:40Z", "id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM", "model": "gemini-3-flash-preview", "object": "interaction", "role": "model", "status": "completed", "updated": "2025-12-09T18:45:40Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 11 } ], "total_cached_tokens": 0, "total_input_tokens": 11, "total_output_tokens": 364, "total_thought_tokens": 1120, "total_tokens": 1495, "total_tool_use_tokens": 0 } } }
Interaction Status Update
{ "event_type": "interaction.status_update", "interaction_id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM", "status": "in_progress" }
Content Start
{ "event_type": "content.start", "content": { "type": "text" }, "index": 1 }
Content Delta
{ "event_type": "content.delta", "delta": { "type": "text", "text": "Elara\u2019s life was a symphony of quiet moments. A librarian, she found solace in the hushed aisles, the scent of aged paper, and the predictable rhythm of her days. Her small apartment, meticulously ordered, reflected this internal calm, save" }, "index": 1 }
Content Stop
{ "event_type": "content.stop", "index": 1 }
Error Event
{ "event_type": "error", "error": { "message": "Failed to get completed interaction: Result not found.", "code": "not_found" } }