رابط برنامهنویسی کاربردی Gemini Interactions یک رابط برنامهنویسی کاربردی آزمایشی است که به توسعهدهندگان اجازه میدهد تا با استفاده از مدلهای Gemini، برنامههای هوش مصنوعی مولد بسازند. Gemini توانمندترین مدل ما است که از پایه برای چندوجهی بودن ساخته شده است. این مدل میتواند انواع مختلف اطلاعات از جمله زبان، تصاویر، صدا، ویدئو و کد را تعمیم داده و به طور یکپارچه درک کند، در میان آنها عمل کند و ترکیب کند. میتوانید از API Gemini برای موارد استفاده مانند استدلال در متن و تصاویر، تولید محتوا، عاملهای گفتگو، سیستمهای خلاصهسازی و طبقهبندی و موارد دیگر استفاده کنید.
ایجاد تعامل
یک تعامل جدید ایجاد میکند.
درخواست بدنه
بدنه درخواست شامل دادههایی با ساختار زیر است:
مدل ModelOption (اختیاری)
نام «مدل» مورد استفاده برای تولید تعامل.
در صورت عدم ارائه «عامل»، الزامی است.
مقادیر ممکن:
-
gemini-2.5-computer-use-preview-10-2025یک مدل قابلیت عاملمحور که برای تعامل مستقیم رابط کاربری طراحی شده است و به Gemini اجازه میدهد محیطهای دیجیتال را درک و پیمایش کند.
-
gemini-2.5-flashاولین مدل استدلال ترکیبی ما که از یک پنجره زمینه ۱ میلیون توکنی پشتیبانی میکند و دارای بودجههای تفکر است.
-
gemini-2.5-flash-imageمدل تولید تصویر بومی ما، که برای سرعت، انعطافپذیری و درک متنی بهینه شده است. ورودی و خروجی متن با همان قیمت ۲.۵ فلش ارائه میشود.
-
gemini-2.5-flash-liteکوچکترین و مقرون به صرفه ترین مدل ما، ساخته شده برای استفاده در مقیاس بزرگ.
-
gemini-2.5-flash-lite-preview-09-2025جدیدترین مدل مبتنی بر Gemini 2.5 Flash lite که برای صرفهجویی در هزینه، توان عملیاتی بالا و کیفیت بالا بهینه شده است.
-
gemini-2.5-flash-native-audio-preview-12-2025مدلهای صوتی بومی ما برای خروجیهای صوتی با کیفیت بالاتر با ریتم بهتر، طبیعی بودن صدا، پرگویی و حس و حال بهتر بهینه شدهاند.
-
gemini-2.5-flash-preview-09-2025آخرین مدل مبتنی بر مدل فلش ۲.۵. پیشنمایش فلش ۲.۵ برای پردازش در مقیاس بزرگ، وظایف با تأخیر کم و حجم بالا که نیاز به تفکر دارند و موارد استفاده عاملمحور بهترین گزینه است.
-
gemini-2.5-flash-preview-ttsمدل تبدیل متن به گفتار ۲.۵ فلش ما برای تولید گفتار قابل کنترل قدرتمند و با تأخیر کم بهینه شده است.
-
gemini-2.5-proمدل چندمنظوره پیشرفته ما، که در کدنویسی و کارهای استدلالی پیچیده عالی عمل میکند.
-
gemini-2.5-pro-preview-ttsمدل صوتی متن به گفتار نسخه ۲.۵ پرو ما برای تولید گفتار قدرتمند و با تأخیر کم بهینه شده است تا خروجیهای طبیعیتر و هدایت آسانتر دستورات را فراهم کند.
-
gemini-3-flash-previewهوشمندترین مدل ما که برای سرعت ساخته شده است، هوش مرزی را با جستجو و ردیابی برتر ترکیب میکند.
-
gemini-3-pro-image-previewمدل پیشرفته تولید و ویرایش تصویر.
-
gemini-3-pro-previewهوشمندترین مدل ما با استدلال SOTA و درک چندوجهی، و قابلیتهای قدرتمند کدگذاری عاملی و ارتعاشی.
-
gemini-3.1-pro-previewجدیدترین مدل استدلال SOTA ما با عمق و ظرافت بیسابقه و قابلیتهای قدرتمند درک و کدنویسی چندوجهی.
-
gemini-3.1-flash-image-previewهوش بصری حرفهای با کارایی فوقالعاده و قابلیتهای تولید محتوای مبتنی بر واقعیت.
-
gemini-3.1-flash-lite-previewمقرونبهصرفهترین مدل ما، بهینهشده برای وظایف عاملمحور با حجم بالا، ترجمه و پردازش دادههای ساده.
-
gemini-3.1-flash-tts-previewGemini 3.1 Flash TTS: تولید گفتار قدرتمند و با تأخیر کم. از خروجیهای طبیعی، دستورات قابل هدایت و برچسبهای صوتی رسا برای کنترل دقیق روایت لذت ببرید.
-
lyria-3-clip-previewمدل تولید موسیقی با تأخیر کم ما برای کلیپهای صوتی با کیفیت بالا و کنترل دقیق ریتمیک بهینه شده است.
-
lyria-3-pro-previewمدل پیشرفته و کامل ما برای تولید آهنگ با درک عمیق از آهنگسازی، بهینه شده برای کنترل ساختاری دقیق و انتقالهای پیچیده در سبکهای مختلف موسیقی.
گزینه عامل (اختیاری)
نام «عامل» مورد استفاده برای ایجاد تعامل.
در صورت عدم ارائه «مدل»، الزامی است.
مقادیر ممکن:
-
deep-research-pro-preview-12-2025نماینده تحقیقات عمیق جمینی
-
deep-research-preview-04-2026نماینده تحقیقات عمیق جمینی
-
deep-research-max-preview-04-2026مامور مکس تحقیقات عمیق جمینی
ورودیهای تعامل (مشترک برای مدل و عامل).
دستورالعمل سیستم برای تعامل.
فهرستی از اعلانهای ابزار که مدل ممکن است در طول تعامل فراخوانی کند.
تأکید میکند که پاسخ تولید شده یک شیء JSON است که با طرحواره JSON مشخص شده در این فیلد مطابقت دارد.
نوع MIME پاسخ. در صورت تنظیم response_format، این مورد الزامی است.
فقط ورودی. اینکه آیا تعامل پخش زنده خواهد شد یا خیر.
فقط ورودی. آیا پاسخ و درخواست برای بازیابی بعدی ذخیره شود یا خیر.
فقط ورودی. اینکه آیا تعامل مدل در پسزمینه اجرا شود یا خیر.
generation_config GenerationConfig (اختیاری)
پیکربندی مدل
پارامترهای پیکربندی برای تعامل مدل.
جایگزینی برای `agent_config`. فقط زمانی قابل اجرا است که `model` تنظیم شده باشد.
فیلدها
تصادفی بودن خروجی را کنترل میکند.
حداکثر احتمال تجمعی توکنها که باید هنگام نمونهگیری در نظر گرفته شود.
بذر مورد استفاده در رمزگشایی برای تکرارپذیری.
فهرستی از توالیهای کاراکتری که تعامل خروجی را متوقف میکنند.
سطح_فکریسطح_فکری ( اختیاری )
سطح توکنهای فکری که مدل باید تولید کند.
مقادیر ممکن:
-
minimal -
low -
medium -
high
خلاصههای تفکر ( اختیاری)
اینکه آیا خلاصه نظرات در پاسخ گنجانده شود یا خیر.
مقادیر ممکن:
-
auto -
none
حداکثر تعداد توکنهایی که باید در پاسخ گنجانده شوند.
speech_config SpeechConfig (اختیاری)
پیکربندی برای تعامل گفتاری.
فیلدها
صدای گوینده.
زبان گفتار.
نام گوینده، باید با نام گوینده داده شده در سوال مطابقت داشته باشد.
image_config پیکربندی تصویر (اختیاری)
پیکربندی برای تعامل تصویر.
فیلدها
هیچ توضیحی ارائه نشده است.
مقادیر ممکن:
-
1:1 -
2:3 -
3:2 -
3:4 -
4:3 -
4:5 -
5:4 -
9:16 -
16:9 -
21:9 -
1:8 -
8:1 -
1:4 -
4:1
هیچ توضیحی ارائه نشده است.
مقادیر ممکن:
-
1K -
2K -
4K -
512
پیکربندی انتخاب ابزار.
شیء agent_config (اختیاری)
پیکربندی عامل
پیکربندی برای عامل.
جایگزینی برای `generation_config`. فقط زمانی قابل اجرا است که `agent` تنظیم شده باشد.
انواع ممکن
تفکیککننده چندریختی: type
پیکربندی DynamicAgent
پیکربندی برای عاملهای پویا
هیچ توضیحی ارائه نشده است.
همیشه روی "dynamic" تنظیم شود.
پیکربندی DeepResearchAgent
پیکربندی برای عامل تحقیقات عمیق.
هیچ توضیحی ارائه نشده است.
همیشه روی "deep-research" تنظیم شود.
خلاصههای تفکر ( اختیاری)
اینکه آیا خلاصه نظرات در پاسخ گنجانده شود یا خیر.
مقادیر ممکن:
-
auto -
none
اینکه آیا باید از تصاویر در پاسخ استفاده کرد یا خیر.
مقادیر ممکن:
-
off -
auto
برنامهریزی انسان در حلقه را برای عامل تحقیقات عمیق فعال میکند. اگر روی درست تنظیم شود، عامل تحقیقات عمیق در پاسخ خود یک طرح تحقیقاتی ارائه میدهد. سپس عامل تنها در صورتی ادامه میدهد که کاربر طرح را در نوبت بعدی تأیید کند.
شناسهی تعامل قبلی، در صورت وجود.
روش_پاسخ ( اختیاری )
روشهای درخواستی برای پاسخ (متن، تصویر، صدا).
مقادیر ممکن:
-
text -
image -
audio -
video -
document
service_tier لایه سرویس (اختیاری)
لایه سرویس برای تعامل.
مقادیر ممکن:
-
flex -
standard -
priority
webhook_config پیکربندی وب هوک (اختیاری)
اختیاری. پیکربندی وبهوک برای دریافت اعلانها پس از اتمام تعامل.
فیلدها
اختیاری. در صورت تنظیم، این URLهای وبهوک به جای وبهوکهای ثبتشده، برای رویدادهای وبهوک استفاده خواهند شد.
اختیاری. فراداده کاربر که در هر انتشار رویداد به وبهوکها بازگردانده میشود.
پاسخ
یک منبع تعامل (Interaction) را برمیگرداند.
درخواست ساده
پاسخ نمونه
{ "created": "2025-11-26T12:25:15Z", "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "object": "interaction", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "Hello! I'm functioning perfectly and ready to assist you.\n\nHow are you doing today?" } ] } ], "status": "completed", "updated": "2025-11-26T12:25:15Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 7 } ], "total_cached_tokens": 0, "total_input_tokens": 7, "total_output_tokens": 20, "total_thought_tokens": 22, "total_tokens": 49, "total_tool_use_tokens": 0 } }
چند نوبتی
پاسخ نمونه
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "The capital of France is Paris." } ] } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 50 } ], "total_cached_tokens": 0, "total_input_tokens": 50, "total_output_tokens": 10, "total_thought_tokens": 0, "total_tokens": 60, "total_tool_use_tokens": 0 } }
ورودی تصویر
پاسخ نمونه
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "A white humanoid robot with glowing blue eyes stands holding a red skateboard." } ] } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 10 }, { "modality": "image", "tokens": 258 } ], "total_cached_tokens": 0, "total_input_tokens": 268, "total_output_tokens": 20, "total_thought_tokens": 0, "total_tokens": 288, "total_tool_use_tokens": 0 } }
فراخوانی تابع
پاسخ نمونه
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "requires_action", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "steps": [ { "type": "function_call", "id": "gth23981", "name": "get_weather", "arguments": { "location": "Boston, MA" } } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 100 } ], "total_cached_tokens": 0, "total_input_tokens": 100, "total_output_tokens": 25, "total_thought_tokens": 0, "total_tokens": 125, "total_tool_use_tokens": 50 } }
تحقیقات عمیق
پاسخ نمونه
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "agent": "deep-research-pro-preview-12-2025", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "Here is a comprehensive research report on the current state of cancer research..." } ] } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 20 } ], "total_cached_tokens": 0, "total_input_tokens": 20, "total_output_tokens": 1000, "total_thought_tokens": 500, "total_tokens": 1520, "total_tool_use_tokens": 0 } }
بازیابی یک تعامل
جزئیات کامل یک تعامل واحد را بر اساس `Interaction.id` آن بازیابی میکند.
پارامترهای مسیر/پرسوجو
شناسه منحصر به فرد تعاملی که قرار است بازیابی شود.
اگر روی درست تنظیم شود، محتوای تولید شده به صورت تدریجی پخش میشود.
پیشفرض: False
اختیاری. در صورت تنظیم، جریان تعامل را از بخش بعدی پس از رویداد مشخص شده توسط شناسه رویداد از سر میگیرد. فقط در صورتی قابل استفاده است که `stream` برابر با true باشد.
اگر روی true تنظیم شود، ورودی را در پاسخ لحاظ میکند.
پیشفرض: False
از کدام نسخه API استفاده کنیم.
پاسخ
یک منبع تعامل (Interaction) را برمیگرداند.
تعامل دریافت کنید
پاسخ نمونه
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:25:15Z", "updated": "2025-11-26T12:25:15Z", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "I'm doing great, thank you for asking! How can I help you today?" } ] } ] }
حذف یک تعامل
تعامل را بر اساس شناسه حذف میکند.
پارامترهای مسیر/پرسوجو
شناسه منحصر به فرد تعاملی که باید حذف شود.
از کدام نسخه API استفاده کنیم.
پاسخ
در صورت موفقیت، پاسخ خالی است.
حذف تعامل
لغو یک تعامل
یک تعامل را بر اساس شناسه لغو میکند. این فقط برای تعاملات پسزمینهای که هنوز در حال اجرا هستند، اعمال میشود.
پارامترهای مسیر/پرسوجو
شناسه منحصر به فرد تعاملی که باید لغو شود.
از کدام نسخه API استفاده کنیم.
پاسخ
یک منبع تعامل (Interaction) را برمیگرداند.
لغو تعامل
پاسخ نمونه
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "agent": "deep-research-pro-preview-12-2025", "status": "cancelled", "object": "interaction", "created": "2025-11-26T12:25:15Z", "updated": "2025-11-26T12:25:15Z" }
منابع
تعامل
منبع تعامل.
فیلدها
مدل ModelOption (اختیاری)
نام «مدل» مورد استفاده برای تولید تعامل.
مقادیر ممکن:
-
gemini-2.5-computer-use-preview-10-2025یک مدل قابلیت عاملمحور که برای تعامل مستقیم رابط کاربری طراحی شده است و به Gemini اجازه میدهد محیطهای دیجیتال را درک و پیمایش کند.
-
gemini-2.5-flashاولین مدل استدلال ترکیبی ما که از یک پنجره زمینه ۱ میلیون توکنی پشتیبانی میکند و دارای بودجههای تفکر است.
-
gemini-2.5-flash-imageمدل تولید تصویر بومی ما، که برای سرعت، انعطافپذیری و درک متنی بهینه شده است. ورودی و خروجی متن با همان قیمت ۲.۵ فلش ارائه میشود.
-
gemini-2.5-flash-liteکوچکترین و مقرون به صرفه ترین مدل ما، ساخته شده برای استفاده در مقیاس بزرگ.
-
gemini-2.5-flash-lite-preview-09-2025جدیدترین مدل مبتنی بر Gemini 2.5 Flash lite که برای صرفهجویی در هزینه، توان عملیاتی بالا و کیفیت بالا بهینه شده است.
-
gemini-2.5-flash-native-audio-preview-12-2025مدلهای صوتی بومی ما برای خروجیهای صوتی با کیفیت بالاتر با ریتم بهتر، طبیعی بودن صدا، پرگویی و حس و حال بهتر بهینه شدهاند.
-
gemini-2.5-flash-preview-09-2025آخرین مدل مبتنی بر مدل فلش ۲.۵. پیشنمایش فلش ۲.۵ برای پردازش در مقیاس بزرگ، وظایف با تأخیر کم و حجم بالا که نیاز به تفکر دارند و موارد استفاده عاملمحور بهترین گزینه است.
-
gemini-2.5-flash-preview-ttsمدل تبدیل متن به گفتار ۲.۵ فلش ما برای تولید گفتار قابل کنترل قدرتمند و با تأخیر کم بهینه شده است.
-
gemini-2.5-proمدل چندمنظوره پیشرفته ما، که در کدنویسی و کارهای استدلالی پیچیده عالی عمل میکند.
-
gemini-2.5-pro-preview-ttsمدل صوتی متن به گفتار نسخه ۲.۵ پرو ما برای تولید گفتار قدرتمند و با تأخیر کم بهینه شده است تا خروجیهای طبیعیتر و هدایت آسانتر دستورات را فراهم کند.
-
gemini-3-flash-previewهوشمندترین مدل ما که برای سرعت ساخته شده است، هوش مرزی را با جستجو و ردیابی برتر ترکیب میکند.
-
gemini-3-pro-image-previewمدل پیشرفته تولید و ویرایش تصویر.
-
gemini-3-pro-previewهوشمندترین مدل ما با استدلال SOTA و درک چندوجهی، و قابلیتهای قدرتمند کدگذاری عاملی و ارتعاشی.
-
gemini-3.1-pro-previewجدیدترین مدل استدلال SOTA ما با عمق و ظرافت بیسابقه و قابلیتهای قدرتمند درک و کدنویسی چندوجهی.
-
gemini-3.1-flash-image-previewهوش بصری حرفهای با کارایی فوقالعاده و قابلیتهای تولید محتوای مبتنی بر واقعیت.
-
gemini-3.1-flash-lite-previewمقرونبهصرفهترین مدل ما، بهینهشده برای وظایف عاملمحور با حجم بالا، ترجمه و پردازش دادههای ساده.
-
gemini-3.1-flash-tts-previewGemini 3.1 Flash TTS: تولید گفتار قدرتمند و با تأخیر کم. از خروجیهای طبیعی، دستورات قابل هدایت و برچسبهای صوتی رسا برای کنترل دقیق روایت لذت ببرید.
-
lyria-3-clip-previewمدل تولید موسیقی با تأخیر کم ما برای کلیپهای صوتی با کیفیت بالا و کنترل دقیق ریتمیک بهینه شده است.
-
lyria-3-pro-previewمدل پیشرفته و کامل ما برای تولید آهنگ با درک عمیق از آهنگسازی، بهینه شده برای کنترل ساختاری دقیق و انتقالهای پیچیده در سبکهای مختلف موسیقی.
گزینه عامل (اختیاری)
نام «عامل» مورد استفاده برای ایجاد تعامل.
مقادیر ممکن:
-
deep-research-pro-preview-12-2025نماینده تحقیقات عمیق جمینی
-
deep-research-preview-04-2026نماینده تحقیقات عمیق جمینی
-
deep-research-max-preview-04-2026مامور مکس تحقیقات عمیق جمینی
الزامی. فقط خروجی. یک شناسه منحصر به فرد برای تکمیل تعامل.
الزامی. فقط خروجی. وضعیت تعامل.
مقادیر ممکن:
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
الزامی. فقط خروجی. زمانی که پاسخ در قالب ISO 8601 (YYYY-MM-DDThh:mm:ssZ) ایجاد شده است.
الزامی. فقط خروجی. زمانی که پاسخ آخرین بار در قالب ISO 8601 (YYYY-MM-DDThh:mm:ssZ) بهروزرسانی شده است.
فقط خروجی. نقش تعامل.
دستورالعمل سیستم برای تعامل.
فهرستی از اعلانهای ابزار که مدل ممکن است در طول تعامل فراخوانی کند.
کاربرد (اختیاری )
فقط خروجی. آمار مربوط به میزان استفاده از توکن درخواست تعامل.
فیلدها
تعداد توکنها در اعلان (زمینه).
ورودی_توکنها_براساس_مودالیتی توکنهای مودالیتی (اختیاری)
تفکیک استفاده از توکن ورودی بر اساس روش.
فیلدها
روش پاسخ (اختیاری)
روش مرتبط با شمارش توکنها.
مقادیر ممکن:
-
text -
image -
audio -
video -
document
تعداد توکنها برای روش.
تعداد توکنها در بخش ذخیرهشدهی اعلان (محتوای ذخیرهشده).
cached_tokens_by_modality توکنهای مودالیتی (اختیاری)
تفکیک میزان استفاده از توکنهای ذخیرهشده بر اساس روش.
فیلدها
روش پاسخ (اختیاری)
روش مرتبط با شمارش توکنها.
مقادیر ممکن:
-
text -
image -
audio -
video -
document
تعداد توکنها برای روش.
تعداد کل توکنها در تمام پاسخهای تولید شده.
خروجی_توکنها_براساس_مودالیتی توکنهای مودالیتی (اختیاری)
تفکیک استفاده از توکن خروجی بر اساس روش.
فیلدها
روش پاسخ (اختیاری)
روش مرتبط با شمارش توکنها.
مقادیر ممکن:
-
text -
image -
audio -
video -
document
تعداد توکنها برای روش.
تعداد توکنهای موجود در اعلان(های) استفاده از ابزار.
ابزار_استفاده_از_توکنها_توسط_مودالیتی توکنهای مودالیتی (اختیاری)
تفکیک میزان استفاده از توکنهای ابزار بر اساس روش.
فیلدها
روش پاسخ (اختیاری)
روش مرتبط با شمارش توکنها.
مقادیر ممکن:
-
text -
image -
audio -
video -
document
تعداد توکنها برای روش.
تعداد توکنهای افکار برای مدلهای تفکر.
تعداد کل توکنها برای درخواست تعامل (درخواست + پاسخها + سایر توکنهای داخلی).
grounding_tool_count تعداد ابزار زمینی (اختیاری)
تعداد ابزار اتصال به زمین
فیلدها
نوع ابزار اتصال زمین مرتبط با شمارش.
مقادیر ممکن:
-
google_search -
google_maps -
retrieval
تعداد ابزار اتصال به زمین مهم است.
روش_پاسخ ( اختیاری )
روشهای درخواستی برای پاسخ (متن، تصویر، صدا).
مقادیر ممکن:
-
text -
image -
audio -
video -
document
نوع MIME پاسخ. در صورت تنظیم response_format، این مورد الزامی است.
شناسهی تعامل قبلی، در صورت وجود.
service_tier لایه سرویس (اختیاری)
لایه سرویس برای تعامل.
مقادیر ممکن:
-
flex -
standard -
priority
webhook_config پیکربندی وب هوک (اختیاری)
اختیاری. پیکربندی وبهوک برای دریافت اعلانها پس از اتمام تعامل.
فیلدها
اختیاری. در صورت تنظیم، این URLهای وبهوک به جای وبهوکهای ثبتشده، برای رویدادهای وبهوک استفاده خواهند شد.
اختیاری. فراداده کاربر که در هر انتشار رویداد به وبهوکها بازگردانده میشود.
مراحل ( اختیاری )
فقط خروجی. مراحلی که تعامل را تشکیل میدهند.
انواع ممکن
تفکیککننده چندریختی: type
مرحله ورودی کاربر
ورودی ارائه شده توسط کاربر.
هیچ توضیحی ارائه نشده است.
همیشه روی "user_input" تنظیم شود.
هیچ توضیحی ارائه نشده است.
مرحله خروجی مدل
خروجی تولید شده توسط مدل.
هیچ توضیحی ارائه نشده است.
همیشه روی "model_output" تنظیم شود.
هیچ توضیحی ارائه نشده است.
اندیشه گام
یک گام فکری.
هیچ توضیحی ارائه نشده است.
همیشه روی "thought" تنظیم شود.
یک هش امضا برای اعتبارسنجی backend.
خلاصه محتوای خلاصه اندیشه (اختیاری)
خلاصهای از اندیشه.
انواع ممکن
تفکیککننده چندریختی: type
محتوای متن
یک بلوک محتوای متنی.
هیچ توضیحی ارائه نشده است.
همیشه روی "text" تنظیم شود.
محتوای متن الزامی است.
حاشیهنویسیها ( اختیاری )
اطلاعات استناد برای محتوای تولید شده توسط مدل.
انواع ممکن
تفکیککننده چندریختی: type
استناد به آدرس اینترنتی
حاشیهنویسی استناد URL.
هیچ توضیحی ارائه نشده است.
همیشه روی "url_citation" تنظیم شود.
آدرس اینترنتی (URL).
عنوان URL.
شروع بخش پاسخی که به این منبع نسبت داده میشود. اندیس، شروع بخش را نشان میدهد که بر حسب بایت اندازهگیری میشود.
پایان بخش منسوب، منحصر به فرد.
استناد به فایل
حاشیهنویسی استناد به فایل.
هیچ توضیحی ارائه نشده است.
همیشه روی "file_citation" تنظیم شود.
آدرس اینترنتی (URI) فایل.
نام فایل.
منبع برای بخشی از متن ذکر شده است.
فرادادههای ارائه شده توسط کاربر در مورد متن بازیابی شده.
شماره صفحه سند ذکر شده، در صورت وجود.
شناسه رسانه در صورت استناد به تصویر، در صورت لزوم.
شروع بخش پاسخی که به این منبع نسبت داده میشود. اندیس، شروع بخش را نشان میدهد که بر حسب بایت اندازهگیری میشود.
پایان بخش منسوب، منحصر به فرد.
استناد به مکان
حاشیهنویسی برای استناد به مکان.
هیچ توضیحی ارائه نشده است.
همیشه روی "place_citation" تنظیم شود.
شناسه مکان، با فرمت `places/{place_id}`.
عنوان مکان.
مرجع URI آن مکان.
review_snippets قطعه کد نقد و بررسی (اختیاری)
گزیدههایی از نظرات که برای تولید پاسخ در مورد ویژگیهای یک مکان مشخص در نقشههای گوگل استفاده میشوند.
فیلدها
عنوان نقد.
لینکی که مربوط به نظر کاربر در نقشه گوگل باشد.
شناسهی قطعه نقد و بررسی.
شروع بخش پاسخی که به این منبع نسبت داده میشود. اندیس، شروع بخش را نشان میدهد که بر حسب بایت اندازهگیری میشود.
پایان بخش منسوب، منحصر به فرد.
محتوای تصویر
یک بلوک محتوای تصویر.
هیچ توضیحی ارائه نشده است.
همیشه روی "image" تنظیم شود.
محتوای تصویر.
آدرس اینترنتی (URI) تصویر.
نوع مایم تصویر.
مقادیر ممکن:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
وضوح تصویر MediaResolution (اختیاری)
قطعنامه رسانهها.
مقادیر ممکن:
-
low -
medium -
high -
ultra_high
مرحله فراخوانی تابع
مرحله فراخوانی ابزار تابع.
هیچ توضیحی ارائه نشده است.
همیشه روی "function_call" تنظیم شود.
الزامی. نام ابزاری که باید فراخوانی شود.
آرگومانهایی که باید به تابع ارسال شوند.
الزامی. یک شناسه منحصر به فرد برای این فراخوانی ابزار خاص.
یک هش امضا برای اعتبارسنجی backend.
مرحله فراخوانی کد (CodeExecutionCallStep)
مرحله فراخوانی اجرای کد.
هیچ توضیحی ارائه نشده است.
همیشه روی "code_execution_call" تنظیم شود.
آرگومانهای CodeExecutionCallStepArgumentها (الزامی)
الزامی. آرگومانهایی که برای اجرای کد ارسال میشوند.
فیلدها
زبان برنامهنویسی «کد».
مقادیر ممکن:
-
python
کدی که قرار است اجرا شود.
الزامی. یک شناسه منحصر به فرد برای این فراخوانی ابزار خاص.
یک هش امضا برای اعتبارسنجی backend.
مرحله فراخوانی متن (UrlContextCallStep)
مرحله فراخوانی زمینه URL.
هیچ توضیحی ارائه نشده است.
همیشه روی "url_context_call" تنظیم شود.
آرگومانهای UrlContextCallStepArgument (الزامی)
آرگومانهایی که باید به متن URL ارسال شوند.
فیلدها
آدرسهای اینترنتی (URL) برای دریافت.
الزامی. یک شناسه منحصر به فرد برای این فراخوانی ابزار خاص.
یک هش امضا برای اعتبارسنجی backend.
ابزار فراخوانی مکپسرور (McpServerToolCallStep)
مرحله فراخوانی ابزار MCPServer.
هیچ توضیحی ارائه نشده است.
همیشه روی "mcp_server_tool_call" تنظیم شود.
الزامی. نام ابزاری که فراخوانی شده است.
الزامی. نام سرور MCP مورد استفاده.
الزامی. شیء JSON آرگومانهای تابع.
الزامی. یک شناسه منحصر به فرد برای این فراخوانی ابزار خاص.
یک هش امضا برای اعتبارسنجی backend.
جستجوی گوگل
مرحله تماس جستجوی گوگل.
هیچ توضیحی ارائه نشده است.
همیشه روی "google_search_call" تنظیم شود.
آرگومانهای GoogleSearchCallStepArguments (الزامی)
الزامی. آرگومانهایی که باید به جستجوی گوگل ارسال شوند.
فیلدها
عبارتهای جستجوی وب برای جستجوی وب بعدی.
نوع اتصال زمینی جستجو فعال شده.
مقادیر ممکن:
-
web_search -
image_search -
enterprise_web_search
الزامی. یک شناسه منحصر به فرد برای این فراخوانی ابزار خاص.
یک هش امضا برای اعتبارسنجی backend.
جستجوی فایلفراخوانیمرحله
مرحله فراخوانی جستجوی فایل.
هیچ توضیحی ارائه نشده است.
همیشه روی "file_search_call" تنظیم شود.
الزامی. یک شناسه منحصر به فرد برای این فراخوانی ابزار خاص.
یک هش امضا برای اعتبارسنجی backend.
گوگل مپ کال استپ
مرحله تماس با نقشه گوگل
هیچ توضیحی ارائه نشده است.
همیشه روی "google_maps_call" تنظیم شود.
آرگومانهای GoogleMapsCallStepArguments (اختیاری)
آرگومانهایی که باید به ابزار نقشههای گوگل ارسال شوند.
فیلدها
کوئریهایی که باید اجرا شوند.
الزامی. یک شناسه منحصر به فرد برای این فراخوانی ابزار خاص.
یک هش امضا برای اعتبارسنجی backend.
تابعنتیجهمرحله
نتیجهی فراخوانی ابزار تابع.
هیچ توضیحی ارائه نشده است.
همیشه روی "function_result" تنظیم شود.
نام ابزاری که نامیده شد.
اینکه آیا فراخوانی ابزار منجر به خطا شده است یا خیر.
الزامی. شناسهای که با شناسهی بلوک فراخوانی تابع مطابقت داشته باشد.
یک هش امضا برای اعتبارسنجی backend.
نتیجه فراخوانی ابزار.
مرحله اجرای کد (CodeExecutionResultStep)
مرحله نتیجه اجرای کد.
هیچ توضیحی ارائه نشده است.
همیشه روی "code_execution_result" تنظیم شود.
خروجی اجرای کد. الزامی.
اینکه آیا اجرای کد منجر به خطا شده است یا خیر.
الزامی. شناسهای که با شناسهی بلوک فراخوانی تابع مطابقت داشته باشد.
یک هش امضا برای اعتبارسنجی backend.
مرحله نتیجه گیری UrlContext
مرحله نتیجه زمینه URL.
هیچ توضیحی ارائه نشده است.
همیشه روی "url_context_result" تنظیم شود.
نتیجه UrlContextResultItem (الزامی)
الزامی. نتایج زمینه URL.
فیلدها
آدرس اینترنتی (URL) که دریافت شده است.
وضعیت بازیابی URL.
مقادیر ممکن:
-
success -
error -
paywall -
unsafe
اینکه آیا زمینه URL منجر به خطا شده است یا خیر.
الزامی. شناسهای که با شناسهی بلوک فراخوانی تابع مطابقت داشته باشد.
یک هش امضا برای اعتبارسنجی backend.
مرحله نتایج جستجوی گوگل
مرحله نتیجه جستجوی گوگل
هیچ توضیحی ارائه نشده است.
همیشه روی "google_search_result" تنظیم شود.
نتیجه جستجوی گوگل (الزامی)
الزامی. نتایج جستجوی گوگل.
فیلدها
قطعه محتوای وب که میتواند در یک صفحه وب یا نمای وب یک برنامه تعبیه شود.
اینکه آیا جستجوی گوگل منجر به خطا شده است یا خیر.
الزامی. شناسهای که با شناسهی بلوک فراخوانی تابع مطابقت داشته باشد.
یک هش امضا برای اعتبارسنجی backend.
ابزار نتیجه McpServerTool
مرحله نتیجه ابزار MCPServer.
هیچ توضیحی ارائه نشده است.
همیشه روی "mcp_server_tool_result" تنظیم شود.
نام ابزاری که برای این فراخوانی ابزار خاص فراخوانی میشود.
نام سرور MCP مورد استفاده.
الزامی. شناسهای که با شناسهی بلوک فراخوانی تابع مطابقت داشته باشد.
یک هش امضا برای اعتبارسنجی backend.
خروجی حاصل از فراخوانی سرور MCP. میتواند متن ساده یا محتوای غنی باشد.
مرحلهی جستجوی فایل
مرحله نتیجه جستجوی فایل
هیچ توضیحی ارائه نشده است.
همیشه روی "file_search_result" تنظیم شود.
الزامی. شناسهای که با شناسهی بلوک فراخوانی تابع مطابقت داشته باشد.
یک هش امضا برای اعتبارسنجی backend.
مرحله نتیجه گوگل مپ
مرحله نتایج نقشه گوگل
هیچ توضیحی ارائه نشده است.
همیشه روی "google_maps_result" تنظیم شود.
نتیجه GoogleMapsResultItem (الزامی)
هیچ توضیحی ارائه نشده است.
فیلدها
مکانها GoogleMapsResultPlaces (اختیاری)
هیچ توضیحی ارائه نشده است.
فیلدها
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
review_snippets قطعه کد نقد و بررسی (اختیاری)
هیچ توضیحی ارائه نشده است.
فیلدها
عنوان نقد.
لینکی که مربوط به نظر کاربر در نقشه گوگل باشد.
شناسهی قطعه نقد و بررسی.
هیچ توضیحی ارائه نشده است.
الزامی. شناسهای که با شناسهی بلوک فراخوانی تابع مطابقت داشته باشد.
یک هش امضا برای اعتبارسنجی backend.
تأکید میکند که پاسخ تولید شده یک شیء JSON است که با طرحواره JSON مشخص شده در این فیلد مطابقت دارد.
شیء agent_config (اختیاری)
پارامترهای پیکربندی برای تعامل عامل.
انواع ممکن
تفکیککننده چندریختی: type
پیکربندی DynamicAgent
پیکربندی برای عاملهای پویا
هیچ توضیحی ارائه نشده است.
همیشه روی "dynamic" تنظیم شود.
پیکربندی DeepResearchAgent
پیکربندی برای عامل تحقیقات عمیق.
هیچ توضیحی ارائه نشده است.
همیشه روی "deep-research" تنظیم شود.
خلاصههای تفکر ( اختیاری)
اینکه آیا خلاصه نظرات در پاسخ گنجانده شود یا خیر.
مقادیر ممکن:
-
auto -
none
اینکه آیا باید از تصاویر در پاسخ استفاده کرد یا خیر.
مقادیر ممکن:
-
off -
auto
برنامهریزی انسان در حلقه را برای عامل تحقیقات عمیق فعال میکند. اگر روی درست تنظیم شود، عامل تحقیقات عمیق در پاسخ خود یک طرح تحقیقاتی ارائه میدهد. سپس عامل تنها در صورتی ادامه میدهد که کاربر طرح را در نوبت بعدی تأیید کند.
مثالها
مثال
{ "created": "2025-12-04T15:01:45Z", "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg", "model": "gemini-3-flash-preview", "object": "interaction", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "Hello! I'm doing well, functioning as expected. Thank you for asking! How are you doing today?" } ] } ], "status": "completed", "updated": "2025-12-04T15:01:45Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 7 } ], "total_cached_tokens": 0, "total_input_tokens": 7, "total_output_tokens": 23, "total_thought_tokens": 49, "total_tokens": 79, "total_tool_use_tokens": 0 } }
مدلهای داده
محتوا
محتوای پاسخ.
انواع ممکن
تفکیککننده چندریختی: type
محتوای متن
یک بلوک محتوای متنی.
هیچ توضیحی ارائه نشده است.
همیشه روی "text" تنظیم شود.
محتوای متن الزامی است.
حاشیهنویسیها ( اختیاری )
اطلاعات استناد برای محتوای تولید شده توسط مدل.
انواع ممکن
تفکیککننده چندریختی: type
استناد به آدرس اینترنتی
حاشیهنویسی استناد URL.
هیچ توضیحی ارائه نشده است.
همیشه روی "url_citation" تنظیم شود.
آدرس اینترنتی (URL).
عنوان URL.
شروع بخش پاسخی که به این منبع نسبت داده میشود. اندیس، شروع بخش را نشان میدهد که بر حسب بایت اندازهگیری میشود.
پایان بخش منسوب، منحصر به فرد.
استناد به فایل
حاشیهنویسی استناد به فایل.
هیچ توضیحی ارائه نشده است.
همیشه روی "file_citation" تنظیم شود.
آدرس اینترنتی (URI) فایل.
نام فایل.
منبع برای بخشی از متن ذکر شده است.
فرادادههای ارائه شده توسط کاربر در مورد متن بازیابی شده.
شماره صفحه سند ذکر شده، در صورت وجود.
شناسه رسانه در صورت استناد به تصویر، در صورت لزوم.
شروع بخش پاسخی که به این منبع نسبت داده میشود. اندیس، شروع بخش را نشان میدهد که بر حسب بایت اندازهگیری میشود.
پایان بخش منسوب، منحصر به فرد.
استناد به مکان
حاشیهنویسی برای استناد به مکان.
هیچ توضیحی ارائه نشده است.
همیشه روی "place_citation" تنظیم شود.
شناسه مکان، با فرمت `places/{place_id}`.
عنوان مکان.
مرجع URI آن مکان.
review_snippets قطعه کد نقد و بررسی (اختیاری)
گزیدههایی از نظرات که برای تولید پاسخ در مورد ویژگیهای یک مکان مشخص در نقشههای گوگل استفاده میشوند.
فیلدها
عنوان نقد.
لینکی که مربوط به نظر کاربر در نقشه گوگل باشد.
شناسهی قطعه نقد و بررسی.
شروع بخش پاسخی که به این منبع نسبت داده میشود. اندیس، شروع بخش را نشان میدهد که بر حسب بایت اندازهگیری میشود.
پایان بخش منسوب، منحصر به فرد.
محتوای تصویر
یک بلوک محتوای تصویر.
هیچ توضیحی ارائه نشده است.
همیشه روی "image" تنظیم شود.
محتوای تصویر.
آدرس اینترنتی (URI) تصویر.
نوع مایم تصویر.
مقادیر ممکن:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
وضوح تصویر MediaResolution (اختیاری)
قطعنامه رسانهها.
مقادیر ممکن:
-
low -
medium -
high -
ultra_high
محتوای صوتی
یک بلوک محتوای صوتی.
هیچ توضیحی ارائه نشده است.
همیشه روی "audio" تنظیم شود.
محتوای صوتی.
آدرس اینترنتی (URI) فایل صوتی.
نوع مایم صدا.
مقادیر ممکن:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
تعداد کانالهای صوتی
نرخ نمونهبرداری صدا.
محتوای سند
یک بلوک محتوای سند.
هیچ توضیحی ارائه نشده است.
همیشه روی "document" تنظیم شود.
محتوای سند.
آدرس اینترنتی (URI) سند.
نوع MIME سند.
مقادیر ممکن:
-
application/pdf
محتوای ویدیویی
یک بلوک محتوای ویدیویی.
هیچ توضیحی ارائه نشده است.
همیشه روی "video" تنظیم شود.
محتوای ویدیویی.
آدرس اینترنتی (URI) ویدیو.
نوع میم (شبیهسازی) ویدیو.
مقادیر ممکن:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
وضوح تصویر MediaResolution (اختیاری)
قطعنامه رسانهها.
مقادیر ممکن:
-
low -
medium -
high -
ultra_high
مثالها
متن
{ "type": "text", "text": "Hello, how are you?" }
تصویر
{ "type": "image", "data": "BASE64_ENCODED_IMAGE", "mime_type": "image/png" }
صوتی
{ "type": "audio", "data": "BASE64_ENCODED_AUDIO", "mime_type": "audio/wav" }
سند
{ "type": "document", "data": "BASE64_ENCODED_DOCUMENT", "mime_type": "application/pdf" }
ویدئو
{ "type": "video", "uri": "https://www.youtube.com/watch?v=9hE5-98ZeCg" }
ابزار
ابزاری که میتواند توسط مدل مورد استفاده قرار گیرد.
انواع ممکن
تفکیککننده چندریختی: type
عملکرد
ابزاری که میتواند توسط مدل مورد استفاده قرار گیرد.
هیچ توضیحی ارائه نشده است.
همیشه روی "function" تنظیم شود.
نام تابع.
شرحی از تابع.
طرحواره JSON برای پارامترهای تابع.
CodeExecution
A tool that can be used by the model to execute code.
هیچ توضیحی ارائه نشده است.
Always set to "code_execution" .
UrlContext
A tool that can be used by the model to fetch URL context.
هیچ توضیحی ارائه نشده است.
Always set to "url_context" .
ComputerUse
A tool that can be used by the model to interact with the computer.
هیچ توضیحی ارائه نشده است.
Always set to "computer_use" .
The environment being operated.
Possible values:
-
browser
The list of predefined functions that are excluded from the model call.
McpServer
A MCPServer is a server that can be called by the model to perform actions.
هیچ توضیحی ارائه نشده است.
Always set to "mcp_server" .
The name of the MCPServer.
The full URL for the MCPServer endpoint. Example: "https://api.example.com/mcp"
Optional: Fields for authentication headers, timeouts, etc., if needed.
allowed_tools AllowedTools (optional)
The allowed tools.
فیلدها
mode ToolChoiceType (optional)
The mode of the tool choice.
Possible values:
-
auto -
any -
none -
validated
The names of the allowed tools.
GoogleSearch
A tool that can be used by the model to search Google.
هیچ توضیحی ارائه نشده است.
Always set to "google_search" .
The types of search grounding to enable.
Possible values:
-
web_search -
image_search -
enterprise_web_search
FileSearch
A tool that can be used by the model to search files.
هیچ توضیحی ارائه نشده است.
Always set to "file_search" .
The file search store names to search.
The number of semantic retrieval chunks to retrieve.
Metadata filter to apply to the semantic retrieval documents and chunks.
GoogleMaps
A tool that can be used by the model to call Google Maps.
هیچ توضیحی ارائه نشده است.
Always set to "google_maps" .
Whether to return a widget context token in the tool call result of the response.
The latitude of the user's location.
The longitude of the user's location.
Retrieval
A tool that can be used by the model to retrieve files.
هیچ توضیحی ارائه نشده است.
Always set to "retrieval" .
The types of file retrieval to enable.
Possible values:
-
vertex_ai_search
vertex_ai_search_config VertexAISearchConfig (optional)
Used to specify configuration for VertexAISearch.
فیلدها
Optional. Used to specify Vertex AI Search engine.
Optional. Used to specify Vertex AI Search datastores.
مثالها
عملکرد
CodeExecution
UrlContext
ComputerUse
McpServer
GoogleSearch
FileSearch
GoogleMaps
Retrieval
No examples available for this type.
InteractionSseEvent
Possible Types
Polymorphic discriminator: event_type
InteractionCreatedEvent
هیچ توضیحی ارائه نشده است.
Always set to "interaction.created" .
هیچ توضیحی ارائه نشده است.
The event_id token to be used to resume the interaction stream, from this event.
InteractionCompletedEvent
هیچ توضیحی ارائه نشده است.
Always set to "interaction.completed" .
Required. The completed interaction with empty outputs to reduce the payload size. Use the preceding ContentDelta events for the actual output.
The event_id token to be used to resume the interaction stream, from this event.
InteractionStatusUpdate
هیچ توضیحی ارائه نشده است.
Always set to "interaction.status_update" .
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
Possible values:
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
The event_id token to be used to resume the interaction stream, from this event.
ErrorEvent
هیچ توضیحی ارائه نشده است.
Always set to "error" .
error Error (optional)
هیچ توضیحی ارائه نشده است.
فیلدها
A URI that identifies the error type.
A human-readable error message.
The event_id token to be used to resume the interaction stream, from this event.
StepStart
هیچ توضیحی ارائه نشده است.
Always set to "step.start" .
هیچ توضیحی ارائه نشده است.
step Step (required)
هیچ توضیحی ارائه نشده است.
Possible Types
Polymorphic discriminator: type
UserInputStep
Input provided by the user.
هیچ توضیحی ارائه نشده است.
Always set to "user_input" .
هیچ توضیحی ارائه نشده است.
ModelOutputStep
Output generated by the model.
هیچ توضیحی ارائه نشده است.
Always set to "model_output" .
هیچ توضیحی ارائه نشده است.
ThoughtStep
A thought step.
هیچ توضیحی ارائه نشده است.
Always set to "thought" .
A signature hash for backend validation.
summary ThoughtSummaryContent (optional)
A summary of the thought.
Possible Types
Polymorphic discriminator: type
TextContent
A text content block.
هیچ توضیحی ارائه نشده است.
Always set to "text" .
Required. The text content.
annotations Annotation (optional)
Citation information for model-generated content.
Possible Types
Polymorphic discriminator: type
UrlCitation
A URL citation annotation.
هیچ توضیحی ارائه نشده است.
Always set to "url_citation" .
The URL.
The title of the URL.
Start of segment of the response that is attributed to this source. Index indicates the start of the segment, measured in bytes.
End of the attributed segment, exclusive.
FileCitation
A file citation annotation.
هیچ توضیحی ارائه نشده است.
Always set to "file_citation" .
The URI of the file.
The name of the file.
Source attributed for a portion of the text.
User provided metadata about the retrieved context.
Page number of the cited document, if applicable.
Media ID in-case of image citations, if applicable.
Start of segment of the response that is attributed to this source. Index indicates the start of the segment, measured in bytes.
End of the attributed segment, exclusive.
PlaceCitation
A place citation annotation.
هیچ توضیحی ارائه نشده است.
Always set to "place_citation" .
The ID of the place, in `places/{place_id}` format.
Title of the place.
URI reference of the place.
review_snippets ReviewSnippet (optional)
Snippets of reviews that are used to generate answers about the features of a given place in Google Maps.
فیلدها
Title of the review.
A link that corresponds to the user review on Google Maps.
The ID of the review snippet.
Start of segment of the response that is attributed to this source. Index indicates the start of the segment, measured in bytes.
End of the attributed segment, exclusive.
ImageContent
An image content block.
هیچ توضیحی ارائه نشده است.
Always set to "image" .
The image content.
The URI of the image.
The mime type of the image.
Possible values:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (optional)
The resolution of the media.
Possible values:
-
low -
medium -
high -
ultra_high
FunctionCallStep
A function tool call step.
هیچ توضیحی ارائه نشده است.
Always set to "function_call" .
Required. The name of the tool to call.
Required. The arguments to pass to the function.
Required. A unique ID for this specific tool call.
A signature hash for backend validation.
CodeExecutionCallStep
Code execution call step.
هیچ توضیحی ارائه نشده است.
Always set to "code_execution_call" .
arguments CodeExecutionCallStepArguments (required)
Required. The arguments to pass to the code execution.
فیلدها
Programming language of the `code`.
Possible values:
-
python
The code to be executed.
Required. A unique ID for this specific tool call.
A signature hash for backend validation.
UrlContextCallStep
URL context call step.
هیچ توضیحی ارائه نشده است.
Always set to "url_context_call" .
arguments UrlContextCallStepArguments (required)
Required. The arguments to pass to the URL context.
فیلدها
The URLs to fetch.
Required. A unique ID for this specific tool call.
A signature hash for backend validation.
McpServerToolCallStep
MCPServer tool call step.
هیچ توضیحی ارائه نشده است.
Always set to "mcp_server_tool_call" .
Required. The name of the tool which was called.
Required. The name of the used MCP server.
Required. The JSON object of arguments for the function.
Required. A unique ID for this specific tool call.
A signature hash for backend validation.
GoogleSearchCallStep
Google Search call step.
هیچ توضیحی ارائه نشده است.
Always set to "google_search_call" .
arguments GoogleSearchCallStepArguments (required)
Required. The arguments to pass to Google Search.
فیلدها
Web search queries for the following-up web search.
The type of search grounding enabled.
Possible values:
-
web_search -
image_search -
enterprise_web_search
Required. A unique ID for this specific tool call.
A signature hash for backend validation.
FileSearchCallStep
File Search call step.
هیچ توضیحی ارائه نشده است.
Always set to "file_search_call" .
Required. A unique ID for this specific tool call.
A signature hash for backend validation.
GoogleMapsCallStep
Google Maps call step.
هیچ توضیحی ارائه نشده است.
Always set to "google_maps_call" .
arguments GoogleMapsCallStepArguments (optional)
The arguments to pass to the Google Maps tool.
فیلدها
The queries to be executed.
Required. A unique ID for this specific tool call.
A signature hash for backend validation.
FunctionResultStep
Result of a function tool call.
هیچ توضیحی ارائه نشده است.
Always set to "function_result" .
The name of the tool that was called.
Whether the tool call resulted in an error.
Required. ID to match the ID from the function call block.
A signature hash for backend validation.
The result of the tool call.
CodeExecutionResultStep
Code execution result step.
هیچ توضیحی ارائه نشده است.
Always set to "code_execution_result" .
Required. The output of the code execution.
Whether the code execution resulted in an error.
Required. ID to match the ID from the function call block.
A signature hash for backend validation.
UrlContextResultStep
URL context result step.
هیچ توضیحی ارائه نشده است.
Always set to "url_context_result" .
result UrlContextResultItem (required)
Required. The results of the URL context.
فیلدها
The URL that was fetched.
The status of the URL retrieval.
Possible values:
-
success -
error -
paywall -
unsafe
Whether the URL context resulted in an error.
Required. ID to match the ID from the function call block.
A signature hash for backend validation.
GoogleSearchResultStep
Google Search result step.
هیچ توضیحی ارائه نشده است.
Always set to "google_search_result" .
result GoogleSearchResultItem (required)
Required. The results of the Google Search.
فیلدها
Web content snippet that can be embedded in a web page or an app webview.
Whether the Google Search resulted in an error.
Required. ID to match the ID from the function call block.
A signature hash for backend validation.
McpServerToolResultStep
MCPServer tool result step.
هیچ توضیحی ارائه نشده است.
Always set to "mcp_server_tool_result" .
Name of the tool which is called for this specific tool call.
The name of the used MCP server.
Required. ID to match the ID from the function call block.
A signature hash for backend validation.
The output from the MCP server call. Can be simple text or rich content.
FileSearchResultStep
File Search result step.
هیچ توضیحی ارائه نشده است.
Always set to "file_search_result" .
Required. ID to match the ID from the function call block.
A signature hash for backend validation.
GoogleMapsResultStep
Google Maps result step.
هیچ توضیحی ارائه نشده است.
Always set to "google_maps_result" .
result GoogleMapsResultItem (required)
هیچ توضیحی ارائه نشده است.
فیلدها
places GoogleMapsResultPlaces (optional)
هیچ توضیحی ارائه نشده است.
فیلدها
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
review_snippets ReviewSnippet (optional)
هیچ توضیحی ارائه نشده است.
فیلدها
Title of the review.
A link that corresponds to the user review on Google Maps.
The ID of the review snippet.
هیچ توضیحی ارائه نشده است.
Required. ID to match the ID from the function call block.
A signature hash for backend validation.
The event_id token to be used to resume the interaction stream, from this event.
StepDelta
هیچ توضیحی ارائه نشده است.
Always set to "step.delta" .
هیچ توضیحی ارائه نشده است.
delta StepDeltaData (required)
هیچ توضیحی ارائه نشده است.
Possible Types
Polymorphic discriminator: type
TextDelta
هیچ توضیحی ارائه نشده است.
Always set to "text" .
هیچ توضیحی ارائه نشده است.
ImageDelta
هیچ توضیحی ارائه نشده است.
Always set to "image" .
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
Possible values:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (optional)
The resolution of the media.
Possible values:
-
low -
medium -
high -
ultra_high
AudioDelta
هیچ توضیحی ارائه نشده است.
Always set to "audio" .
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
Possible values:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
Deprecated. Use sample_rate instead. The value is ignored.
The sample rate of the audio.
The number of audio channels.
DocumentDelta
هیچ توضیحی ارائه نشده است.
Always set to "document" .
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
Possible values:
-
application/pdf
VideoDelta
هیچ توضیحی ارائه نشده است.
Always set to "video" .
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
هیچ توضیحی ارائه نشده است.
Possible values:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
resolution MediaResolution (optional)
The resolution of the media.
Possible values:
-
low -
medium -
high -
ultra_high
ThoughtSummaryDelta
هیچ توضیحی ارائه نشده است.
Always set to "thought_summary" .
content ThoughtSummaryContent (optional)
A new summary item to be added to the thought.
Possible Types
Polymorphic discriminator: type
TextContent
A text content block.
هیچ توضیحی ارائه نشده است.
Always set to "text" .
Required. The text content.
annotations Annotation (optional)
Citation information for model-generated content.
Possible Types
Polymorphic discriminator: type
UrlCitation
A URL citation annotation.
هیچ توضیحی ارائه نشده است.
Always set to "url_citation" .
The URL.
The title of the URL.
Start of segment of the response that is attributed to this source. Index indicates the start of the segment, measured in bytes.
End of the attributed segment, exclusive.
FileCitation
A file citation annotation.
هیچ توضیحی ارائه نشده است.
Always set to "file_citation" .
The URI of the file.
The name of the file.
Source attributed for a portion of the text.
User provided metadata about the retrieved context.
Page number of the cited document, if applicable.
Media ID in-case of image citations, if applicable.
Start of segment of the response that is attributed to this source. Index indicates the start of the segment, measured in bytes.
End of the attributed segment, exclusive.
PlaceCitation
A place citation annotation.
هیچ توضیحی ارائه نشده است.
Always set to "place_citation" .
The ID of the place, in `places/{place_id}` format.
Title of the place.
URI reference of the place.
review_snippets ReviewSnippet (optional)
Snippets of reviews that are used to generate answers about the features of a given place in Google Maps.
فیلدها
Title of the review.
A link that corresponds to the user review on Google Maps.
The ID of the review snippet.
Start of segment of the response that is attributed to this source. Index indicates the start of the segment, measured in bytes.
End of the attributed segment, exclusive.
ImageContent
An image content block.
هیچ توضیحی ارائه نشده است.
Always set to "image" .
The image content.
The URI of the image.
The mime type of the image.
Possible values:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (optional)
The resolution of the media.
Possible values:
-
low -
medium -
high -
ultra_high
ThoughtSignatureDelta
هیچ توضیحی ارائه نشده است.
Always set to "thought_signature" .
Signature to match the backend source to be part of the generation.
TextAnnotationDelta
هیچ توضیحی ارائه نشده است.
Always set to "text_annotation_delta" .
annotations Annotation (optional)
Citation information for model-generated content.
Possible Types
Polymorphic discriminator: type
UrlCitation
A URL citation annotation.
هیچ توضیحی ارائه نشده است.
Always set to "url_citation" .
The URL.
The title of the URL.
Start of segment of the response that is attributed to this source. Index indicates the start of the segment, measured in bytes.
End of the attributed segment, exclusive.
FileCitation
A file citation annotation.
هیچ توضیحی ارائه نشده است.
Always set to "file_citation" .
The URI of the file.
The name of the file.
Source attributed for a portion of the text.
User provided metadata about the retrieved context.
Page number of the cited document, if applicable.
Media ID in-case of image citations, if applicable.
Start of segment of the response that is attributed to this source. Index indicates the start of the segment, measured in bytes.
End of the attributed segment, exclusive.
PlaceCitation
A place citation annotation.
هیچ توضیحی ارائه نشده است.
Always set to "place_citation" .
The ID of the place, in `places/{place_id}` format.
Title of the place.
URI reference of the place.
review_snippets ReviewSnippet (optional)
Snippets of reviews that are used to generate answers about the features of a given place in Google Maps.
فیلدها
Title of the review.
A link that corresponds to the user review on Google Maps.
The ID of the review snippet.
Start of segment of the response that is attributed to this source. Index indicates the start of the segment, measured in bytes.
End of the attributed segment, exclusive.
ArgumentsDelta
هیچ توضیحی ارائه نشده است.
Always set to "arguments_delta" .
هیچ توضیحی ارائه نشده است.
The event_id token to be used to resume the interaction stream, from this event.
StepStop
هیچ توضیحی ارائه نشده است.
Always set to "step.stop" .
هیچ توضیحی ارائه نشده است.
The event_id token to be used to resume the interaction stream, from this event.
مثالها
Interaction Created
{ "event_type": "interaction.created", "interaction": { "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg", "model": "gemini-3-flash-preview", "status": "in_progress", "created": "2025-12-04T15:01:45Z", "updated": "2025-12-04T15:01:45Z" }, "event_id": "evt_123" }
Interaction Completed
{ "event_type": "interaction.completed", "interaction": { "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg", "model": "gemini-3-flash-preview", "status": "completed", "created": "2025-12-04T15:01:45Z", "updated": "2025-12-04T15:01:45Z" }, "event_id": "evt_123" }
Interaction Status Update
{ "event_type": "interaction.status_update", "interaction_id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM", "status": "in_progress" }
Error Event
{ "event_type": "error", "error": { "message": "Failed to get completed interaction: Result not found.", "code": "not_found" } }
Step Start
{ "event_type": "step.start", "index": 0, "step": { "type": "model_output" } }
Step Delta
{ "event_type": "step.delta", "index": 0, "delta": { "type": "text", "text": "Hello" } }
Step Stop
{ "event_type": "step.stop", "index": 0 }