Gemini Interactions API, एक एक्सपेरिमेंटल एपीआई है. इसकी मदद से डेवलपर, Gemini के मॉडल का इस्तेमाल करके जनरेटिव एआई ऐप्लिकेशन बना सकते हैं. Gemini हमारा सबसे बेहतरीन मॉडल है. इसे शुरुआत से ही मल्टीमॉडल बनाने के लिए काम किया गया है. यह अलग-अलग तरह की जानकारी को आसानी से समझ सकता है और उसे एक साथ इस्तेमाल कर सकता है. जैसे, भाषा, इमेज, ऑडियो, वीडियो, और कोड. Gemini API का इस्तेमाल, कई कामों के लिए किया जा सकता है. जैसे, टेक्स्ट और इमेज के आधार पर तर्क देना, कॉन्टेंट जनरेट करना, बातचीत करने वाले एजेंट बनाना, खास जानकारी देने और कॉन्टेंट को अलग-अलग कैटगरी में बांटने वाले सिस्टम बनाना.
इंटरैक्शन बनाना
यह कुकी, नई बातचीत बनाती है.
अनुरोध का मुख्य भाग
अनुरोध के मुख्य हिस्से में, इस स्ट्रक्चर का डेटा शामिल होता है:
model ModelOption (ज़रूरी नहीं)
इंटरैक्शन जनरेट करने के लिए इस्तेमाल किए गए `Model` का नाम.
अगर `agent` नहीं दिया गया है, तो यह प्रॉपर्टी ज़रूरी है.
ये वैल्यू हो सकती हैं:
-
gemini-2.5-computer-use-preview-10-2025यह एजेंटिक क्षमता वाला मॉडल है. इसे सीधे तौर पर इंटरफ़ेस से इंटरैक्ट करने के लिए डिज़ाइन किया गया है. इससे Gemini को डिजिटल एनवायरमेंट को समझने और उनमें नेविगेट करने में मदद मिलती है.
-
gemini-2.5-flashयह हमारा पहला हाइब्रिड रीज़निंग मॉडल है. इसमें 10 लाख टोकन वाली कॉन्टेक्स्ट विंडो और थिंकिंग बजट की सुविधा है.
-
gemini-2.5-flash-imageइमेज जनरेट करने वाला हमारा मॉडल, तेज़ी से काम करने के लिए ऑप्टिमाइज़ किया गया है. यह मॉडल, कॉन्टेंट के हिसाब से इमेज जनरेट करने के साथ-साथ, अलग-अलग तरह की इमेज जनरेट करने में भी मदद करता है. टेक्स्ट इनपुट और आउटपुट की कीमत, 2.5 फ़्लैश के बराबर होती है.
-
gemini-2.5-flash-liteयह हमारा सबसे छोटा और किफ़ायती मॉडल है. इसे बड़े पैमाने पर इस्तेमाल करने के लिए बनाया गया है.
-
gemini-2.5-flash-lite-preview-09-2025यह Gemini 2.5 Flash lite पर आधारित नया मॉडल है. इसे कम लागत, ज़्यादा थ्रूपुट, और बेहतर क्वालिटी के लिए ऑप्टिमाइज़ किया गया है.
-
gemini-2.5-flash-native-audio-preview-12-2025हमारे नेटिव ऑडियो मॉडल, बेहतर पेसिंग, आवाज़ की नैचुरैलिटी, शब्दों की संख्या, और मूड के साथ-साथ बेहतर क्वालिटी वाले ऑडियो आउटपुट के लिए ऑप्टिमाइज़ किए गए हैं.
-
gemini-2.5-flash-preview-09-2025यह 2.5 Flash मॉडल पर आधारित सबसे नया मॉडल है. 2.5 Flash Preview, बड़े पैमाने पर प्रोसेसिंग करने, कम समय में जवाब पाने, और ज़्यादा वॉल्यूम वाले ऐसे कामों के लिए सबसे सही है जिनमें सोच-विचार करने की ज़रूरत होती है. साथ ही, यह एजेंट के तौर पर काम करने वाले एआई के इस्तेमाल के लिए भी सबसे सही है.
-
gemini-2.5-flash-preview-ttsलिखे गए शब्दों को बोली में बदलने वाला हमारा 2.5 Flash मॉडल, कम समय में बोली जनरेट करने के लिए ऑप्टिमाइज़ किया गया है.
-
gemini-2.5-proयह हमारा बेहतरीन और कई कामों को पूरा करने वाला मॉडल है. यह कोडिंग और मुश्किल सवालों के जवाब देने में माहिर है.
-
gemini-2.5-pro-preview-ttsलिखाई को बोली में बदलने वाला हमारा 2.5 Pro ऑडियो मॉडल, कम समय में तेज़ी से बोली जनरेट करने के लिए ऑप्टिमाइज़ किया गया है. इससे ज़्यादा नैचुरल आउटपुट मिलते हैं और प्रॉम्प्ट को आसानी से कंट्रोल किया जा सकता है.
-
gemini-3-flash-previewयह हमारा सबसे स्मार्ट मॉडल है. इसे तेज़ी से काम करने के लिए बनाया गया है. इसमें फ़्रंटियर इंटेलिजेंस के साथ-साथ, बेहतर खोज और ग्राउंडिंग की सुविधा भी मिलती है.
-
gemini-3-pro-image-previewइमेज जनरेट करने और उनमें बदलाव करने वाला बेहतरीन मॉडल.
-
gemini-3-pro-previewयह हमारा सबसे इंटेलिजेंट मॉडल है. इसमें एसओटीए रीज़निंग और मल्टीमॉडल को समझने की क्षमता है. साथ ही, इसमें एजेंटिक और वाइब कोडिंग की दमदार क्षमताएँ हैं.
-
gemini-3.1-pro-previewयह हमारा सबसे नया और बेहतरीन रीज़निंग मॉडल है. इसमें पहले से ज़्यादा गहराई और बारीकी से जानकारी मिलती है. साथ ही, यह टेक्स्ट, इमेज वगैरह को प्रोसेस करके गहराई से समझ सकता है और कोडिंग से जुड़े काम भी कर सकता है.
-
gemini-3.1-flash-image-previewतेज़ी से काम करने की क्षमता और असलियत के हिसाब से इमेज जनरेट करने की सुविधाओं के साथ, प्रो-लेवल की विज़ुअल इंटेलिजेंस.
-
gemini-3.1-flash-lite-previewयह हमारा सबसे किफ़ायती मॉडल है. इसे एजेंटिक टास्क, अनुवाद, और डेटा प्रोसेसिंग जैसे कामों के लिए ऑप्टिमाइज़ किया गया है.
-
gemini-3.1-flash-tts-previewGemini 3.1 Flash टीटीएस: यह मॉडल, कम समय में बेहतर क्वालिटी वाली स्पीच जनरेट करता है. इसमें आपको नैचुरल आउटपुट, प्रॉम्प्ट को कंट्रोल करने की सुविधा, और सटीक नैरेशन कंट्रोल के लिए नए एक्सप्रेसिव ऑडियो टैग मिलते हैं.
-
lyria-3-clip-previewयह कम समय में संगीत जनरेट करने वाला मॉडल है. इसे हाई-फ़िडेलिटी ऑडियो क्लिप और सटीक लय कंट्रोल के लिए ऑप्टिमाइज़ किया गया है.
-
lyria-3-pro-previewयह पूरा गाना जनरेट करने वाला हमारा ऐडवांस मॉडल है. इसमें संगीत की बारीकियों को समझने की क्षमता है. इसे अलग-अलग म्यूज़िकल स्टाइल में सटीक स्ट्रक्चरल कंट्रोल और मुश्किल ट्रांज़िशन के लिए ऑप्टिमाइज़ किया गया है.
agent AgentOption (ज़रूरी नहीं)
इंटरैक्शन जनरेट करने के लिए इस्तेमाल किए गए `Agent` का नाम.
अगर `model` एट्रिब्यूट की वैल्यू नहीं दी गई है, तो यह एट्रिब्यूट ज़रूरी है.
ये वैल्यू हो सकती हैं:
-
deep-research-pro-preview-12-2025Gemini Deep Research एजेंट
-
deep-research-preview-04-2026Gemini Deep Research एजेंट
-
deep-research-max-preview-04-2026Gemini Deep Research Max Agent
इंटरैक्शन के लिए इनपुट (मॉडल और एजेंट, दोनों के लिए एक जैसे).
इंटरैक्शन के लिए सिस्टम को दिया गया निर्देश.
टूल के उन एलान की सूची जिन्हें मॉडल, इंटरैक्शन के दौरान कॉल कर सकता है.
इससे यह पक्का किया जाता है कि जनरेट किया गया रिस्पॉन्स, एक JSON ऑब्जेक्ट हो. साथ ही, यह इस फ़ील्ड में दिए गए JSON स्कीमा के मुताबिक हो.
जवाब का MIME टाइप. अगर response_format सेट किया गया है, तो यह ज़रूरी है.
सिर्फ़ इनपुट के लिए. इंटरैक्शन को स्ट्रीम किया जाएगा या नहीं.
सिर्फ़ इनपुट के लिए. जवाब और अनुरोध को बाद में वापस पाने के लिए सेव करना है या नहीं.
सिर्फ़ इनपुट के लिए. मॉडल इंटरैक्शन को बैकग्राउंड में चलाना है या नहीं.
generation_config GenerationConfig (optional)
मॉडल कॉन्फ़िगरेशन
मॉडल के साथ इंटरैक्ट करने के लिए कॉन्फ़िगरेशन पैरामीटर.
`agent_config` का विकल्प. यह सिर्फ़ तब लागू होता है, जब `model` सेट किया गया हो.
फ़ील्ड
इससे आउटपुट में रैंडमनेस को कंट्रोल किया जाता है.
सैंपलिंग करते समय, टोकन की ज़्यादा से ज़्यादा संचयी संभावना पर विचार किया जाता है.
डिकोडिंग में इस्तेमाल किया गया सीड, ताकि नतीजे को फिर से जनरेट किया जा सके.
वर्णों के ऐसे क्रम की सूची जिनसे आउटपुट इंटरैक्शन बंद हो जाएगा.
thinking_level ThinkingLevel (optional)
मॉडल को कितने थॉट टोकन जनरेट करने चाहिए.
ये वैल्यू हो सकती हैं:
-
minimal -
low -
medium -
high
thinking_summaries ThinkingSummaries (ज़रूरी नहीं)
जवाब में सोच की खास जानकारी शामिल करनी है या नहीं.
ये वैल्यू हो सकती हैं:
-
auto -
none
जवाब में शामिल किए जाने वाले टोकन की ज़्यादा से ज़्यादा संख्या.
speech_config SpeechConfig (ज़रूरी नहीं)
बोलकर इंटरैक्ट करने की सुविधा के लिए कॉन्फ़िगरेशन.
फ़ील्ड
स्पीकर की आवाज़.
बोली जाने वाली भाषा.
वक्ता का नाम, यह प्रॉम्प्ट में दिए गए वक्ता के नाम से मेल खाना चाहिए.
image_config ImageConfig (optional)
इमेज इंटरैक्शन के लिए कॉन्फ़िगरेशन.
फ़ील्ड
कोई विवरण नहीं दिया गया.
ये वैल्यू हो सकती हैं:
-
1:1 -
2:3 -
3:2 -
3:4 -
4:3 -
4:5 -
5:4 -
9:16 -
16:9 -
21:9 -
1:8 -
8:1 -
1:4 -
4:1
कोई विवरण नहीं दिया गया.
ये वैल्यू हो सकती हैं:
-
1K -
2K -
4K -
512
टूल चुनने की सुविधा का कॉन्फ़िगरेशन.
agent_config object (ज़रूरी नहीं)
एजेंट कॉन्फ़िगरेशन
एजेंट के लिए कॉन्फ़िगरेशन.
`generation_config` का विकल्प. यह सिर्फ़ तब लागू होता है, जब `agent` सेट किया गया हो.
संभावित टाइप
पॉलीमॉर्फ़िक डिसक्रिमिनेटर: type
DynamicAgentConfig
डाइनैमिक एजेंट के लिए कॉन्फ़िगरेशन.
कोई विवरण नहीं दिया गया.
इसे हमेशा "dynamic" पर सेट किया जाता है.
DeepResearchAgentConfig
Deep Research एजेंट के लिए कॉन्फ़िगरेशन.
कोई विवरण नहीं दिया गया.
इसे हमेशा "deep-research" पर सेट किया जाता है.
thinking_summaries ThinkingSummaries (ज़रूरी नहीं)
जवाब में सोच की खास जानकारी शामिल करनी है या नहीं.
ये वैल्यू हो सकती हैं:
-
auto -
none
जवाब में विज़ुअलाइज़ेशन शामिल करने हैं या नहीं.
ये वैल्यू हो सकती हैं:
-
off -
auto
इससे Deep Research एजेंट के लिए, ह्यूमन-इन-द-लूप प्लानिंग की सुविधा चालू होती है. इसे true पर सेट करने पर, Deep Research एजेंट अपने जवाब में रिसर्च प्लान देगा. इसके बाद, एजेंट सिर्फ़ तब आगे बढ़ेगा, जब उपयोगकर्ता अगले टर्न में प्लान की पुष्टि करेगा.
पिछले इंटरैक्शन का आईडी. अगर कोई पिछला इंटरैक्शन नहीं है, तो यह फ़ील्ड मौजूद नहीं होता.
response_modalities ResponseModality (optional)
जवाब देने के लिए अनुरोध की गई सुविधाएं (TEXT, IMAGE, AUDIO).
ये वैल्यू हो सकती हैं:
-
text -
image -
audio -
video -
document
service_tier ServiceTier (ज़रूरी नहीं)
इंटरैक्शन के लिए सेवा का टियर.
ये वैल्यू हो सकती हैं:
-
flex -
standard -
priority
webhook_config WebhookConfig (optional)
ज़रूरी नहीं. इंटरैक्शन पूरा होने पर सूचनाएं पाने के लिए, वेबहुक कॉन्फ़िगरेशन.
फ़ील्ड
ज़रूरी नहीं. अगर ये यूआरआई सेट किए जाते हैं, तो इनका इस्तेमाल वेबहुक इवेंट के लिए किया जाएगा. ऐसा, रजिस्टर किए गए वेबहुक के बजाय किया जाएगा.
ज़रूरी नहीं. उपयोगकर्ता का वह मेटाडेटा जो वेबहुक को हर इवेंट के लिए भेजा जाएगा.
जवाब
यह Interaction संसाधन दिखाता है.
सामान्य अनुरोध
प्रतिक्रिया का उदाहरण
{ "created": "2025-11-26T12:25:15Z", "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "object": "interaction", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "Hello! I'm functioning perfectly and ready to assist you.\n\nHow are you doing today?" } ] } ], "status": "completed", "updated": "2025-11-26T12:25:15Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 7 } ], "total_cached_tokens": 0, "total_input_tokens": 7, "total_output_tokens": 20, "total_thought_tokens": 22, "total_tokens": 49, "total_tool_use_tokens": 0 } }
Multi-turn
प्रतिक्रिया का उदाहरण
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "The capital of France is Paris." } ] } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 50 } ], "total_cached_tokens": 0, "total_input_tokens": 50, "total_output_tokens": 10, "total_thought_tokens": 0, "total_tokens": 60, "total_tool_use_tokens": 0 } }
इमेज इनपुट
प्रतिक्रिया का उदाहरण
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "A white humanoid robot with glowing blue eyes stands holding a red skateboard." } ] } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 10 }, { "modality": "image", "tokens": 258 } ], "total_cached_tokens": 0, "total_input_tokens": 268, "total_output_tokens": 20, "total_thought_tokens": 0, "total_tokens": 288, "total_tool_use_tokens": 0 } }
फ़ंक्शन कॉलिंग
प्रतिक्रिया का उदाहरण
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "requires_action", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "steps": [ { "type": "function_call", "id": "gth23981", "name": "get_weather", "arguments": { "location": "Boston, MA" } } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 100 } ], "total_cached_tokens": 0, "total_input_tokens": 100, "total_output_tokens": 25, "total_thought_tokens": 0, "total_tokens": 125, "total_tool_use_tokens": 50 } }
Deep Research
प्रतिक्रिया का उदाहरण
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "agent": "deep-research-pro-preview-12-2025", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "Here is a comprehensive research report on the current state of cancer research..." } ] } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 20 } ], "total_cached_tokens": 0, "total_input_tokens": 20, "total_output_tokens": 1000, "total_thought_tokens": 500, "total_tokens": 1520, "total_tool_use_tokens": 0 } }
इंटरैक्शन वापस पाना
यह क्वेरी, `Interaction.id` के आधार पर किसी इंटरैक्शन की पूरी जानकारी वापस लाती है.
पाथ / क्वेरी पैरामीटर
जिस इंटरैक्शन को वापस पाना है उसका यूनीक आइडेंटिफ़ायर.
अगर इसे 'सही है' पर सेट किया जाता है, तो जनरेट किए गए कॉन्टेंट को धीरे-धीरे स्ट्रीम किया जाएगा.
डिफ़ॉल्ट रूप से यह इस पर सेट होता है: False
ज़रूरी नहीं. इस पैरामीटर को सेट करने पर, इवेंट आईडी से मार्क किए गए इवेंट के बाद, इंटरैक्शन स्ट्रीम अगले चंक से फिर से शुरू हो जाती है. इसका इस्तेमाल सिर्फ़ तब किया जा सकता है, जब `stream` सही पर सेट हो.
इसे सही पर सेट करने पर, जवाब में इनपुट शामिल किया जाता है.
डिफ़ॉल्ट रूप से यह इस पर सेट होता है: False
एपीआई के किस वर्शन का इस्तेमाल करना है.
जवाब
यह Interaction संसाधन दिखाता है.
इंटरैक्शन पाना
प्रतिक्रिया का उदाहरण
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:25:15Z", "updated": "2025-11-26T12:25:15Z", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "I'm doing great, thank you for asking! How can I help you today?" } ] } ] }
इंटरैक्शन मिटाना
इस कुकी का इस्तेमाल, आईडी के हिसाब से इंटरैक्शन को मिटाने के लिए किया जाता है.
पाथ / क्वेरी पैरामीटर
मिटाने के लिए इंटरैक्शन का यूनीक आइडेंटिफ़ायर.
एपीआई के किस वर्शन का इस्तेमाल करना है.
जवाब
अगर अनुरोध पूरा हो जाता है, तो जवाब में कुछ नहीं होता.
इंटरैक्शन मिटाना
इंटरैक्शन रद्द करना
यह आईडी के हिसाब से इंटरैक्शन रद्द करता है. यह सिर्फ़ उन बैकग्राउंड इंटरैक्शन पर लागू होता है जो अब भी चल रहे हैं.
पाथ / क्वेरी पैरामीटर
जिस इंटरैक्शन को रद्द करना है उसका यूनीक आइडेंटिफ़ायर.
एपीआई के किस वर्शन का इस्तेमाल करना है.
जवाब
यह Interaction संसाधन दिखाता है.
इंटरैक्शन रद्द करें
प्रतिक्रिया का उदाहरण
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "agent": "deep-research-pro-preview-12-2025", "status": "cancelled", "object": "interaction", "created": "2025-11-26T12:25:15Z", "updated": "2025-11-26T12:25:15Z" }
संसाधन
बातचीत
इंटरैक्शन रिसॉर्स.
फ़ील्ड
model ModelOption (ज़रूरी नहीं)
इंटरैक्शन जनरेट करने के लिए इस्तेमाल किए गए `Model` का नाम.
ये वैल्यू हो सकती हैं:
-
gemini-2.5-computer-use-preview-10-2025यह एजेंटिक क्षमता वाला मॉडल है. इसे सीधे तौर पर इंटरफ़ेस से इंटरैक्ट करने के लिए डिज़ाइन किया गया है. इससे Gemini को डिजिटल एनवायरमेंट को समझने और उनमें नेविगेट करने में मदद मिलती है.
-
gemini-2.5-flashयह हमारा पहला हाइब्रिड रीज़निंग मॉडल है. इसमें 10 लाख टोकन वाली कॉन्टेक्स्ट विंडो और थिंकिंग बजट की सुविधा है.
-
gemini-2.5-flash-imageइमेज जनरेट करने वाला हमारा मॉडल, तेज़ी से काम करने के लिए ऑप्टिमाइज़ किया गया है. यह मॉडल, कॉन्टेंट के हिसाब से इमेज जनरेट करने के साथ-साथ, अलग-अलग तरह की इमेज जनरेट करने में भी मदद करता है. टेक्स्ट इनपुट और आउटपुट की कीमत, 2.5 फ़्लैश के बराबर होती है.
-
gemini-2.5-flash-liteयह हमारा सबसे छोटा और किफ़ायती मॉडल है. इसे बड़े पैमाने पर इस्तेमाल करने के लिए बनाया गया है.
-
gemini-2.5-flash-lite-preview-09-2025यह Gemini 2.5 Flash lite पर आधारित नया मॉडल है. इसे कम लागत, ज़्यादा थ्रूपुट, और बेहतर क्वालिटी के लिए ऑप्टिमाइज़ किया गया है.
-
gemini-2.5-flash-native-audio-preview-12-2025हमारे नेटिव ऑडियो मॉडल, बेहतर पेसिंग, आवाज़ की नैचुरैलिटी, शब्दों की संख्या, और मूड के साथ-साथ बेहतर क्वालिटी वाले ऑडियो आउटपुट के लिए ऑप्टिमाइज़ किए गए हैं.
-
gemini-2.5-flash-preview-09-2025यह 2.5 Flash मॉडल पर आधारित सबसे नया मॉडल है. 2.5 Flash Preview, बड़े पैमाने पर प्रोसेसिंग करने, कम समय में जवाब पाने, और ज़्यादा वॉल्यूम वाले ऐसे कामों के लिए सबसे सही है जिनमें सोच-विचार करने की ज़रूरत होती है. साथ ही, यह एजेंट के तौर पर काम करने वाले एआई के इस्तेमाल के लिए भी सबसे सही है.
-
gemini-2.5-flash-preview-ttsलिखे गए शब्दों को बोली में बदलने वाला हमारा 2.5 Flash मॉडल, कम समय में बोली जनरेट करने के लिए ऑप्टिमाइज़ किया गया है.
-
gemini-2.5-proयह हमारा बेहतरीन और कई कामों को पूरा करने वाला मॉडल है. यह कोडिंग और मुश्किल सवालों के जवाब देने में माहिर है.
-
gemini-2.5-pro-preview-ttsलिखाई को बोली में बदलने वाला हमारा 2.5 Pro ऑडियो मॉडल, कम समय में तेज़ी से बोली जनरेट करने के लिए ऑप्टिमाइज़ किया गया है. इससे ज़्यादा नैचुरल आउटपुट मिलते हैं और प्रॉम्प्ट को आसानी से कंट्रोल किया जा सकता है.
-
gemini-3-flash-previewयह हमारा सबसे स्मार्ट मॉडल है. इसे तेज़ी से काम करने के लिए बनाया गया है. इसमें फ़्रंटियर इंटेलिजेंस के साथ-साथ, बेहतर खोज और ग्राउंडिंग की सुविधा भी मिलती है.
-
gemini-3-pro-image-previewइमेज जनरेट करने और उनमें बदलाव करने वाला बेहतरीन मॉडल.
-
gemini-3-pro-previewयह हमारा सबसे इंटेलिजेंट मॉडल है. इसमें एसओटीए रीज़निंग और मल्टीमॉडल को समझने की क्षमता है. साथ ही, इसमें एजेंटिक और वाइब कोडिंग की दमदार क्षमताएँ हैं.
-
gemini-3.1-pro-previewयह हमारा सबसे नया और बेहतरीन रीज़निंग मॉडल है. इसमें पहले से ज़्यादा गहराई और बारीकी से जानकारी मिलती है. साथ ही, यह टेक्स्ट, इमेज वगैरह को प्रोसेस करके गहराई से समझ सकता है और कोडिंग से जुड़े काम भी कर सकता है.
-
gemini-3.1-flash-image-previewतेज़ी से काम करने की क्षमता और असलियत के हिसाब से इमेज जनरेट करने की सुविधाओं के साथ, प्रो-लेवल की विज़ुअल इंटेलिजेंस.
-
gemini-3.1-flash-lite-previewयह हमारा सबसे किफ़ायती मॉडल है. इसे एजेंटिक टास्क, अनुवाद, और डेटा प्रोसेसिंग जैसे कामों के लिए ऑप्टिमाइज़ किया गया है.
-
gemini-3.1-flash-tts-previewGemini 3.1 Flash टीटीएस: यह मॉडल, कम समय में बेहतर क्वालिटी वाली स्पीच जनरेट करता है. इसमें आपको नैचुरल आउटपुट, प्रॉम्प्ट को कंट्रोल करने की सुविधा, और सटीक नैरेशन कंट्रोल के लिए नए एक्सप्रेसिव ऑडियो टैग मिलते हैं.
-
lyria-3-clip-previewयह कम समय में संगीत जनरेट करने वाला मॉडल है. इसे हाई-फ़िडेलिटी ऑडियो क्लिप और सटीक लय कंट्रोल के लिए ऑप्टिमाइज़ किया गया है.
-
lyria-3-pro-previewयह पूरा गाना जनरेट करने वाला हमारा ऐडवांस मॉडल है. इसमें संगीत की बारीकियों को समझने की क्षमता है. इसे अलग-अलग म्यूज़िकल स्टाइल में सटीक स्ट्रक्चरल कंट्रोल और मुश्किल ट्रांज़िशन के लिए ऑप्टिमाइज़ किया गया है.
agent AgentOption (ज़रूरी नहीं)
इंटरैक्शन जनरेट करने के लिए इस्तेमाल किए गए `Agent` का नाम.
ये वैल्यू हो सकती हैं:
-
deep-research-pro-preview-12-2025Gemini Deep Research एजेंट
-
deep-research-preview-04-2026Gemini Deep Research एजेंट
-
deep-research-max-preview-04-2026Gemini Deep Research Max Agent
ज़रूरी है. सिर्फ़ आउटपुट के लिए. इंटरैक्शन पूरा होने के लिए यूनीक आइडेंटिफ़ायर.
ज़रूरी है. सिर्फ़ आउटपुट के लिए. इंटरैक्शन का स्टेटस.
ये वैल्यू हो सकती हैं:
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
ज़रूरी है. सिर्फ़ आउटपुट के लिए. आईएसओ 8601 फ़ॉर्मैट (YYYY-MM-DDThh:mm:ssZ) में, जवाब जनरेट होने का समय.
ज़रूरी है. सिर्फ़ आउटपुट के लिए. आईएसओ 8601 फ़ॉर्मैट (YYYY-MM-DDThh:mm:ssZ) में, जवाब को पिछली बार अपडेट किए जाने का समय.
सिर्फ़ आउटपुट के लिए. इंटरैक्शन की भूमिका.
इंटरैक्शन के लिए सिस्टम को दिया गया निर्देश.
टूल के उन एलान की सूची जिन्हें मॉडल, इंटरैक्शन के दौरान कॉल कर सकता है.
usage Usage (ज़रूरी नहीं)
सिर्फ़ आउटपुट के लिए. इंटरैक्शन के अनुरोध में इस्तेमाल किए गए टोकन के बारे में आंकड़े.
फ़ील्ड
प्रॉम्प्ट (कॉन्टेक्स्ट) में टोकन की संख्या.
input_tokens_by_modality ModalityTokens (ज़रूरी नहीं)
मोड के हिसाब से, इनपुट टोकन के इस्तेमाल की जानकारी.
फ़ील्ड
modality ResponseModality (ज़रूरी नहीं)
टोकन की संख्या से जुड़ी मोडेलिटी.
ये वैल्यू हो सकती हैं:
-
text -
image -
audio -
video -
document
मोडेलिटी के लिए टोकन की संख्या.
प्रॉम्प्ट के कैश मेमोरी में सेव किए गए हिस्से (कैश मेमोरी में सेव किया गया कॉन्टेंट) में मौजूद टोकन की संख्या.
cached_tokens_by_modality ModalityTokens (optional)
मोड के हिसाब से, कैश मेमोरी में सेव किए गए टोकन के इस्तेमाल का ब्रेकडाउन.
फ़ील्ड
modality ResponseModality (ज़रूरी नहीं)
टोकन की संख्या से जुड़ी मोडेलिटी.
ये वैल्यू हो सकती हैं:
-
text -
image -
audio -
video -
document
मोडेलिटी के लिए टोकन की संख्या.
जनरेट किए गए सभी जवाबों में मौजूद टोकन की कुल संख्या.
output_tokens_by_modality ModalityTokens (ज़रूरी नहीं)
मोड के हिसाब से, आउटपुट टोकन के इस्तेमाल का ब्रेकडाउन.
फ़ील्ड
modality ResponseModality (ज़रूरी नहीं)
टोकन की संख्या से जुड़ी मोडेलिटी.
ये वैल्यू हो सकती हैं:
-
text -
image -
audio -
video -
document
मोडेलिटी के लिए टोकन की संख्या.
टूल का इस्तेमाल करने के लिए दिए गए प्रॉम्प्ट में मौजूद टोकन की संख्या.
tool_use_tokens_by_modality ModalityTokens (ज़रूरी नहीं)
मोड के हिसाब से, टूल इस्तेमाल करने के लिए टोकन के इस्तेमाल का ब्रेकडाउन.
फ़ील्ड
modality ResponseModality (ज़रूरी नहीं)
टोकन की संख्या से जुड़ी मोडेलिटी.
ये वैल्यू हो सकती हैं:
-
text -
image -
audio -
video -
document
मोडेलिटी के लिए टोकन की संख्या.
सूझ-बूझ वाले मॉडल के लिए, आइडिया के टोकन की संख्या.
इंटरैक्शन के अनुरोध के लिए टोकन की कुल संख्या (प्रॉम्प्ट + जवाब + अन्य इंटरनल टोकन).
grounding_tool_count GroundingToolCount (ज़रूरी नहीं)
ग्राउंडिंग टूल की संख्या.
फ़ील्ड
गिनती से जुड़ा ग्राउंडिंग टूल टाइप.
ये वैल्यू हो सकती हैं:
-
google_search -
google_maps -
retrieval
ग्राउंडिंग टूल की गिनती की संख्या.
response_modalities ResponseModality (ज़रूरी नहीं)
जवाब देने के लिए अनुरोध की गई सुविधाएं (TEXT, IMAGE, AUDIO).
ये वैल्यू हो सकती हैं:
-
text -
image -
audio -
video -
document
जवाब का MIME टाइप. अगर response_format सेट किया गया है, तो यह ज़रूरी है.
पिछले इंटरैक्शन का आईडी. अगर कोई पिछला इंटरैक्शन नहीं है, तो यह फ़ील्ड मौजूद नहीं होता.
service_tier ServiceTier (ज़रूरी नहीं)
इंटरैक्शन के लिए सेवा का टियर.
ये वैल्यू हो सकती हैं:
-
flex -
standard -
priority
webhook_config WebhookConfig (optional)
ज़रूरी नहीं. इंटरैक्शन पूरा होने पर सूचनाएं पाने के लिए, वेबहुक कॉन्फ़िगरेशन.
फ़ील्ड
ज़रूरी नहीं. अगर ये यूआरआई सेट किए जाते हैं, तो इनका इस्तेमाल वेबहुक इवेंट के लिए किया जाएगा. ऐसा, रजिस्टर किए गए वेबहुक के बजाय किया जाएगा.
ज़रूरी नहीं. उपयोगकर्ता का वह मेटाडेटा जो वेबहुक को हर इवेंट के लिए भेजा जाएगा.
steps Step (ज़रूरी नहीं)
सिर्फ़ आउटपुट के लिए. वे चरण जिनसे इंटरैक्शन बनता है.
संभावित टाइप
पॉलीमॉर्फ़िक डिसक्रिमिनेटर: type
UserInputStep
उपयोगकर्ता की ओर से दिया गया इनपुट.
कोई विवरण नहीं दिया गया.
इसे हमेशा "user_input" पर सेट किया जाता है.
कोई विवरण नहीं दिया गया.
ModelOutputStep
मॉडल से जनरेट किया गया आउटपुट.
कोई विवरण नहीं दिया गया.
इसे हमेशा "model_output" पर सेट किया जाता है.
कोई विवरण नहीं दिया गया.
ThoughtStep
सोचने का चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "thought" पर सेट किया जाता है.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
summary ThoughtSummaryContent (ज़रूरी नहीं)
जवाब की खास जानकारी.
संभावित टाइप
पॉलीमॉर्फ़िक डिसक्रिमिनेटर: type
TextContent
टेक्स्ट कॉन्टेंट वाला ब्लॉक.
कोई विवरण नहीं दिया गया.
इसे हमेशा "text" पर सेट किया जाता है.
ज़रूरी है. टेक्स्ट कॉन्टेंट.
annotations Annotation (ज़रूरी नहीं)
मॉडल से जनरेट किए गए कॉन्टेंट के लिए उद्धरण की जानकारी.
संभावित टाइप
पॉलीमॉर्फ़िक डिसक्रिमिनेटर: type
UrlCitation
यूआरएल उद्धरण एनोटेशन.
कोई विवरण नहीं दिया गया.
इसे हमेशा "url_citation" पर सेट किया जाता है.
यूआरएल.
यूआरएल का टाइटल.
जवाब के उस सेगमेंट की शुरुआत जिसे इस सोर्स के लिए एट्रिब्यूट किया गया है. इंडेक्स से सेगमेंट की शुरुआत का पता चलता है. इसे बाइट में मापा जाता है.
एट्रिब्यूट किए गए सेगमेंट के खत्म होने का समय (अलग से उपलब्ध).
FileCitation
फ़ाइल के उद्धरण का एनोटेशन.
कोई विवरण नहीं दिया गया.
इसे हमेशा "file_citation" पर सेट किया जाता है.
फ़ाइल का यूआरआई.
फ़ाइल का नाम.
टेक्स्ट के किसी हिस्से के लिए एट्रिब्यूट किया गया सोर्स.
उपयोगकर्ता ने खोजे गए कॉन्टेक्स्ट के बारे में मेटाडेटा दिया है.
अगर लागू हो, तो उद्धृत किए गए दस्तावेज़ का पेज नंबर.
अगर लागू हो, तो इमेज के उद्धरण के मामले में मीडिया आईडी.
जवाब के उस सेगमेंट की शुरुआत जिसे इस सोर्स के लिए एट्रिब्यूट किया गया है. इंडेक्स से सेगमेंट की शुरुआत का पता चलता है. इसे बाइट में मापा जाता है.
एट्रिब्यूट किए गए सेगमेंट के खत्म होने का समय (अलग से उपलब्ध).
PlaceCitation
जगह के उद्धरण वाला एनोटेशन.
कोई विवरण नहीं दिया गया.
इसे हमेशा "place_citation" पर सेट किया जाता है.
जगह का आईडी, `places/{place_id}` फ़ॉर्मैट में होता है.
जगह का टाइटल.
जगह का यूआरआई रेफ़रंस.
review_snippets ReviewSnippet (ज़रूरी नहीं)
समीक्षाओं के ऐसे स्निपेट जिनका इस्तेमाल, Google Maps में किसी जगह की सुविधाओं के बारे में जवाब जनरेट करने के लिए किया जाता है.
फ़ील्ड
समीक्षा का टाइटल.
यह Google Maps पर मौजूद उपयोगकर्ता की समीक्षा से जुड़ा लिंक होता है.
समीक्षा स्निपेट का आईडी.
जवाब के उस सेगमेंट की शुरुआत जिसे इस सोर्स के लिए एट्रिब्यूट किया गया है. इंडेक्स से सेगमेंट की शुरुआत का पता चलता है. इसे बाइट में मापा जाता है.
एट्रिब्यूट किए गए सेगमेंट के खत्म होने का समय (अलग से उपलब्ध).
ImageContent
इमेज कॉन्टेंट ब्लॉक.
कोई विवरण नहीं दिया गया.
इसे हमेशा "image" पर सेट किया जाता है.
इमेज का कॉन्टेंट.
इमेज का यूआरआई.
इमेज का MIME टाइप.
ये वैल्यू हो सकती हैं:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (ज़रूरी नहीं)
मीडिया का रिज़ॉल्यूशन.
ये वैल्यू हो सकती हैं:
-
low -
medium -
high -
ultra_high
FunctionCallStep
यह फ़ंक्शन कॉल करने वाले टूल का चरण है.
कोई विवरण नहीं दिया गया.
इसे हमेशा "function_call" पर सेट किया जाता है.
ज़रूरी है. कॉल किए जाने वाले टूल का नाम.
ज़रूरी है. फ़ंक्शन में पास किए जाने वाले आर्ग्युमेंट.
ज़रूरी है. इस टूल कॉल के लिए यूनीक आईडी.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
CodeExecutionCallStep
कोड को चलाने के लिए कॉल करने का चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "code_execution_call" पर सेट किया जाता है.
arguments CodeExecutionCallStepArguments (ज़रूरी है)
ज़रूरी है. कोड को एक्ज़ीक्यूट करने के लिए पास किए जाने वाले आर्ग्युमेंट.
फ़ील्ड
`code` की प्रोग्रामिंग भाषा.
ये वैल्यू हो सकती हैं:
-
python
वह कोड जिसे एक्ज़ीक्यूट करना है.
ज़रूरी है. इस टूल कॉल के लिए यूनीक आईडी.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
UrlContextCallStep
यूआरएल कॉन्टेक्स्ट कॉल चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "url_context_call" पर सेट किया जाता है.
arguments UrlContextCallStepArguments (ज़रूरी है)
ज़रूरी है. यूआरएल के कॉन्टेक्स्ट में पास किए जाने वाले आर्ग्युमेंट.
फ़ील्ड
फ़ेच किए जाने वाले यूआरएल.
ज़रूरी है. इस टूल कॉल के लिए यूनीक आईडी.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
McpServerToolCallStep
MCPServer टूल कॉल का चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "mcp_server_tool_call" पर सेट किया जाता है.
ज़रूरी है. कॉल किए गए टूल का नाम.
ज़रूरी है. इस्तेमाल किए गए एमसीपी सर्वर का नाम.
ज़रूरी है. फ़ंक्शन के लिए आर्ग्युमेंट का JSON ऑब्जेक्ट.
ज़रूरी है. इस टूल कॉल के लिए यूनीक आईडी.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
GoogleSearchCallStep
Google Search कॉल का चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "google_search_call" पर सेट किया जाता है.
arguments GoogleSearchCallStepArguments (required)
ज़रूरी है. Google Search को पास किए जाने वाले आर्ग्युमेंट.
फ़ील्ड
वेब खोज से जुड़ी क्वेरी, ताकि वेब खोज को फ़ॉलो अप किया जा सके.
खोज के लिए इस्तेमाल किए गए डेटा का टाइप.
ये वैल्यू हो सकती हैं:
-
web_search -
image_search -
enterprise_web_search
ज़रूरी है. इस टूल कॉल के लिए यूनीक आईडी.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
FileSearchCallStep
फ़ाइल खोजने के लिए कॉल करने का चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "file_search_call" पर सेट किया जाता है.
ज़रूरी है. इस टूल कॉल के लिए यूनीक आईडी.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
GoogleMapsCallStep
Google Maps से कॉल करने का चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "google_maps_call" पर सेट किया जाता है.
arguments GoogleMapsCallStepArguments (ज़रूरी नहीं)
Google Maps टूल को पास किए जाने वाले तर्क.
फ़ील्ड
वे क्वेरी जिन्हें एक्ज़ीक्यूट करना है.
ज़रूरी है. इस टूल कॉल के लिए यूनीक आईडी.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
FunctionResultStep
फ़ंक्शन टूल को कॉल करने का नतीजा.
कोई विवरण नहीं दिया गया.
इसे हमेशा "function_result" पर सेट किया जाता है.
कॉल किए गए टूल का नाम.
टूल कॉल में कोई गड़बड़ी हुई है या नहीं.
ज़रूरी है. यह आईडी, फ़ंक्शन कॉल ब्लॉक के आईडी से मेल खाना चाहिए.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
टूल कॉल का नतीजा.
CodeExecutionResultStep
कोड चलाने के नतीजे का चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "code_execution_result" पर सेट किया जाता है.
ज़रूरी है. कोड को चलाने का आउटपुट.
कोड चलाने पर कोई गड़बड़ी हुई है या नहीं.
ज़रूरी है. यह आईडी, फ़ंक्शन कॉल ब्लॉक के आईडी से मेल खाना चाहिए.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
UrlContextResultStep
यूआरएल के कॉन्टेक्स्ट के हिसाब से नतीजे देने वाला चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "url_context_result" पर सेट किया जाता है.
result UrlContextResultItem (ज़रूरी है)
ज़रूरी है. यूआरएल के कॉन्टेक्स्ट के नतीजे.
फ़ील्ड
फ़ेच किया गया यूआरएल.
यूआरएल को फिर से पाने का स्टेटस.
ये वैल्यू हो सकती हैं:
-
success -
error -
paywall -
unsafe
इससे पता चलता है कि यूआरएल के कॉन्टेक्स्ट में कोई गड़बड़ी हुई है या नहीं.
ज़रूरी है. यह आईडी, फ़ंक्शन कॉल ब्लॉक के आईडी से मेल खाना चाहिए.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
GoogleSearchResultStep
Google Search के नतीजे दिखाने वाला चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "google_search_result" पर सेट किया जाता है.
result GoogleSearchResultItem (ज़रूरी है)
ज़रूरी है. Google Search के नतीजे.
फ़ील्ड
यह वेब कॉन्टेंट स्निपेट होता है. इसे किसी वेब पेज या ऐप्लिकेशन के वेबव्यू में एम्बेड किया जा सकता है.
इससे पता चलता है कि Google Search में कोई गड़बड़ी हुई है या नहीं.
ज़रूरी है. यह आईडी, फ़ंक्शन कॉल ब्लॉक के आईडी से मेल खाना चाहिए.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
McpServerToolResultStep
MCPServer टूल के नतीजे का चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "mcp_server_tool_result" पर सेट किया जाता है.
उस टूल का नाम जिसे इस टूल कॉल के लिए कॉल किया गया है.
इस्तेमाल किए गए एमसीपी सर्वर का नाम.
ज़रूरी है. यह आईडी, फ़ंक्शन कॉल ब्लॉक के आईडी से मेल खाना चाहिए.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
एमसीपी सर्वर कॉल का आउटपुट. यह सामान्य टेक्स्ट या रिच कॉन्टेंट हो सकता है.
FileSearchResultStep
फ़ाइल खोजने के नतीजे वाला चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "file_search_result" पर सेट किया जाता है.
ज़रूरी है. यह आईडी, फ़ंक्शन कॉल ब्लॉक के आईडी से मेल खाना चाहिए.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
GoogleMapsResultStep
Google Maps के नतीजे का चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "google_maps_result" पर सेट किया जाता है.
result GoogleMapsResultItem (ज़रूरी है)
कोई विवरण नहीं दिया गया.
फ़ील्ड
places GoogleMapsResultPlaces (ज़रूरी नहीं)
कोई विवरण नहीं दिया गया.
फ़ील्ड
कोई विवरण नहीं दिया गया.
कोई विवरण नहीं दिया गया.
कोई विवरण नहीं दिया गया.
review_snippets ReviewSnippet (ज़रूरी नहीं)
कोई विवरण नहीं दिया गया.
फ़ील्ड
समीक्षा का टाइटल.
यह Google Maps पर मौजूद उपयोगकर्ता की समीक्षा से जुड़ा लिंक होता है.
समीक्षा स्निपेट का आईडी.
कोई विवरण नहीं दिया गया.
ज़रूरी है. यह आईडी, फ़ंक्शन कॉल ब्लॉक के आईडी से मेल खाना चाहिए.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
इससे यह पक्का किया जाता है कि जनरेट किया गया रिस्पॉन्स, एक JSON ऑब्जेक्ट हो. साथ ही, यह इस फ़ील्ड में दिए गए JSON स्कीमा के मुताबिक हो.
agent_config object (ज़रूरी नहीं)
एजेंट के साथ इंटरैक्शन के लिए कॉन्फ़िगरेशन पैरामीटर.
संभावित टाइप
पॉलीमॉर्फ़िक डिसक्रिमिनेटर: type
DynamicAgentConfig
डाइनैमिक एजेंट के लिए कॉन्फ़िगरेशन.
कोई विवरण नहीं दिया गया.
इसे हमेशा "dynamic" पर सेट किया जाता है.
DeepResearchAgentConfig
Deep Research एजेंट के लिए कॉन्फ़िगरेशन.
कोई विवरण नहीं दिया गया.
इसे हमेशा "deep-research" पर सेट किया जाता है.
thinking_summaries ThinkingSummaries (ज़रूरी नहीं)
जवाब में सोच की खास जानकारी शामिल करनी है या नहीं.
ये वैल्यू हो सकती हैं:
-
auto -
none
जवाब में विज़ुअलाइज़ेशन शामिल करने हैं या नहीं.
ये वैल्यू हो सकती हैं:
-
off -
auto
इससे Deep Research एजेंट के लिए, ह्यूमन-इन-द-लूप प्लानिंग की सुविधा चालू होती है. इसे true पर सेट करने पर, Deep Research एजेंट अपने जवाब में रिसर्च प्लान देगा. इसके बाद, एजेंट सिर्फ़ तब आगे बढ़ेगा, जब उपयोगकर्ता अगले टर्न में प्लान की पुष्टि करेगा.
उदाहरण
उदाहरण
{ "created": "2025-12-04T15:01:45Z", "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg", "model": "gemini-3-flash-preview", "object": "interaction", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "Hello! I'm doing well, functioning as expected. Thank you for asking! How are you doing today?" } ] } ], "status": "completed", "updated": "2025-12-04T15:01:45Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 7 } ], "total_cached_tokens": 0, "total_input_tokens": 7, "total_output_tokens": 23, "total_thought_tokens": 49, "total_tokens": 79, "total_tool_use_tokens": 0 } }
डेटा मॉडल
सामग्री
जवाब का कॉन्टेंट.
संभावित टाइप
पॉलीमॉर्फ़िक डिसक्रिमिनेटर: type
TextContent
टेक्स्ट कॉन्टेंट वाला ब्लॉक.
कोई विवरण नहीं दिया गया.
इसे हमेशा "text" पर सेट किया जाता है.
ज़रूरी है. टेक्स्ट कॉन्टेंट.
annotations Annotation (ज़रूरी नहीं)
मॉडल से जनरेट किए गए कॉन्टेंट के लिए उद्धरण की जानकारी.
संभावित टाइप
पॉलीमॉर्फ़िक डिसक्रिमिनेटर: type
UrlCitation
यूआरएल उद्धरण एनोटेशन.
कोई विवरण नहीं दिया गया.
इसे हमेशा "url_citation" पर सेट किया जाता है.
यूआरएल.
यूआरएल का टाइटल.
जवाब के उस सेगमेंट की शुरुआत जिसे इस सोर्स के लिए एट्रिब्यूट किया गया है. इंडेक्स से सेगमेंट की शुरुआत का पता चलता है. इसे बाइट में मापा जाता है.
एट्रिब्यूट किए गए सेगमेंट के खत्म होने का समय (अलग से उपलब्ध).
FileCitation
फ़ाइल के उद्धरण का एनोटेशन.
कोई विवरण नहीं दिया गया.
इसे हमेशा "file_citation" पर सेट किया जाता है.
फ़ाइल का यूआरआई.
फ़ाइल का नाम.
टेक्स्ट के किसी हिस्से के लिए एट्रिब्यूट किया गया सोर्स.
उपयोगकर्ता ने खोजे गए कॉन्टेक्स्ट के बारे में मेटाडेटा दिया है.
अगर लागू हो, तो उद्धृत किए गए दस्तावेज़ का पेज नंबर.
अगर लागू हो, तो इमेज के उद्धरण के मामले में मीडिया आईडी.
जवाब के उस सेगमेंट की शुरुआत जिसे इस सोर्स के लिए एट्रिब्यूट किया गया है. इंडेक्स से सेगमेंट की शुरुआत का पता चलता है. इसे बाइट में मापा जाता है.
एट्रिब्यूट किए गए सेगमेंट के खत्म होने का समय (अलग से उपलब्ध).
PlaceCitation
जगह के उद्धरण वाला एनोटेशन.
कोई विवरण नहीं दिया गया.
इसे हमेशा "place_citation" पर सेट किया जाता है.
जगह का आईडी, `places/{place_id}` फ़ॉर्मैट में होता है.
जगह का टाइटल.
जगह का यूआरआई रेफ़रंस.
review_snippets ReviewSnippet (ज़रूरी नहीं)
समीक्षाओं के ऐसे स्निपेट जिनका इस्तेमाल, Google Maps में किसी जगह की सुविधाओं के बारे में जवाब जनरेट करने के लिए किया जाता है.
फ़ील्ड
समीक्षा का टाइटल.
यह Google Maps पर मौजूद उपयोगकर्ता की समीक्षा से जुड़ा लिंक होता है.
समीक्षा स्निपेट का आईडी.
जवाब के उस सेगमेंट की शुरुआत जिसे इस सोर्स के लिए एट्रिब्यूट किया गया है. इंडेक्स से सेगमेंट की शुरुआत का पता चलता है. इसे बाइट में मापा जाता है.
एट्रिब्यूट किए गए सेगमेंट के खत्म होने का समय (अलग से उपलब्ध).
ImageContent
इमेज कॉन्टेंट ब्लॉक.
कोई विवरण नहीं दिया गया.
इसे हमेशा "image" पर सेट किया जाता है.
इमेज का कॉन्टेंट.
इमेज का यूआरआई.
इमेज का MIME टाइप.
ये वैल्यू हो सकती हैं:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (ज़रूरी नहीं)
मीडिया का रिज़ॉल्यूशन.
ये वैल्यू हो सकती हैं:
-
low -
medium -
high -
ultra_high
AudioContent
ऑडियो कॉन्टेंट ब्लॉक.
कोई विवरण नहीं दिया गया.
इसे हमेशा "audio" पर सेट किया जाता है.
ऑडियो कॉन्टेंट.
ऑडियो का यूआरआई.
ऑडियो का MIME टाइप.
ये वैल्यू हो सकती हैं:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
ऑडियो चैनलों की संख्या.
ऑडियो का सैंपल रेट.
DocumentContent
दस्तावेज़ का कॉन्टेंट ब्लॉक.
कोई विवरण नहीं दिया गया.
इसे हमेशा "document" पर सेट किया जाता है.
दस्तावेज़ का कॉन्टेंट.
दस्तावेज़ का यूआरआई.
दस्तावेज़ का MIME टाइप.
ये वैल्यू हो सकती हैं:
-
application/pdf
VideoContent
वीडियो कॉन्टेंट ब्लॉक.
कोई विवरण नहीं दिया गया.
इसे हमेशा "video" पर सेट किया जाता है.
वीडियो कॉन्टेंट.
वीडियो का यूआरआई.
वीडियो का MIME टाइप.
ये वैल्यू हो सकती हैं:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
resolution MediaResolution (ज़रूरी नहीं)
मीडिया का रिज़ॉल्यूशन.
ये वैल्यू हो सकती हैं:
-
low -
medium -
high -
ultra_high
उदाहरण
टेक्स्ट
{ "type": "text", "text": "Hello, how are you?" }
इमेज
{ "type": "image", "data": "BASE64_ENCODED_IMAGE", "mime_type": "image/png" }
ऑडियो
{ "type": "audio", "data": "BASE64_ENCODED_AUDIO", "mime_type": "audio/wav" }
दस्तावेज़
{ "type": "document", "data": "BASE64_ENCODED_DOCUMENT", "mime_type": "application/pdf" }
वीडियो
{ "type": "video", "uri": "https://www.youtube.com/watch?v=9hE5-98ZeCg" }
टूल
ऐसा टूल जिसका इस्तेमाल मॉडल कर सकता है.
संभावित टाइप
पॉलीमॉर्फ़िक डिसक्रिमिनेटर: type
सुविधा
ऐसा टूल जिसका इस्तेमाल मॉडल कर सकता है.
कोई विवरण नहीं दिया गया.
इसे हमेशा "function" पर सेट किया जाता है.
फ़ंक्शन का नाम.
फ़ंक्शन के बारे में जानकारी.
फ़ंक्शन के पैरामीटर के लिए JSON स्कीमा.
CodeExecution
यह एक ऐसा टूल है जिसका इस्तेमाल मॉडल, कोड को एक्ज़ीक्यूट करने के लिए कर सकता है.
कोई विवरण नहीं दिया गया.
इसे हमेशा "code_execution" पर सेट किया जाता है.
UrlContext
यह एक ऐसा टूल है जिसका इस्तेमाल मॉडल, यूआरएल के कॉन्टेक्स्ट को फ़ेच करने के लिए कर सकता है.
कोई विवरण नहीं दिया गया.
इसे हमेशा "url_context" पर सेट किया जाता है.
ComputerUse
यह एक ऐसा टूल है जिसका इस्तेमाल मॉडल, कंप्यूटर से इंटरैक्ट करने के लिए कर सकता है.
कोई विवरण नहीं दिया गया.
इसे हमेशा "computer_use" पर सेट किया जाता है.
जिस एनवायरमेंट में कार्रवाई की जा रही है.
ये वैल्यू हो सकती हैं:
-
browser
पहले से तय किए गए फ़ंक्शन की सूची, जिन्हें मॉडल कॉल से बाहर रखा गया है.
McpServer
MCPServer एक ऐसा सर्वर होता है जिसे मॉडल, कार्रवाइयां करने के लिए कॉल कर सकता है.
कोई विवरण नहीं दिया गया.
इसे हमेशा "mcp_server" पर सेट किया जाता है.
MCPServer का नाम.
MCPServer एंडपॉइंट का पूरा यूआरएल. उदाहरण: "https://api.example.com/mcp"
ज़रूरी नहीं: अगर ज़रूरी हो, तो पुष्टि करने वाले हेडर, टाइमआउट वगैरह के लिए फ़ील्ड.
allowed_tools AllowedTools (ज़रूरी नहीं)
अनुमति वाले टूल.
फ़ील्ड
mode ToolChoiceType (ज़रूरी नहीं)
टूल चुनने का मोड.
ये वैल्यू हो सकती हैं:
-
auto -
any -
none -
validated
उन टूल के नाम जिन्हें इस्तेमाल करने की अनुमति है.
GoogleSearch
यह एक ऐसा टूल है जिसका इस्तेमाल मॉडल, Google पर खोजने के लिए कर सकता है.
कोई विवरण नहीं दिया गया.
इसे हमेशा "google_search" पर सेट किया जाता है.
खोज के लिए, किस तरह की ग्राउंडिंग चालू करनी है.
ये वैल्यू हो सकती हैं:
-
web_search -
image_search -
enterprise_web_search
FileSearch
यह एक ऐसा टूल है जिसका इस्तेमाल मॉडल, फ़ाइलें खोजने के लिए कर सकता है.
कोई विवरण नहीं दिया गया.
इसे हमेशा "file_search" पर सेट किया जाता है.
फ़ाइल में, खोजने के लिए स्टोर के नाम मौजूद होते हैं.
सिमैंटिक तरीके से खोजे गए डेटा के कितने हिस्सों को वापस पाना है.
सिमैंटिक तौर पर जानकारी पाने के लिए इस्तेमाल किए जाने वाले दस्तावेज़ों और चंक पर लागू करने के लिए मेटाडेटा फ़िल्टर.
GoogleMaps
यह एक ऐसा टूल है जिसका इस्तेमाल मॉडल, Google Maps को कॉल करने के लिए कर सकता है.
कोई विवरण नहीं दिया गया.
इसे हमेशा "google_maps" पर सेट किया जाता है.
यह तय करता है कि जवाब के टूल कॉल के नतीजे में, विजेट कॉन्टेक्स्ट टोकन दिखाना है या नहीं.
उपयोगकर्ता की जगह का अक्षांश.
उपयोगकर्ता की जगह का देशांतर.
जानकारी पाना
यह एक ऐसा टूल है जिसका इस्तेमाल मॉडल, फ़ाइलों को वापस पाने के लिए कर सकता है.
कोई विवरण नहीं दिया गया.
इसे हमेशा "retrieval" पर सेट किया जाता है.
फ़ाइल वापस पाने की सुविधा चालू करने के लिए, फ़ाइल वापस पाने के तरीके.
ये वैल्यू हो सकती हैं:
-
vertex_ai_search
vertex_ai_search_config VertexAISearchConfig (optional)
इस कुकी का इस्तेमाल, VertexAISearch के कॉन्फ़िगरेशन के बारे में बताने के लिए किया जाता है.
फ़ील्ड
ज़रूरी नहीं. इस कुकी का इस्तेमाल, Vertex AI Search इंजन के बारे में बताने के लिए किया जाता है.
ज़रूरी नहीं. इस कुकी का इस्तेमाल, Vertex AI Search के डेटास्टोर के बारे में बताने के लिए किया जाता है.
उदाहरण
फ़ंक्शन
CodeExecution
UrlContext
ComputerUse
McpServer
GoogleSearch
FileSearch
GoogleMaps
फिर से पाना
इस तरह के अनुरोध का कोई उदाहरण नहीं है.
InteractionSseEvent
संभावित टाइप
पॉलीमॉर्फ़िक डिसक्रिमिनेटर: event_type
InteractionCreatedEvent
कोई विवरण नहीं दिया गया.
इसे हमेशा "interaction.created" पर सेट किया जाता है.
कोई विवरण नहीं दिया गया.
इस इवेंट से इंटरैक्शन स्ट्रीम को फिर से शुरू करने के लिए, event_id टोकन का इस्तेमाल किया जाएगा.
InteractionCompletedEvent
कोई विवरण नहीं दिया गया.
इसे हमेशा "interaction.completed" पर सेट किया जाता है.
ज़रूरी है. पेलोड का साइज़ कम करने के लिए, खाली आउटपुट के साथ इंटरैक्शन पूरा किया गया. असली आउटपुट के लिए, ContentDelta इवेंट का इस्तेमाल करें.
इस इवेंट से इंटरैक्शन स्ट्रीम को फिर से शुरू करने के लिए, event_id टोकन का इस्तेमाल किया जाएगा.
InteractionStatusUpdate
कोई विवरण नहीं दिया गया.
इसे हमेशा "interaction.status_update" पर सेट किया जाता है.
कोई विवरण नहीं दिया गया.
कोई विवरण नहीं दिया गया.
ये वैल्यू हो सकती हैं:
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
इस इवेंट से इंटरैक्शन स्ट्रीम को फिर से शुरू करने के लिए, event_id टोकन का इस्तेमाल किया जाएगा.
ErrorEvent
कोई विवरण नहीं दिया गया.
इसे हमेशा "error" पर सेट किया जाता है.
error Error (ज़रूरी नहीं)
कोई विवरण नहीं दिया गया.
फ़ील्ड
यह यूआरआई, गड़बड़ी के टाइप की पहचान करता है.
गड़बड़ी का ऐसा मैसेज जिसे कोई भी व्यक्ति आसानी से पढ़ सकता है.
इस इवेंट से इंटरैक्शन स्ट्रीम को फिर से शुरू करने के लिए, event_id टोकन का इस्तेमाल किया जाएगा.
StepStart
कोई विवरण नहीं दिया गया.
इसे हमेशा "step.start" पर सेट किया जाता है.
कोई विवरण नहीं दिया गया.
step Step (ज़रूरी है)
कोई विवरण नहीं दिया गया.
संभावित टाइप
पॉलीमॉर्फ़िक डिसक्रिमिनेटर: type
UserInputStep
उपयोगकर्ता की ओर से दिया गया इनपुट.
कोई विवरण नहीं दिया गया.
इसे हमेशा "user_input" पर सेट किया जाता है.
कोई विवरण नहीं दिया गया.
ModelOutputStep
मॉडल से जनरेट किया गया आउटपुट.
कोई विवरण नहीं दिया गया.
इसे हमेशा "model_output" पर सेट किया जाता है.
कोई विवरण नहीं दिया गया.
ThoughtStep
सोचने का चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "thought" पर सेट किया जाता है.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
summary ThoughtSummaryContent (ज़रूरी नहीं)
जवाब की खास जानकारी.
संभावित टाइप
पॉलीमॉर्फ़िक डिसक्रिमिनेटर: type
TextContent
टेक्स्ट कॉन्टेंट वाला ब्लॉक.
कोई विवरण नहीं दिया गया.
इसे हमेशा "text" पर सेट किया जाता है.
ज़रूरी है. टेक्स्ट कॉन्टेंट.
annotations Annotation (ज़रूरी नहीं)
मॉडल से जनरेट किए गए कॉन्टेंट के लिए उद्धरण की जानकारी.
संभावित टाइप
पॉलीमॉर्फ़िक डिसक्रिमिनेटर: type
UrlCitation
यूआरएल उद्धरण एनोटेशन.
कोई विवरण नहीं दिया गया.
इसे हमेशा "url_citation" पर सेट किया जाता है.
यूआरएल.
यूआरएल का टाइटल.
जवाब के उस सेगमेंट की शुरुआत जिसे इस सोर्स के लिए एट्रिब्यूट किया गया है. इंडेक्स से सेगमेंट की शुरुआत का पता चलता है. इसे बाइट में मापा जाता है.
एट्रिब्यूट किए गए सेगमेंट के खत्म होने का समय (अलग से उपलब्ध).
FileCitation
फ़ाइल के उद्धरण का एनोटेशन.
कोई विवरण नहीं दिया गया.
इसे हमेशा "file_citation" पर सेट किया जाता है.
फ़ाइल का यूआरआई.
फ़ाइल का नाम.
टेक्स्ट के किसी हिस्से के लिए एट्रिब्यूट किया गया सोर्स.
उपयोगकर्ता ने खोजे गए कॉन्टेक्स्ट के बारे में मेटाडेटा दिया है.
अगर लागू हो, तो उद्धृत किए गए दस्तावेज़ का पेज नंबर.
अगर लागू हो, तो इमेज के उद्धरण के मामले में मीडिया आईडी.
जवाब के उस सेगमेंट की शुरुआत जिसे इस सोर्स के लिए एट्रिब्यूट किया गया है. इंडेक्स से सेगमेंट की शुरुआत का पता चलता है. इसे बाइट में मापा जाता है.
एट्रिब्यूट किए गए सेगमेंट के खत्म होने का समय (अलग से उपलब्ध).
PlaceCitation
जगह के उद्धरण वाला एनोटेशन.
कोई विवरण नहीं दिया गया.
इसे हमेशा "place_citation" पर सेट किया जाता है.
जगह का आईडी, `places/{place_id}` फ़ॉर्मैट में होता है.
जगह का टाइटल.
जगह का यूआरआई रेफ़रंस.
review_snippets ReviewSnippet (ज़रूरी नहीं)
समीक्षाओं के ऐसे स्निपेट जिनका इस्तेमाल, Google Maps में किसी जगह की सुविधाओं के बारे में जवाब जनरेट करने के लिए किया जाता है.
फ़ील्ड
समीक्षा का टाइटल.
यह Google Maps पर मौजूद उपयोगकर्ता की समीक्षा से जुड़ा लिंक होता है.
समीक्षा स्निपेट का आईडी.
जवाब के उस सेगमेंट की शुरुआत जिसे इस सोर्स के लिए एट्रिब्यूट किया गया है. इंडेक्स से सेगमेंट की शुरुआत का पता चलता है. इसे बाइट में मापा जाता है.
एट्रिब्यूट किए गए सेगमेंट के खत्म होने का समय (अलग से उपलब्ध).
ImageContent
इमेज कॉन्टेंट ब्लॉक.
कोई विवरण नहीं दिया गया.
इसे हमेशा "image" पर सेट किया जाता है.
इमेज का कॉन्टेंट.
इमेज का यूआरआई.
इमेज का MIME टाइप.
ये वैल्यू हो सकती हैं:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (ज़रूरी नहीं)
मीडिया का रिज़ॉल्यूशन.
ये वैल्यू हो सकती हैं:
-
low -
medium -
high -
ultra_high
FunctionCallStep
यह फ़ंक्शन कॉल करने वाले टूल का चरण है.
कोई विवरण नहीं दिया गया.
इसे हमेशा "function_call" पर सेट किया जाता है.
ज़रूरी है. कॉल किए जाने वाले टूल का नाम.
ज़रूरी है. फ़ंक्शन में पास किए जाने वाले आर्ग्युमेंट.
ज़रूरी है. इस टूल कॉल के लिए यूनीक आईडी.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
CodeExecutionCallStep
कोड को चलाने के लिए कॉल करने का चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "code_execution_call" पर सेट किया जाता है.
arguments CodeExecutionCallStepArguments (ज़रूरी है)
ज़रूरी है. कोड को एक्ज़ीक्यूट करने के लिए पास किए जाने वाले आर्ग्युमेंट.
फ़ील्ड
`code` की प्रोग्रामिंग भाषा.
ये वैल्यू हो सकती हैं:
-
python
वह कोड जिसे एक्ज़ीक्यूट करना है.
ज़रूरी है. इस टूल कॉल के लिए यूनीक आईडी.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
UrlContextCallStep
यूआरएल कॉन्टेक्स्ट कॉल चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "url_context_call" पर सेट किया जाता है.
arguments UrlContextCallStepArguments (ज़रूरी है)
ज़रूरी है. यूआरएल के कॉन्टेक्स्ट में पास किए जाने वाले आर्ग्युमेंट.
फ़ील्ड
फ़ेच किए जाने वाले यूआरएल.
ज़रूरी है. इस टूल कॉल के लिए यूनीक आईडी.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
McpServerToolCallStep
MCPServer टूल कॉल का चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "mcp_server_tool_call" पर सेट किया जाता है.
ज़रूरी है. कॉल किए गए टूल का नाम.
ज़रूरी है. इस्तेमाल किए गए एमसीपी सर्वर का नाम.
ज़रूरी है. फ़ंक्शन के लिए आर्ग्युमेंट का JSON ऑब्जेक्ट.
ज़रूरी है. इस टूल कॉल के लिए यूनीक आईडी.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
GoogleSearchCallStep
Google Search कॉल का चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "google_search_call" पर सेट किया जाता है.
arguments GoogleSearchCallStepArguments (required)
ज़रूरी है. Google Search को पास किए जाने वाले आर्ग्युमेंट.
फ़ील्ड
वेब खोज से जुड़ी क्वेरी, ताकि वेब खोज को फ़ॉलो अप किया जा सके.
खोज के लिए इस्तेमाल किए गए डेटा का टाइप.
ये वैल्यू हो सकती हैं:
-
web_search -
image_search -
enterprise_web_search
ज़रूरी है. इस टूल कॉल के लिए यूनीक आईडी.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
FileSearchCallStep
फ़ाइल खोजने के लिए कॉल करने का चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "file_search_call" पर सेट किया जाता है.
ज़रूरी है. इस टूल कॉल के लिए यूनीक आईडी.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
GoogleMapsCallStep
Google Maps से कॉल करने का चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "google_maps_call" पर सेट किया जाता है.
arguments GoogleMapsCallStepArguments (ज़रूरी नहीं)
Google Maps टूल को पास किए जाने वाले तर्क.
फ़ील्ड
वे क्वेरी जिन्हें एक्ज़ीक्यूट करना है.
ज़रूरी है. इस टूल कॉल के लिए यूनीक आईडी.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
FunctionResultStep
फ़ंक्शन टूल को कॉल करने का नतीजा.
कोई विवरण नहीं दिया गया.
इसे हमेशा "function_result" पर सेट किया जाता है.
कॉल किए गए टूल का नाम.
टूल कॉल में कोई गड़बड़ी हुई है या नहीं.
ज़रूरी है. यह आईडी, फ़ंक्शन कॉल ब्लॉक के आईडी से मेल खाना चाहिए.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
टूल कॉल का नतीजा.
CodeExecutionResultStep
कोड चलाने के नतीजे का चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "code_execution_result" पर सेट किया जाता है.
ज़रूरी है. कोड को चलाने का आउटपुट.
कोड चलाने पर कोई गड़बड़ी हुई है या नहीं.
ज़रूरी है. यह आईडी, फ़ंक्शन कॉल ब्लॉक के आईडी से मेल खाना चाहिए.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
UrlContextResultStep
यूआरएल के कॉन्टेक्स्ट के हिसाब से नतीजे देने वाला चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "url_context_result" पर सेट किया जाता है.
result UrlContextResultItem (ज़रूरी है)
ज़रूरी है. यूआरएल के कॉन्टेक्स्ट के नतीजे.
फ़ील्ड
फ़ेच किया गया यूआरएल.
यूआरएल को फिर से पाने का स्टेटस.
ये वैल्यू हो सकती हैं:
-
success -
error -
paywall -
unsafe
इससे पता चलता है कि यूआरएल के कॉन्टेक्स्ट में कोई गड़बड़ी हुई है या नहीं.
ज़रूरी है. यह आईडी, फ़ंक्शन कॉल ब्लॉक के आईडी से मेल खाना चाहिए.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
GoogleSearchResultStep
Google Search के नतीजे दिखाने वाला चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "google_search_result" पर सेट किया जाता है.
result GoogleSearchResultItem (ज़रूरी है)
ज़रूरी है. Google Search के नतीजे.
फ़ील्ड
यह वेब कॉन्टेंट स्निपेट होता है. इसे किसी वेब पेज या ऐप्लिकेशन के वेबव्यू में एम्बेड किया जा सकता है.
इससे पता चलता है कि Google Search में कोई गड़बड़ी हुई है या नहीं.
ज़रूरी है. यह आईडी, फ़ंक्शन कॉल ब्लॉक के आईडी से मेल खाना चाहिए.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
McpServerToolResultStep
MCPServer टूल के नतीजे का चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "mcp_server_tool_result" पर सेट किया जाता है.
उस टूल का नाम जिसे इस टूल कॉल के लिए कॉल किया गया है.
इस्तेमाल किए गए एमसीपी सर्वर का नाम.
ज़रूरी है. यह आईडी, फ़ंक्शन कॉल ब्लॉक के आईडी से मेल खाना चाहिए.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
एमसीपी सर्वर कॉल का आउटपुट. यह सामान्य टेक्स्ट या रिच कॉन्टेंट हो सकता है.
FileSearchResultStep
फ़ाइल खोजने के नतीजे वाला चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "file_search_result" पर सेट किया जाता है.
ज़रूरी है. यह आईडी, फ़ंक्शन कॉल ब्लॉक के आईडी से मेल खाना चाहिए.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
GoogleMapsResultStep
Google Maps के नतीजे का चरण.
कोई विवरण नहीं दिया गया.
इसे हमेशा "google_maps_result" पर सेट किया जाता है.
result GoogleMapsResultItem (ज़रूरी है)
कोई विवरण नहीं दिया गया.
फ़ील्ड
places GoogleMapsResultPlaces (ज़रूरी नहीं)
कोई विवरण नहीं दिया गया.
फ़ील्ड
कोई विवरण नहीं दिया गया.
कोई विवरण नहीं दिया गया.
कोई विवरण नहीं दिया गया.
review_snippets ReviewSnippet (ज़रूरी नहीं)
कोई विवरण नहीं दिया गया.
फ़ील्ड
समीक्षा का टाइटल.
यह Google Maps पर मौजूद उपयोगकर्ता की समीक्षा से जुड़ा लिंक होता है.
समीक्षा स्निपेट का आईडी.
कोई विवरण नहीं दिया गया.
ज़रूरी है. यह आईडी, फ़ंक्शन कॉल ब्लॉक के आईडी से मेल खाना चाहिए.
बैकएंड की पुष्टि के लिए हस्ताक्षर हैश.
इस इवेंट से इंटरैक्शन स्ट्रीम को फिर से शुरू करने के लिए, event_id टोकन का इस्तेमाल किया जाएगा.
StepDelta
कोई विवरण नहीं दिया गया.
इसे हमेशा "step.delta" पर सेट किया जाता है.
कोई विवरण नहीं दिया गया.
delta StepDeltaData (ज़रूरी है)
कोई विवरण नहीं दिया गया.
संभावित टाइप
पॉलीमॉर्फ़िक डिसक्रिमिनेटर: type
TextDelta
कोई विवरण नहीं दिया गया.
इसे हमेशा "text" पर सेट किया जाता है.
कोई विवरण नहीं दिया गया.
ImageDelta
कोई विवरण नहीं दिया गया.
इसे हमेशा "image" पर सेट किया जाता है.
कोई विवरण नहीं दिया गया.
कोई विवरण नहीं दिया गया.
कोई विवरण नहीं दिया गया.
ये वैल्यू हो सकती हैं:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (ज़रूरी नहीं)
मीडिया का रिज़ॉल्यूशन.
ये वैल्यू हो सकती हैं:
-
low -
medium -
high -
ultra_high
AudioDelta
कोई विवरण नहीं दिया गया.
इसे हमेशा "audio" पर सेट किया जाता है.
कोई विवरण नहीं दिया गया.
कोई विवरण नहीं दिया गया.
कोई विवरण नहीं दिया गया.
ये वैल्यू हो सकती हैं:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
समर्थन नहीं होना या रुकना. इसके बजाय, sample_rate का इस्तेमाल करें. वैल्यू को अनदेखा कर दिया जाता है.
ऑडियो का सैंपल रेट.
ऑडियो चैनलों की संख्या.
DocumentDelta
कोई विवरण नहीं दिया गया.
इसे हमेशा "document" पर सेट किया जाता है.
कोई विवरण नहीं दिया गया.
कोई विवरण नहीं दिया गया.
कोई विवरण नहीं दिया गया.
ये वैल्यू हो सकती हैं:
-
application/pdf
VideoDelta
कोई विवरण नहीं दिया गया.
इसे हमेशा "video" पर सेट किया जाता है.
कोई विवरण नहीं दिया गया.
कोई विवरण नहीं दिया गया.
कोई विवरण नहीं दिया गया.
ये वैल्यू हो सकती हैं:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
resolution MediaResolution (ज़रूरी नहीं)
मीडिया का रिज़ॉल्यूशन.
ये वैल्यू हो सकती हैं:
-
low -
medium -
high -
ultra_high
ThoughtSummaryDelta
कोई विवरण नहीं दिया गया.
इसे हमेशा "thought_summary" पर सेट किया जाता है.
content ThoughtSummaryContent (ज़रूरी नहीं)
विचार में जोड़ने के लिए नई खास जानकारी वाला आइटम.
संभावित टाइप
पॉलीमॉर्फ़िक डिसक्रिमिनेटर: type
TextContent
टेक्स्ट कॉन्टेंट वाला ब्लॉक.
कोई विवरण नहीं दिया गया.
इसे हमेशा "text" पर सेट किया जाता है.
ज़रूरी है. टेक्स्ट कॉन्टेंट.
annotations Annotation (ज़रूरी नहीं)
मॉडल से जनरेट किए गए कॉन्टेंट के लिए उद्धरण की जानकारी.
संभावित टाइप
पॉलीमॉर्फ़िक डिसक्रिमिनेटर: type
UrlCitation
यूआरएल उद्धरण एनोटेशन.
कोई विवरण नहीं दिया गया.
इसे हमेशा "url_citation" पर सेट किया जाता है.
यूआरएल.
यूआरएल का टाइटल.
जवाब के उस सेगमेंट की शुरुआत जिसे इस सोर्स के लिए एट्रिब्यूट किया गया है. इंडेक्स से सेगमेंट की शुरुआत का पता चलता है. इसे बाइट में मापा जाता है.
एट्रिब्यूट किए गए सेगमेंट के खत्म होने का समय (अलग से उपलब्ध).
FileCitation
फ़ाइल के उद्धरण का एनोटेशन.
कोई विवरण नहीं दिया गया.
इसे हमेशा "file_citation" पर सेट किया जाता है.
फ़ाइल का यूआरआई.
फ़ाइल का नाम.
टेक्स्ट के किसी हिस्से के लिए एट्रिब्यूट किया गया सोर्स.
उपयोगकर्ता ने खोजे गए कॉन्टेक्स्ट के बारे में मेटाडेटा दिया है.
अगर लागू हो, तो उद्धृत किए गए दस्तावेज़ का पेज नंबर.
अगर लागू हो, तो इमेज के उद्धरण के मामले में मीडिया आईडी.
जवाब के उस सेगमेंट की शुरुआत जिसे इस सोर्स के लिए एट्रिब्यूट किया गया है. इंडेक्स से सेगमेंट की शुरुआत का पता चलता है. इसे बाइट में मापा जाता है.
एट्रिब्यूट किए गए सेगमेंट के खत्म होने का समय (अलग से उपलब्ध).
PlaceCitation
जगह के उद्धरण वाला एनोटेशन.
कोई विवरण नहीं दिया गया.
इसे हमेशा "place_citation" पर सेट किया जाता है.
जगह का आईडी, `places/{place_id}` फ़ॉर्मैट में होता है.
जगह का टाइटल.
जगह का यूआरआई रेफ़रंस.
review_snippets ReviewSnippet (ज़रूरी नहीं)
समीक्षाओं के ऐसे स्निपेट जिनका इस्तेमाल, Google Maps में किसी जगह की सुविधाओं के बारे में जवाब जनरेट करने के लिए किया जाता है.
फ़ील्ड
समीक्षा का टाइटल.
यह Google Maps पर मौजूद उपयोगकर्ता की समीक्षा से जुड़ा लिंक होता है.
समीक्षा स्निपेट का आईडी.
जवाब के उस सेगमेंट की शुरुआत जिसे इस सोर्स के लिए एट्रिब्यूट किया गया है. इंडेक्स से सेगमेंट की शुरुआत का पता चलता है. इसे बाइट में मापा जाता है.
एट्रिब्यूट किए गए सेगमेंट के खत्म होने का समय (अलग से उपलब्ध).
ImageContent
इमेज कॉन्टेंट ब्लॉक.
कोई विवरण नहीं दिया गया.
इसे हमेशा "image" पर सेट किया जाता है.
इमेज का कॉन्टेंट.
इमेज का यूआरआई.
इमेज का MIME टाइप.
ये वैल्यू हो सकती हैं:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (ज़रूरी नहीं)
मीडिया का रिज़ॉल्यूशन.
ये वैल्यू हो सकती हैं:
-
low -
medium -
high -
ultra_high
ThoughtSignatureDelta
कोई विवरण नहीं दिया गया.
इसे हमेशा "thought_signature" पर सेट किया जाता है.
बैकएंड सोर्स से मैच करने वाला सिग्नेचर, ताकि उसे जनरेशन में शामिल किया जा सके.
TextAnnotationDelta
कोई विवरण नहीं दिया गया.
इसे हमेशा "text_annotation_delta" पर सेट किया जाता है.
annotations Annotation (ज़रूरी नहीं)
मॉडल से जनरेट किए गए कॉन्टेंट के लिए उद्धरण की जानकारी.
संभावित टाइप
पॉलीमॉर्फ़िक डिसक्रिमिनेटर: type
UrlCitation
यूआरएल उद्धरण एनोटेशन.
कोई विवरण नहीं दिया गया.
इसे हमेशा "url_citation" पर सेट किया जाता है.
यूआरएल.
यूआरएल का टाइटल.
जवाब के उस सेगमेंट की शुरुआत जिसे इस सोर्स के लिए एट्रिब्यूट किया गया है. इंडेक्स से सेगमेंट की शुरुआत का पता चलता है. इसे बाइट में मापा जाता है.
एट्रिब्यूट किए गए सेगमेंट के खत्म होने का समय (अलग से उपलब्ध).
FileCitation
फ़ाइल के उद्धरण का एनोटेशन.
कोई विवरण नहीं दिया गया.
इसे हमेशा "file_citation" पर सेट किया जाता है.
फ़ाइल का यूआरआई.
फ़ाइल का नाम.
टेक्स्ट के किसी हिस्से के लिए एट्रिब्यूट किया गया सोर्स.
उपयोगकर्ता ने खोजे गए कॉन्टेक्स्ट के बारे में मेटाडेटा दिया है.
अगर लागू हो, तो उद्धृत किए गए दस्तावेज़ का पेज नंबर.
अगर लागू हो, तो इमेज के उद्धरण के मामले में मीडिया आईडी.
जवाब के उस सेगमेंट की शुरुआत जिसे इस सोर्स के लिए एट्रिब्यूट किया गया है. इंडेक्स से सेगमेंट की शुरुआत का पता चलता है. इसे बाइट में मापा जाता है.
एट्रिब्यूट किए गए सेगमेंट के खत्म होने का समय (अलग से उपलब्ध).
PlaceCitation
जगह के उद्धरण वाला एनोटेशन.
कोई विवरण नहीं दिया गया.
इसे हमेशा "place_citation" पर सेट किया जाता है.
जगह का आईडी, `places/{place_id}` फ़ॉर्मैट में होता है.
जगह का टाइटल.
जगह का यूआरआई रेफ़रंस.
review_snippets ReviewSnippet (ज़रूरी नहीं)
समीक्षाओं के ऐसे स्निपेट जिनका इस्तेमाल, Google Maps में किसी जगह की सुविधाओं के बारे में जवाब जनरेट करने के लिए किया जाता है.
फ़ील्ड
समीक्षा का टाइटल.
यह Google Maps पर मौजूद उपयोगकर्ता की समीक्षा से जुड़ा लिंक होता है.
समीक्षा स्निपेट का आईडी.
जवाब के उस सेगमेंट की शुरुआत जिसे इस सोर्स के लिए एट्रिब्यूट किया गया है. इंडेक्स से सेगमेंट की शुरुआत का पता चलता है. इसे बाइट में मापा जाता है.
एट्रिब्यूट किए गए सेगमेंट के खत्म होने का समय (अलग से उपलब्ध).
ArgumentsDelta
कोई विवरण नहीं दिया गया.
इसे हमेशा "arguments_delta" पर सेट किया जाता है.
कोई विवरण नहीं दिया गया.
इस इवेंट से इंटरैक्शन स्ट्रीम को फिर से शुरू करने के लिए, event_id टोकन का इस्तेमाल किया जाएगा.
StepStop
कोई विवरण नहीं दिया गया.
इसे हमेशा "step.stop" पर सेट किया जाता है.
कोई विवरण नहीं दिया गया.
इस इवेंट से इंटरैक्शन स्ट्रीम को फिर से शुरू करने के लिए, event_id टोकन का इस्तेमाल किया जाएगा.
उदाहरण
इंटरैक्शन बनाया गया
{ "event_type": "interaction.created", "interaction": { "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg", "model": "gemini-3-flash-preview", "status": "in_progress", "created": "2025-12-04T15:01:45Z", "updated": "2025-12-04T15:01:45Z" }, "event_id": "evt_123" }
इंटरैक्शन पूरा हुआ
{ "event_type": "interaction.completed", "interaction": { "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg", "model": "gemini-3-flash-preview", "status": "completed", "created": "2025-12-04T15:01:45Z", "updated": "2025-12-04T15:01:45Z" }, "event_id": "evt_123" }
इंटरैक्शन के स्टेटस का अपडेट
{ "event_type": "interaction.status_update", "interaction_id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM", "status": "in_progress" }
गड़बड़ी वाला इवेंट
{ "event_type": "error", "error": { "message": "Failed to get completed interaction: Result not found.", "code": "not_found" } }
चरण शुरू हुआ
{ "event_type": "step.start", "index": 0, "step": { "type": "model_output" } }
स्टेप डेल्टा
{ "event_type": "step.delta", "index": 0, "delta": { "type": "text", "text": "Hello" } }
स्टेप स्टॉप
{ "event_type": "step.stop", "index": 0 }