Interactions API
Interactions API, Gemini के साथ काम करने का नया स्टैंडर्ड है. हमारा सुझाव है कि सभी नए प्रोजेक्ट के लिए इसका इस्तेमाल किया जाए. इसे एजेंटिक वर्कफ़्लो, सर्वर-साइड स्टेट मैनेजमेंट, और जटिल मल्टी-मॉडल, मल्टी-टर्न बातचीत के लिए ऑप्टिमाइज़ किया गया है. ओरिजनल generateContent API अब भी पूरी तरह से काम करता है.
Interactions API का इस्तेमाल क्यों करना चाहिए?
- सर्वर-साइड हिस्ट्री मैनेजमेंट:
previous_interaction_idकी मदद से, मल्टी-टर्न फ़्लो को आसान बनाया जा सकता है. सर्वर, डिफ़ॉल्ट रूप से स्टेट को चालू रखता है (store=true). हालांकि,store=falseसेट करके, स्टेटलेस मोड में काम किया जा सकता है. - ऑब्ज़र्वेबल एक्ज़ीक्यूशन स्टेप: टाइप किए गए स्टेप की मदद से, जटिल फ़्लो को डीबग करना और इंटरमीडिएट इवेंट (जैसे, थॉट या सर्च विजेट) के लिए यूज़र इंटरफ़ेस (यूआई) रेंडर करना आसान हो जाता है.
- एजेंटिक वर्कफ़्लो के लिए बनाया गया है: टाइप किए गए एक्ज़ीक्यूशन स्टेप की मदद से, मल्टी-स्टेप टूल के इस्तेमाल, ऑर्केस्ट्रेशन, और जटिल रीज़निंग फ़्लो के लिए नेटिव सपोर्ट.
- लंबे समय तक चलने वाले और बैकग्राउंड टास्क:
background=trueका इस्तेमाल करके, Deep Think और Deep Research जैसी समय लेने वाली कार्रवाइयों को बैकग्राउंड प्रोसेस में ऑफ़लोड करने की सुविधा. - नए मॉडल और क्षमताओं का ऐक्सेस: आने वाले समय में, मुख्य मेनलाइन फ़ैमिली के अलावा नए मॉडल, नए एजेंटिक क्षमताओं, और टूल को सिर्फ़ Interactions API पर लॉन्च किया जाएगा.
अगर कोई नया प्रोजेक्ट शुरू किया जा रहा है, एजेंटिक ऐप्लिकेशन बनाए जा रहे हैं या सर्वर-साइड बातचीत को मैनेज करने की ज़रूरत है, तो Interactions API का इस्तेमाल करें. अगर आपके पास पहले से कोई इंटिग्रेशन है जो आपकी ज़रूरतों के हिसाब से काम करता है या अगर आपको ऐसी सुविधा चाहिए जो फ़िलहाल Interactions API में उपलब्ध नहीं है, तो generateContent का इस्तेमाल करें. जैसे, बैच एपीआई या एक्सप्लिसिट कैशिंग.
शुरू करें
- कोडिंग एजेंट सेट अप करें: Gemini Docs MCP से कनेक्ट करें और
gemini-interactions-apiस्किल इंस्टॉल करें. इससे आपके Assistant को, डेवलपर के सबसे नए दस्तावेज़ों और सबसे सही तरीकों का सीधे ऐक्सेस मिल जाएगा. कोडिंग एजेंट सेट अप करना → generateContentसे माइग्रेट करना: अगर आपके पास पहले से कोई इंटिग्रेशन है, Interactions API पर ट्रांज़िशन करने के लिए,माइग्रेशन गाइड का इस्तेमाल करें.- क्विकस्टार्ट आज़माएं: Interactions API क्विकस्टार्ट में, काम करने वाले सबसे छोटे उदाहरण से शुरुआत करें.
सुविधाओं की गाइड
इन गाइड की मदद से, Interactions API की खास क्षमताओं के बारे में जानें. generateContent और Interactions API के बीच स्विच करने के लिए, इन पेजों पर मौजूद टॉगल का इस्तेमाल किया जा सकता है:
- टेक्स्ट जनरेट करना
- इमेज जनरेट करना
- इमेज को समझना
- ऑडियो को समझना
- वीडियो को समझना
- दस्तावेज़ की प्रोसेसिंग
- फ़ंक्शन कॉल करना
- स्ट्रक्चर्ड आउटपुट
- Deep Research एजेंट
- Flex inference
- Priority inference
- स्ट्रीमिंग
Interactions API के काम करने का तरीका
Interactions API, मुख्य संसाधन Interaction पर आधारित है. Interaction, बातचीत या टास्क में एक पूरे टर्न को दिखाता है. यह सेशन रिकॉर्ड के तौर पर काम करता है. इसमें, एक्ज़ीक्यूशन स्टेप के क्रम के तौर पर, इंटरैक्शन का पूरा इतिहास शामिल होता है. इन स्टेप में मॉडल के थॉट, सर्वर-साइड या क्लाइंट-साइड टूल कॉल और नतीजे (जैसे, function_call और function_result), और फ़ाइनल model_output शामिल होते हैं. सेव किए गए संसाधन (जिसे interactions.get के ज़रिए वापस पाया जाता है) में, पूरे कॉन्टेक्स्ट के लिए user_input स्टेप भी शामिल होते हैं. हालांकि, interactions.create का जवाब सिर्फ़ मॉडल से जनरेट किए गए स्टेप दिखाता है.
interactions.create को कॉल करने पर, नया Interaction संसाधन बनता है.
एसडीके की सुविधाजनक प्रॉपर्टी की मदद से आउटपुट ऐक्सेस करना
Interactions API, एक्ज़ीक्यूशन स्टेप (जैसे, थॉट, खोज क्वेरी, और फ़ंक्शन कॉल) की स्ट्रक्चर्ड टाइमलाइन दिखाता है. हालांकि, मॉडल के फ़ाइनल जवाब पाने के लिए, आपको मैन्युअल तरीके से स्टेप को ट्रैवर्स करने की ज़रूरत नहीं होती.
Google GenAI SDK टूल, अलग-अलग मोड के लिए आउटपुट ऐक्सेस करने के लिए, लौटाए गए Interaction ऑब्जेक्ट पर सीधे सुविधाजनक प्रॉपर्टी उपलब्ध कराते हैं:
| एसडीके की सुविधाजनक प्रॉपर्टी | रिटर्न टाइप | ब्यौरा |
|---|---|---|
interaction.output_text |
स्ट्रिंग | मॉडल के जवाब में मौजूद, टेक्स्ट के आखिरी ब्लॉक दिखाता है. अगर जवाब को एक के बाद एक कई TextContent ब्लॉक में बांटा गया है, तो यह उन्हें अपने-आप जोड़ देता है. इसमें, टेक्स्ट के पहले वाले ब्लॉक शामिल नहीं होते. इन्हें, नॉन-टेक्स्ट कॉन्टेंट (जैसे, थॉट, इमेज, ऑडियो या टूल कॉल) से अलग किया जाता है. जटिल या इंटरलीव्ड मल्टीमॉडल जवाबों के लिए, आपको इसके बजाय मैन्युअल तरीके से steps पर इटरेट करना होगा. |
interaction.output_image |
ImageContent या None |
मौजूदा अनुरोध में, मॉडल से जनरेट किया गया इमेज का आखिरी ब्लॉक दिखाता है. |
interaction.output_audio |
AudioContent या None |
मौजूदा अनुरोध में, मॉडल से जनरेट किया गया ऑडियो का आखिरी ब्लॉक दिखाता है. |
एडवांस इस्तेमाल के उदाहरणों के लिए, जैसे कि इंटरमीडिएट थिंकिंग प्रोसेस रेंडर करना, स्टेप-बाय-स्टेप टूल कॉल की जांच करना या डीबग करना, अब भी interaction.steps की रॉ टाइमलाइन की जांच और उसे मैन्युअल तरीके से ट्रैवर्स किया जा सकता है.
सर्वर-साइड स्टेट मैनेजमेंट
बातचीत जारी रखने के लिए,
previous_interaction_id पैरामीटर का इस्तेमाल करके, बाद में किए जाने वाले कॉल में, पूरे हो चुके इंटरैक्शन के id का इस्तेमाल किया जा सकता है. सर्वर, बातचीत का इतिहास वापस पाने के लिए इस आईडी का इस्तेमाल करता है. इससे आपको चैट का पूरा इतिहास फिर से भेजने की ज़रूरत नहीं पड़ती.
previous_interaction_id पैरामीटर, previous_interaction_id का इस्तेमाल करके, सिर्फ़ बातचीत का इतिहास (इनपुट और आउटपुट) सेव करता है. अन्य पैरामीटर इंटरैक्शन-स्कोप होते हैं और ये सिर्फ़ उस इंटरैक्शन पर लागू होते हैं जिसे फ़िलहाल जनरेट किया जा रहा है:
toolssystem_instructiongeneration_config(जिसमेंthinking_level,temperatureवगैरह शामिल हैं)
इसका मतलब है कि अगर आपको इन पैरामीटर को लागू करना है, तो आपको हर नए इंटरैक्शन में इन्हें फिर से तय करना होगा. सर्वर-साइड स्टेट मैनेजमेंट की सुविधा ज़रूरी नहीं है. हर अनुरोध में बातचीत का पूरा इतिहास भेजकर, स्टेटलेस मोड में भी काम किया जा सकता है.
डेटा स्टोरेज और रखरखाव
डिफ़ॉल्ट रूप से, एपीआई सभी इंटरैक्शन ऑब्जेक्ट (store=true) को सेव करता है. इससे सर्वर-साइड स्टेट मैनेजमेंट की सुविधाओं (जिसमें previous_interaction_id शामिल है), बैकग्राउंड एक्ज़ीक्यूशन (जिसमें background=true शामिल है) और ऑब्ज़र्वेबिलिटी के मकसद से, इनका इस्तेमाल आसान हो जाता है.
- प्रीमियम टियर: सिस्टम, इंटरैक्शन को 55 दिनों तक सेव रखता है.
- मुफ़्त टियर: सिस्टम, इंटरैक्शन को एक दिन तक सेव रखता है.
अगर आपको ऐसा नहीं करना है, तो अपने अनुरोध में store=false सेट करें. यह कंट्रोल, स्टेट मैनेजमेंट से अलग है. किसी भी इंटरैक्शन के लिए, स्टोरेज से ऑप्ट आउट किया जा सकता है. हालांकि, ध्यान दें कि store=false, background=true के साथ काम नहीं करता. साथ ही, इससे बाद के टर्न के लिए previous_interaction_id का इस्तेमाल नहीं किया जा सकता.
एपीआई रेफ़रंस में दिए गए 'मिटाएं' तरीके का इस्तेमाल करके, सेव किए गए इंटरैक्शन को कभी भी मिटाया जा सकता है. इंटरैक्शन को सिर्फ़ तब मिटाया जा सकता है, जब आपको इंटरैक्शन आईडी पता हो.
डेटा के रखरखाव की अवधि खत्म होने के बाद, आपका डेटा अपने-आप मिट जाएगा.
सिस्टम, शर्तों के मुताबिक इंटरैक्शन ऑब्जेक्ट को प्रोसेस करता है.
सबसे सही तरीके
- कैश हिट रेट: बातचीत जारी रखने के लिए
previous_interaction_idका इस्तेमाल करने से, सिस्टम बातचीत के इतिहास के लिए, इंप्लिसिट कैशिंग का ज़्यादा आसानी से इस्तेमाल कर पाता है. इससे परफ़ॉर्मेंस बेहतर होती है और लागत कम होती है. - इंटरैक्शन को मिक्स करना: बातचीत में, एजेंट और
मॉडल के इंटरैक्शन को मिक्स और मैच किया जा सकता है. उदाहरण के लिए, शुरुआती डेटा कलेक्शन के लिए, Deep Research एजेंट जैसे खास एजेंट का इस्तेमाल किया जा सकता है. इसके बाद, फ़ॉलो-अप टास्क के लिए, Gemini के स्टैंडर्ड मॉडल का इस्तेमाल किया जा सकता है. जैसे, खास जानकारी देना या फ़ॉर्मैट बदलना. इन स्टेप को
previous_interaction_idसे लिंक किया जा सकता है.
ऐसे मॉडल और एजेंट जिन पर यह सुविधा काम करती है
| मॉडल का नाम | टाइप | मॉडल आईडी |
|---|---|---|
| Gemini 3.5 Flash | मॉडल | gemini-3.5-flash |
| Gemini 3.1 Flash-Lite | मॉडल | gemini-3.1-flash-lite |
| Gemini 3.1 Flash-Lite की झलक | मॉडल | gemini-3.1-flash-lite-preview |
| Gemini 3.1 Pro की झलक | मॉडल | gemini-3.1-pro-preview |
| Gemini 3 Flash की झलक | मॉडल | gemini-3-flash-preview |
| Gemini 2.5 Pro | मॉडल | gemini-2.5-pro |
| Gemini 2.5 Flash | मॉडल | gemini-2.5-flash |
| Gemini 2.5 Flash-lite | मॉडल | gemini-2.5-flash-lite |
| Lyria 3 Clip की झलक | मॉडल | lyria-3-clip-preview |
| Lyria 3 Pro की झलक | मॉडल | lyria-3-pro-preview |
| Deep Research की झलक | एजेंट | deep-research-pro-preview-12-2025 |
| Deep Research की झलक | एजेंट | deep-research-preview-04-2026 |
| Deep Research की झलक | एजेंट | deep-research-max-preview-04-2026 |
एसडीके
Interactions API को ऐक्सेस करने के लिए, Google GenAI SDK टूल के सबसे नए वर्शन का इस्तेमाल किया जा सकता है.
- Python पर, यह
google-genaiपैकेज है. यह वर्शन1.55.0से उपलब्ध है. - JavaScript पर, यह
@google/genaiपैकेज है. यह वर्शन1.33.0से उपलब्ध है.
लाइब्रेरी वाले पेज पर जाकर, एसडीके इंस्टॉल करने के तरीके के बारे में ज़्यादा जाना जा सकता है.
सीमाएं
- बीटा वर्शन: Interactions API, बीटा/प्रीव्यू वर्शन में है. इसकी सुविधाओं और स्कीमा में बदलाव हो सकता है.
- रिमोट MCP: Gemini 3, रिमोट MCP के साथ काम नहीं करता. यह सुविधा जल्द ही उपलब्ध होगी.
generateContent API, इन सुविधाओं के साथ काम करता है. हालांकि, ये सुविधाएं फ़िलहाल Interactions API में उपलब्ध नहीं हैं:
- वीडियो का मेटाडेटा:
video_metadataफ़ील्ड का इस्तेमाल, वीडियो को समझने के लिए क्लिपिंग इंटरवल और कस्टम फ़्रेम रेट सेट करने के लिए किया जाता है. - बैच एपीआई
- फ़ंक्शन कॉल करने की सुविधा (Python)
- एक्सप्लिसिट कैशिंग: ध्यान दें कि Interactions API
में, सर्वर-साइड इंप्लिसिट कैशिंग की सुविधा,
previous_interaction_idके ज़रिए उपलब्ध है.
नुकसान पहुंचाने वाले बदलाव
फ़िलहाल, Interactions API शुरुआती बीटा स्टेज में है. हम असल दुनिया में इस्तेमाल और डेवलपर के सुझाव/शिकायत/राय के आधार पर, एपीआई की क्षमताओं, संसाधन स्कीमा, और एसडीके इंटरफ़ेस को लगातार डेवलप और बेहतर बना रहे हैं. इस वजह से, नुकसान पहुंचाने वाले बदलाव हो सकते हैं.
पहले से मौजूद नुकसान पहुंचाने वाले बदलाव:
- स्टेप स्कीमा: आउटपुट के कलेक्शन की जगह, स्टेप का नया कलेक्शन इस्तेमाल किया जाता है. इससे, हर इंटरैक्शन टर्न की स्ट्रक्चर्ड टाइमलाइन मिलती है.
सबसे हाल के नुकसान पहुंचाने वाले बदलाव के बारे में जानने और माइग्रेट करने का तरीका समझने के लिए, नुकसान पहुंचाने वाले बदलावों के लिए माइग्रेशन गाइड (मई 2026) देखें.
अन्य संभावित अपडेट में, इनपुट और आउटपुट के स्कीमा, एसडीके के तरीके के सिग्नेचर और ऑब्जेक्ट स्ट्रक्चर, खास सुविधाओं के व्यवहार में बदलाव शामिल हो सकते हैं.
प्रोडक्शन वर्कलोड के लिए, स्टैंडर्ड
generateContent एपीआई का इस्तेमाल जारी रखें. यह, स्टेबल डिप्लॉयमेंट के लिए सबसे सही तरीका है. हम इसे लगातार डेवलप और मेंटेन करते रहेंगे.
सुझाव/राय दें या शिकायत करें
Interactions API को डेवलप करने के लिए, आपका सुझाव/राय या शिकायत अहम है. Google AI डेवलपर कम्यूनिटी फ़ोरम पर अपने विचार शेयर करें, बग की शिकायत करें या सुविधाओं का अनुरोध करें.
आगे क्या करना है
- Interactions API क्विकस्टार्ट नोटबुक को आज़माएं.
- रीयल-टाइम में जवाबों को मैनेज करने के लिए, स्ट्रीमिंग इंटरैक्शन के बारे में जानें.
- Gemini Deep Research Agent के बारे में ज़्यादा जानें.