Interactions API
Interactions API, Gemini के साथ काम करने के लिए नया स्टैंडर्ड प्रिमिटिव है. हमारा सुझाव है कि सभी नए प्रोजेक्ट के लिए इसका इस्तेमाल किया जाए. इसे एजेंटिक वर्कफ़्लो, सर्वर-साइड स्टेट मैनेजमेंट, और जटिल मल्टी-मॉडल, मल्टी-टर्न बातचीत के लिए ऑप्टिमाइज़ किया गया है. ओरिजनल generateContent API अब भी पूरी तरह से काम करता है.
Interactions API का इस्तेमाल क्यों करना चाहिए?
- सर्वर-साइड हिस्ट्री मैनेजमेंट:
previous_interaction_idकी मदद से, मल्टी-टर्न फ़्लो को आसान बनाया जा सकता है. सर्वर, डिफ़ॉल्ट रूप से स्टेट को चालू करता है (store=true). हालांकि,store=falseसेट करके, स्टेटलेस बिहेवियर को चुना जा सकता है. - ऑब्ज़र्वेबल एक्ज़ीक्यूशन स्टेप: टाइप किए गए स्टेप की मदद से, जटिल फ़्लो को डीबग करना और इंटरमीडिएट इवेंट (जैसे, थॉट या सर्च विजेट) के लिए यूज़र इंटरफ़ेस (यूआई) रेंडर करना आसान हो जाता है.
- एजेंटिक वर्कफ़्लो के लिए बनाया गया है: टाइप किए गए एक्ज़ीक्यूशन स्टेप की मदद से, मल्टी-स्टेप टूल के इस्तेमाल, ऑर्केस्ट्रेशन, और जटिल रीज़निंग फ़्लो के लिए नेटिव सपोर्ट.
- लंबे समय तक चलने वाले और बैकग्राउंड टास्क:
background=trueका इस्तेमाल करके, Deep Think और Deep Research जैसी समय लेने वाली कार्रवाइयों को बैकग्राउंड प्रोसेस में ऑफ़लोड करने की सुविधा. - नए मॉडल और क्षमताओं का ऐक्सेस: आने वाले समय में, मुख्य मेनलाइन फ़ैमिली के अलावा नए मॉडल, नए एजेंटिक टूल, और क्षमताओं को सिर्फ़ Interactions API पर लॉन्च किया जाएगा.
अगर कोई नया प्रोजेक्ट शुरू किया जा रहा है, एजेंटिक ऐप्लिकेशन बनाए जा रहे हैं या सर्वर-साइड बातचीत को मैनेज करने की ज़रूरत है, तो Interactions API का इस्तेमाल करें. अगर आपके पास पहले से कोई इंटिग्रेशन है जो आपकी ज़रूरतों के हिसाब से काम करता है या आपको ऐसी सुविधा की ज़रूरत है जो फ़िलहाल Interactions API में उपलब्ध नहीं है, तो generateContent का इस्तेमाल करें. जैसे, बैच एपीआई या साफ़ तौर पर कैश मेमोरी में सेव करने की सुविधा.
शुरू करें
- कोडिंग एजेंट सेट अप करना: Gemini Docs MCP से कनेक्ट करें और
gemini-interactions-apiस्किल इंस्टॉल करें, ताकि आपके Assistant को डेवलपर के सबसे नए दस्तावेज़ों और सबसे सही तरीकों का डायरेक्ट ऐक्सेस मिल सके. कोडिंग एजेंट सेट अप करना → - से माइग्रेट करना
generateContent: अगर आपके पास पहले से कोई इंटिग्रेशन है, Interactions API पर ट्रांज़िशन करने के लिए,माइग्रेशन गाइड में दिया गया तरीका अपनाएं. - क्विकस्टार्ट आज़माना: Interactions API क्विकस्टार्ट में, काम करने वाले सबसे छोटे उदाहरण से शुरुआत करें.
सुविधाओं की गाइड
इन गाइड की मदद से, Interactions API की खास क्षमताओं के बारे में जानें. generateContent और Interactions API के बीच स्विच करने के लिए, इन पेजों पर मौजूद टॉगल का इस्तेमाल किया जा सकता है:
- टेक्स्ट जनरेट करने की सुविधा
- इमेज जनरेट करने की सुविधा
- इमेज को समझने की सुविधा
- ऑडियो को समझने की सुविधा
- वीडियो को समझने की सुविधा
- दस्तावेज़ की प्रोसेसिंग
- फ़ंक्शन कॉल करने की सुविधा
- स्ट्रक्चर्ड आउटपुट
- Deep Research एजेंट
- Flex inference
- Priority inference
Interactions API के काम करने का तरीका
Interactions API, मुख्य संसाधन Interaction पर आधारित है. कोई Interaction, बातचीत या टास्क में एक पूरे टर्न को दिखाता है. यह सेशन रिकॉर्ड के तौर पर काम करता है. इसमें, एक्ज़ीक्यूशन स्टेप के क्रम के तौर पर, इंटरैक्शन का पूरा इतिहास शामिल होता है. इन स्टेप में मॉडल के थॉट, सर्वर-साइड या क्लाइंट-साइड टूल कॉल और नतीजे (जैसे, function_call और function_result), और फ़ाइनल model_output शामिल होते हैं. सेव किए गए संसाधन (interactions.get के ज़रिए वापस पाया गया) में, पूरे कॉन्टेक्स्ट के लिए user_input स्टेप भी शामिल होते हैं. हालांकि, interactions.create का जवाब सिर्फ़ मॉडल से जनरेट किए गए स्टेप दिखाता है.
interactions.create को कॉल करने पर, एक नया Interaction संसाधन बनाया जाता है.
सर्वर-साइड स्टेट मैनेजमेंट
बातचीत जारी रखने के लिए,
previous_interaction_id पैरामीटर का इस्तेमाल करके, बाद में किए जाने वाले कॉल में, पूरे हो चुके इंटरैक्शन के id का इस्तेमाल किया जा सकता है. सर्वर, बातचीत का इतिहास वापस पाने के लिए इस आईडी का इस्तेमाल करता है. इससे आपको चैट का पूरा इतिहास फिर से भेजने की ज़रूरत नहीं पड़ती.
previous_interaction_id पैरामीटर, previous_interaction_id का इस्तेमाल करके, सिर्फ़ बातचीत का इतिहास (इनपुट और आउटपुट) सेव करता है. अन्य पैरामीटर इंटरैक्शन-स्कोप होते हैं और सिर्फ़ उस खास इंटरैक्शन पर लागू होते हैं जिसे फ़िलहाल जनरेट किया जा रहा है:
toolssystem_instructiongeneration_config(जिसमेंthinking_level,temperatureवगैरह शामिल हैं)
इसका मतलब है कि अगर आपको इन पैरामीटर को लागू करना है, तो हर नए इंटरैक्शन में इन्हें फिर से तय करना होगा. सर्वर-साइड स्टेट मैनेजमेंट की सुविधा ज़रूरी नहीं है. हर अनुरोध में बातचीत का पूरा इतिहास भेजकर, स्टेटलेस मोड में भी काम किया जा सकता है.
डेटा स्टोरेज और रखरखाव
डिफ़ॉल्ट रूप से, एपीआई सभी इंटरैक्शन ऑब्जेक्ट (store=true) को सेव करता है, ताकि सर्वर-साइड स्टेट मैनेजमेंट की सुविधाओं (previous_interaction_id के साथ), बैकग्राउंड एक्ज़ीक्यूशन (background=true का इस्तेमाल करके) और ऑब्ज़र्वेबिलिटी के मकसद से, इनका इस्तेमाल आसान बनाया जा सके.
- चुकाया गया टियर: सिस्टम, इंटरैक्शन को 55 दिनों तक सेव रखता है.
- मुफ़्त टियर: सिस्टम, इंटरैक्शन को एक दिन तक सेव रखता है.
अगर आपको यह सुविधा नहीं चाहिए, तो अपने अनुरोध में store=false सेट करें. यह कंट्रोल, स्टेट मैनेजमेंट से अलग है. किसी भी इंटरैक्शन के लिए, स्टोरेज से ऑप्ट आउट किया जा सकता है. हालांकि, ध्यान दें कि store=false, background=true के साथ काम नहीं करता. साथ ही, बाद के टर्न के लिए previous_interaction_id का इस्तेमाल करने से रोकता है.
एपीआई रेफ़रंस में दिए गए 'मिटाएं' तरीके का इस्तेमाल करके, सेव किए गए इंटरैक्शन को कभी भी मिटाया जा सकता है. इंटरैक्शन को सिर्फ़ तब मिटाया जा सकता है, जब आपको इंटरैक्शन आईडी पता हो.
डेटा के रखरखाव की अवधि खत्म होने के बाद, आपका डेटा अपने-आप मिट जाएगा.
सिस्टम, इंटरैक्शन ऑब्जेक्ट को शर्तों के मुताबिक प्रोसेस करता है.
सबसे सही तरीके
- कैश हिट रेट: बातचीत जारी रखने के लिए
previous_interaction_idका इस्तेमाल करने से, सिस्टम बातचीत के इतिहास के लिए, इंप्लिसिट कैश मेमोरी में सेव करने की सुविधा का आसानी से इस्तेमाल कर पाता है. इससे परफ़ॉर्मेंस बेहतर होती है और लागत कम होती है. - इंटरैक्शन मिक्स करना: आपके पास बातचीत में, एजेंट और
मॉडल के इंटरैक्शन को मिक्स और मैच करने की सुविधा होती है. उदाहरण के लिए, शुरुआती डेटा कलेक्शन के लिए, Deep Research एजेंट जैसे खास एजेंट का इस्तेमाल किया जा सकता है. इसके बाद, फ़ॉलो-अप टास्क के लिए, स्टैंडर्ड Gemini मॉडल का इस्तेमाल किया जा सकता है. जैसे, खास जानकारी देना या फ़ॉर्मैट बदलना. इन स्टेप को
previous_interaction_idसे लिंक किया जा सकता है.
काम करने वाले मॉडल और एजेंट
| मॉडल का नाम | टाइप | मॉडल आईडी |
|---|---|---|
| Gemini 3.1 Flash-Lite | मॉडल | gemini-3.1-flash-lite |
| Gemini 3.1 Flash-Lite की झलक | मॉडल | gemini-3.1-flash-lite-preview |
| Gemini 3.1 Pro की झलक | मॉडल | gemini-3.1-pro-preview |
| Gemini 3 Flash की झलक | मॉडल | gemini-3-flash-preview |
| Gemini 2.5 Pro | मॉडल | gemini-2.5-pro |
| Gemini 2.5 Flash | मॉडल | gemini-2.5-flash |
| Gemini 2.5 Flash-lite | मॉडल | gemini-2.5-flash-lite |
| Lyria 3 Clip की झलक | मॉडल | lyria-3-clip-preview |
| Lyria 3 Pro की झलक | मॉडल | lyria-3-pro-preview |
| Deep Research की झलक | एजेंट | deep-research-pro-preview-12-2025 |
| Deep Research की झलक | एजेंट | deep-research-preview-04-2026 |
| Deep Research की झलक | एजेंट | deep-research-max-preview-04-2026 |
SDK
Interactions API को ऐक्सेस करने के लिए, Google GenAI SDK के सबसे नए वर्शन का इस्तेमाल किया जा सकता है.
- Python पर, यह
google-genaiपैकेज,1.55.0वर्शन से उपलब्ध है. - JavaScript पर, यह
@google/genaiपैकेज,1.33.0वर्शन से उपलब्ध है.
लाइब्रेरी वाले पेज पर, एसडीके इंस्टॉल करने के तरीके के बारे में ज़्यादा जानें.
सीमाएं
- बीटा वर्शन: Interactions API, बीटा/प्रीव्यू वर्शन में उपलब्ध है. इसकी सुविधाओं और स्कीमा में बदलाव हो सकता है.
- रिमोट एमसीपी: Gemini 3, रिमोट एमसीपी के साथ काम नहीं करता. यह सुविधा जल्द ही उपलब्ध होगी.
generateContent API, इन सुविधाओं के साथ काम करता है. हालांकि, ये सुविधाएं फ़िलहाल Interactions API में उपलब्ध नहीं हैं:
- वीडियो का मेटाडेटा:
video_metadataफ़ील्ड का इस्तेमाल, वीडियो को समझने के लिए क्लिपिंग इंटरवल और कस्टम फ़्रेम रेट सेट करने के लिए किया जाता है. - बैच एपीआई
- फ़ंक्शन कॉल करने की सुविधा (Python)
- साफ़ तौर पर कैश मेमोरी में सेव करने की सुविधा: ध्यान दें कि Interactions API
में, सर्वर-साइड इंप्लिसिट कैश मेमोरी में सेव करने की सुविधा,
previous_interaction_idके ज़रिए उपलब्ध है.
नुकसान पहुंचाने वाले बदलाव
Interactions API फ़िलहाल, शुरुआती बीटा स्टेज में है. हम असल दुनिया में इस्तेमाल और डेवलपर के सुझाव/शिकायत/राय के आधार पर, एपीआई की क्षमताओं, संसाधन स्कीमा, और एसडीके इंटरफ़ेस को लगातार डेवलप और बेहतर बना रहे हैं.
इस वजह से, नुकसान पहुंचाने वाले बदलाव हो सकते हैं. अपडेट में, इनमें बदलाव शामिल हो सकते हैं:
- इनपुट और आउटपुट के स्कीमा.
- एसडीके के तरीके के सिग्नेचर और ऑब्जेक्ट स्ट्रक्चर.
- किसी खास सुविधा के बिहेवियर.
प्रोडक्शन वर्कलोड के लिए, आपको स्टैंडर्ड
generateContent API का इस्तेमाल जारी रखना चाहिए. यह, स्टेबल डिप्लॉयमेंट के लिए सुझाया गया तरीका है. हम इसे लगातार डेवलप और बनाए रखेंगे.
सुझाव/राय दें या शिकायत करें
Interactions API को बेहतर बनाने के लिए, आपका सुझाव/राय या शिकायत अहम है. Google AI डेवलपर कम्यूनिटी फ़ोरम पर, अपने विचार शेयर करें, बग की रिपोर्ट करें या सुविधाओं का अनुरोध करें.
आगे क्या करना है
- Interactions API क्विकस्टार्ट नोटबुक को आज़माएं.
- Gemini Deep Research एजेंट के बारे में ज़्यादा जानें.