Interactions API अब सामान्य तौर पर उपलब्ध है. हमारा सुझाव है कि सभी नई सुविधाओं और मॉडल का ऐक्सेस पाने के लिए, इस एपीआई का इस्तेमाल करें.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini 3.1 Flash की लाइव बातचीत की सुविधा की झलक

Gemini 3.1 Flash Live Preview, कम इंतज़ार के समय वाला ऑडियो-टू-ऑडियो मॉडल है. इसे रीयल-टाइम में बातचीत और आवाज़ से कंट्रोल होने वाले एआई ऐप्लिकेशन के लिए ऑप्टिमाइज़ किया गया है. इसमें आवाज़ की बारीकियों का पता लगाने, सटीक संख्याएं बताने, और मल्टीमॉडल की जानकारी देने की क्षमता है.

Google AI Studio में आज़माएं

दस्तावेज़

सुविधाओं और क्षमताओं के बारे में पूरी जानकारी पाने के लिए, Live API की गाइड देखें.

gemini-3.1-flash-live-preview

प्रॉपर्टी	ब्यौरा
Model code	`gemini-3.1-flash-live-preview`
Supported data types	इनपुट टेक्स्ट, इमेज, ऑडियो, वीडियो आउटपुट टेक्स्ट और ऑडियो
Token limits^[*]	इनपुट टोकन की सीमा 1,31,072 आउटपुट टोकन की सीमा 65,536
Capabilities	ऑडियो जनरेट करने की सुविधा काम करता है कैश मेमोरी में सेव होना काम नहीं करता है कोड एक्ज़ीक्यूशन काम नहीं करता है फ़ाइल सर्च काम नहीं करता है फ़ंक्शन कॉल काम करता है Google Maps के साथ भरोसेमंद स्रोतों से जानकारी लें काम नहीं करता है इमेज जनरेट करने की सुविधा काम नहीं करता है Live API काम करता है भरोसेमंद स्रोतों से जानकारी लें काम करता है स्ट्रक्चर्ड आउटपुट काम नहीं करता है प्रोसेस काम करता है यूआरएल कॉन्टेक्स्ट काम नहीं करता है
Consumption options	Batch API काम नहीं करता है
Versions	ज़्यादा जानकारी के लिए, मॉडल के वर्शन के पैटर्न पढ़ें. झलक देखें: `gemini-3.1-flash-live-preview`
Latest update	मार्च 2026
Knowledge cutoff	जनवरी 2025

Gemini 2.5 Flash Live से माइग्रेट करना

Gemini 3.1 Flash Live Preview को कम इंतज़ार के समय और रीयल-टाइम में बातचीत के लिए ऑप्टिमाइज़ किया गया है. gemini-2.5-flash-native-audio-preview-12-2025 से माइग्रेट करते समय, इन बातों का ध्यान रखें:

मॉडल स्ट्रिंग: अपनी मॉडल स्ट्रिंग को gemini-2.5-flash-native-audio-preview-12-2025 से बदलकर gemini-3.1-flash-live-preview करें.
प्रोसेस कॉन्फ़िगरेशन: Gemini 3.1, thinkingBudget के बजाय thinkingLevel का इस्तेमाल करता है. इसमें minimal, low, medium, और high जैसी सेटिंग होती हैं. सबसे कम इंतज़ार के समय के लिए ऑप्टिमाइज़ करने के लिए, डिफ़ॉल्ट सेटिंग minimal होती है. प्रोसेस के लेवल और बजट देखें .
सर्वर इवेंट: अब एक BidiGenerateContentServerContent इवेंट में एक साथ, कॉन्टेंट के कई हिस्से शामिल किए जा सकते हैं. जैसे, ऑडियो के हिस्से और ट्रांसक्रिप्ट. कॉन्टेंट के किसी भी हिस्से को न छोड़ने के लिए, हर इवेंट में सभी हिस्सों को प्रोसेस करने के लिए अपना कोड अपडेट करें.
क्लाइंट कॉन्टेंट: send_client_content की सुविधा, शुरुआती कॉन्टेक्स्ट इतिहास को सीड करने के लिए ही काम करती है. इसके लिए, initial_history_in_client_content में history_config सेट करना ज़रूरी है. बातचीत के दौरान टेक्स्ट अपडेट भेजने के लिए, send_realtime_input का इस्तेमाल करें. कॉन्टेंट के इंक्रीमेंटल अपडेट देखें .
टर्न कवरेज: डिफ़ॉल्ट रूप से, TURN_INCLUDES_ONLY_ACTIVITY के बजाय TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO सेट होता है. मॉडल के टर्न में अब, ऑडियो गतिविधि और वीडियो के सभी फ़्रेम शामिल होते हैं. अगर आपका ऐप्लिकेशन फ़िलहाल वीडियो फ़्रेम की लगातार स्ट्रीम भेजता है, तो आपको अपना ऐप्लिकेशन अपडेट करना पड़ सकता है, ताकि वह सिर्फ़ ऑडियो गतिविधि होने पर ही वीडियो फ़्रेम भेजे. इससे अतिरिक्त लागत से बचा जा सकता है.
एसिंक्रोनस फ़ंक्शन कॉल: यह सुविधा फ़िलहाल उपलब्ध नहीं है. फ़ंक्शन कॉल सिर्फ़ सिंक्रोनस होता है. जब तक टूल का जवाब नहीं भेजा जाता, तब तक मॉडल जवाब देना शुरू नहीं करेगा. एसिंक्रोनस फ़ंक्शन कॉल देखें .
प्रोऐक्टिव ऑडियो और अफ़ेक्टिव डायलॉग: ये सुविधाएं, फ़िलहाल Gemini 3.1 Flash Live में उपलब्ध नहीं हैं. अपने कोड से, इन सुविधाओं के लिए कोई भी कॉन्फ़िगरेशन हटाएं. प्रोऐक्टिव ऑडियो और अफ़ेक्टिव डायलॉग देखें.

सुविधाओं की तुलना करने के बारे में ज़्यादा जानने के लिए, क्षमताओं की गाइड में मॉडल की तुलना करने वाली टेबल देखें.