Gemini 3.1 Flash Live Preview, कम इंतज़ार के समय वाला ऑडियो-टू-ऑडियो मॉडल है. इसे रीयल-टाइम में बातचीत और आवाज़ से कंट्रोल होने वाले एआई ऐप्लिकेशन के लिए ऑप्टिमाइज़ किया गया है. इसमें आवाज़ की बारीकियों का पता लगाने, सटीक संख्याएं बताने, और मल्टीमॉडल की जानकारी देने की क्षमता है.
दस्तावेज़
सुविधाओं और क्षमताओं के बारे में पूरी जानकारी पाने के लिए, Live API की गाइड देखें.
gemini-3.1-flash-live-preview
| प्रॉपर्टी | ब्यौरा |
|---|---|
| Model code |
gemini-3.1-flash-live-preview
|
| Supported data types |
इनपुट टेक्स्ट, इमेज, ऑडियो, वीडियो आउटपुट टेक्स्ट और ऑडियो |
| Token limits[*] |
इनपुट टोकन की सीमा 1,31,072 आउटपुट टोकन की सीमा 65,536 |
| Capabilities |
काम करता है काम नहीं करता है काम नहीं करता है काम नहीं करता है काम करता है Google Maps के साथ भरोसेमंद स्रोतों से जानकारी लें काम नहीं करता है काम नहीं करता है काम करता है भरोसेमंद स्रोतों से जानकारी लें काम करता है काम नहीं करता है काम करता है काम नहीं करता है |
| Consumption options |
काम नहीं करता है |
| Versions |
|
| Latest update | मार्च 2026 |
| Knowledge cutoff | जनवरी 2025 |
Gemini 2.5 Flash Live से माइग्रेट करना
Gemini 3.1 Flash Live Preview को कम इंतज़ार के समय और रीयल-टाइम में बातचीत के लिए ऑप्टिमाइज़ किया गया है.
gemini-2.5-flash-native-audio-preview-12-2025 से माइग्रेट करते समय, इन बातों का ध्यान रखें:
- मॉडल स्ट्रिंग: अपनी मॉडल स्ट्रिंग को
gemini-2.5-flash-native-audio-preview-12-2025से बदलकरgemini-3.1-flash-live-previewकरें. - प्रोसेस कॉन्फ़िगरेशन: Gemini 3.1,
thinkingBudgetके बजायthinkingLevelका इस्तेमाल करता है. इसमेंminimal,low,medium, औरhighजैसी सेटिंग होती हैं. सबसे कम इंतज़ार के समय के लिए ऑप्टिमाइज़ करने के लिए, डिफ़ॉल्ट सेटिंगminimalहोती है. प्रोसेस के लेवल और बजट देखें . - सर्वर इवेंट: अब एक
BidiGenerateContentServerContentइवेंट में एक साथ, कॉन्टेंट के कई हिस्से शामिल किए जा सकते हैं. जैसे, ऑडियो के हिस्से और ट्रांसक्रिप्ट. कॉन्टेंट के किसी भी हिस्से को न छोड़ने के लिए, हर इवेंट में सभी हिस्सों को प्रोसेस करने के लिए अपना कोड अपडेट करें. - क्लाइंट कॉन्टेंट:
send_client_contentकी सुविधा, शुरुआती कॉन्टेक्स्ट इतिहास को सीड करने के लिए ही काम करती है. इसके लिए,initial_history_in_client_contentमेंhistory_configसेट करना ज़रूरी है. बातचीत के दौरान टेक्स्ट अपडेट भेजने के लिए,send_realtime_inputका इस्तेमाल करें. कॉन्टेंट के इंक्रीमेंटल अपडेट देखें . - टर्न कवरेज: डिफ़ॉल्ट रूप से,
TURN_INCLUDES_ONLY_ACTIVITYके बजायTURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEOसेट होता है. मॉडल के टर्न में अब, ऑडियो गतिविधि और वीडियो के सभी फ़्रेम शामिल होते हैं. अगर आपका ऐप्लिकेशन फ़िलहाल वीडियो फ़्रेम की लगातार स्ट्रीम भेजता है, तो आपको अपना ऐप्लिकेशन अपडेट करना पड़ सकता है, ताकि वह सिर्फ़ ऑडियो गतिविधि होने पर ही वीडियो फ़्रेम भेजे. इससे अतिरिक्त लागत से बचा जा सकता है. - एसिंक्रोनस फ़ंक्शन कॉल: यह सुविधा फ़िलहाल उपलब्ध नहीं है. फ़ंक्शन कॉल सिर्फ़ सिंक्रोनस होता है. जब तक टूल का जवाब नहीं भेजा जाता, तब तक मॉडल जवाब देना शुरू नहीं करेगा. एसिंक्रोनस फ़ंक्शन कॉल देखें .
- प्रोऐक्टिव ऑडियो और अफ़ेक्टिव डायलॉग: ये सुविधाएं, फ़िलहाल Gemini 3.1 Flash Live में उपलब्ध नहीं हैं. अपने कोड से, इन सुविधाओं के लिए कोई भी कॉन्फ़िगरेशन हटाएं. प्रोऐक्टिव ऑडियो और अफ़ेक्टिव डायलॉग देखें.
सुविधाओं की तुलना करने के बारे में ज़्यादा जानने के लिए, क्षमताओं की गाइड में मॉडल की तुलना करने वाली टेबल देखें.