Gemini 3.1 Flash की लाइव बातचीत की सुविधा की झलक

Gemini 3.1 Flash Live Preview, कम इंतज़ार के समय वाला ऑडियो-टू-ऑडियो मॉडल है. इसे रीयल-टाइम में बातचीत और आवाज़ से कंट्रोल होने वाले एआई ऐप्लिकेशन के लिए ऑप्टिमाइज़ किया गया है. इसमें आवाज़ की बारीकियों का पता लगाने, सटीक संख्याएं बताने, और मल्टीमॉडल की जानकारी देने की क्षमता है.

दस्तावेज़

सुविधाओं और क्षमताओं के बारे में पूरी जानकारी पाने के लिए, Live API की गाइड देखें.

gemini-3.1-flash-live-preview

प्रॉपर्टी ब्यौरा
Model code gemini-3.1-flash-live-preview
Supported data types

इनपुट

टेक्स्ट, इमेज, ऑडियो, वीडियो

आउटपुट

टेक्स्ट और ऑडियो

Token limits[*]

इनपुट टोकन की सीमा

1,31,072

आउटपुट टोकन की सीमा

65,536

Capabilities

ऑडियो जनरेट करने की सुविधा

काम करता है

कैश मेमोरी में सेव होना

काम नहीं करता है

कोड एक्ज़ीक्यूशन

काम नहीं करता है

फ़ाइल सर्च

काम नहीं करता है

फ़ंक्शन कॉल

काम करता है

Google Maps के साथ भरोसेमंद स्रोतों से जानकारी लें

काम नहीं करता है

इमेज जनरेट करने की सुविधा

काम नहीं करता है

Live API

काम करता है

भरोसेमंद स्रोतों से जानकारी लें

काम करता है

स्ट्रक्चर्ड आउटपुट

काम नहीं करता है

प्रोसेस

काम करता है

यूआरएल कॉन्टेक्स्ट

काम नहीं करता है

Consumption options

Batch API

काम नहीं करता है

Versions
ज़्यादा जानकारी के लिए, मॉडल के वर्शन के पैटर्न पढ़ें.
  • झलक देखें: gemini-3.1-flash-live-preview
Latest update मार्च 2026
Knowledge cutoff जनवरी 2025

Gemini 2.5 Flash Live से माइग्रेट करना

Gemini 3.1 Flash Live Preview को कम इंतज़ार के समय और रीयल-टाइम में बातचीत के लिए ऑप्टिमाइज़ किया गया है. gemini-2.5-flash-native-audio-preview-12-2025 से माइग्रेट करते समय, इन बातों का ध्यान रखें:

  • मॉडल स्ट्रिंग: अपनी मॉडल स्ट्रिंग को gemini-2.5-flash-native-audio-preview-12-2025 से बदलकर gemini-3.1-flash-live-preview करें.
  • प्रोसेस कॉन्फ़िगरेशन: Gemini 3.1, thinkingBudget के बजाय thinkingLevel का इस्तेमाल करता है. इसमें minimal, low, medium, और high जैसी सेटिंग होती हैं. सबसे कम इंतज़ार के समय के लिए ऑप्टिमाइज़ करने के लिए, डिफ़ॉल्ट सेटिंग minimal होती है. प्रोसेस के लेवल और बजट देखें .
  • सर्वर इवेंट: अब एक BidiGenerateContentServerContent इवेंट में एक साथ, कॉन्टेंट के कई हिस्से शामिल किए जा सकते हैं. जैसे, ऑडियो के हिस्से और ट्रांसक्रिप्ट. कॉन्टेंट के किसी भी हिस्से को न छोड़ने के लिए, हर इवेंट में सभी हिस्सों को प्रोसेस करने के लिए अपना कोड अपडेट करें.
  • क्लाइंट कॉन्टेंट: send_client_content की सुविधा, शुरुआती कॉन्टेक्स्ट इतिहास को सीड करने के लिए ही काम करती है. इसके लिए, initial_history_in_client_content में history_config सेट करना ज़रूरी है. बातचीत के दौरान टेक्स्ट अपडेट भेजने के लिए, send_realtime_input का इस्तेमाल करें. कॉन्टेंट के इंक्रीमेंटल अपडेट देखें .
  • टर्न कवरेज: डिफ़ॉल्ट रूप से, TURN_INCLUDES_ONLY_ACTIVITY के बजाय TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO सेट होता है. मॉडल के टर्न में अब, ऑडियो गतिविधि और वीडियो के सभी फ़्रेम शामिल होते हैं. अगर आपका ऐप्लिकेशन फ़िलहाल वीडियो फ़्रेम की लगातार स्ट्रीम भेजता है, तो आपको अपना ऐप्लिकेशन अपडेट करना पड़ सकता है, ताकि वह सिर्फ़ ऑडियो गतिविधि होने पर ही वीडियो फ़्रेम भेजे. इससे अतिरिक्त लागत से बचा जा सकता है.
  • एसिंक्रोनस फ़ंक्शन कॉल: यह सुविधा फ़िलहाल उपलब्ध नहीं है. फ़ंक्शन कॉल सिर्फ़ सिंक्रोनस होता है. जब तक टूल का जवाब नहीं भेजा जाता, तब तक मॉडल जवाब देना शुरू नहीं करेगा. एसिंक्रोनस फ़ंक्शन कॉल देखें .
  • प्रोऐक्टिव ऑडियो और अफ़ेक्टिव डायलॉग: ये सुविधाएं, फ़िलहाल Gemini 3.1 Flash Live में उपलब्ध नहीं हैं. अपने कोड से, इन सुविधाओं के लिए कोई भी कॉन्फ़िगरेशन हटाएं. प्रोऐक्टिव ऑडियो और अफ़ेक्टिव डायलॉग देखें.

सुविधाओं की तुलना करने के बारे में ज़्यादा जानने के लिए, क्षमताओं की गाइड में मॉडल की तुलना करने वाली टेबल देखें.