Gemini 3.1 Flash Live Preview هو نموذج منخفض وقت الاستجابة يحوّل الصوت إلى صوت، وهو محسّن للحوار في الوقت الفعلي وتطبيقات الذكاء الاصطناعي التي تعتمد على الصوت أولاً، مع رصد الفروقات الدقيقة الصوتية والدقة العددية والوعي المتعدد الوسائط.
الوثائق
يُرجى الانتقال إلى دليل Live API للاطّلاع على تغطية كاملة للميزات والإمكانات.
gemini-3.1-flash-live-preview
| الموقع | الوصف |
|---|---|
| رمز النموذج |
gemini-3.1-flash-live-preview
|
| أنواع البيانات المتوافقة |
المدخلات النص والصور والصوت والفيديو الناتج النص والصوت |
| حدود الرموز المميّزة[*] |
الحد الأقصى للرموز المميّزة للإدخال 131,072 الحد الأقصى للرموز المميّزة للإخراج 65,536 |
| الإمكانات |
متاح غير متاح غير متاح غير متاح متاح غير متاح غير متاح متاح لتحديد المصادر في "بحث Google" متاح غير متاح متاح غير متاح |
| خيارات الاستهلاك |
غير متاح |
| الإصدارات |
|
| آخر تعديل | مارس 2026 |
| تاريخ آخر تحديث للبيانات | يناير 2025 |
نقل البيانات من Gemini 2.5 Flash Live
Gemini 3.1 Flash Live Preview محسّن للحوار في الوقت الفعلي ومنخفض وقت الاستجابة.
عند نقل البيانات من gemini-2.5-flash-native-audio-preview-12-2025، يُرجى مراعاة ما يلي:
- سلسلة النموذج: يُرجى تعديل سلسلة النموذج من
gemini-2.5-flash-native-audio-preview-12-2025إلىgemini-3.1-flash-live-preview. - إعدادات طريقة التفكير: يستخدم Gemini 3.1 السمة
thinkingLevel(مع إعدادات مثلminimalوlowوmediumوhigh) بدلاً منthinkingBudget. الإعداد التلقائي هوminimalلتحسين وقت الاستجابة إلى أدنى مستوى. يُرجى الاطّلاع على مستويات طريقة التفكير وميزانياتها. - أحداث الخادم: يمكن أن يحتوي حدث
BidiGenerateContentServerContentواحد الآن على أجزاء متعدّدة من المحتوى في الوقت نفسه (على سبيل المثال، أجزاء الصوت والنسخة النصية). يُرجى تعديل الرمز البرمجي لمعالجة جميع الأجزاء في كل حدث لتجنُّب فقدان المحتوى. - محتوى العميل: لا تتوفّر السمة
send_client_contentإلا لملء سجلّ سياق المحتوى الأولي (يتطلّب ذلك ضبطinitial_history_in_client_contentفيhistory_config). يُرجى استخدامsend_realtime_inputلإرسال تعديلات نصية أثناء المحادثة. يُرجى الاطّلاع على التعديلات المتزايدة على المحتوى. - تغطية الدور: يتم ضبطها تلقائيًا على
TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEOبدلاً منTURN_INCLUDES_ONLY_ACTIVITY. يتضمّن دور النموذج الآن النشاط الصوتي الذي تم رصده وجميع إطارات الفيديو. إذا كان تطبيقك يرسل حاليًا دفقًا ثابتًا من إطارات الفيديو، قد يكون من الأفضل تعديل تطبيقك لإرسال إطارات الفيديو فقط عند حدوث نشاط صوتي لتجنُّب تكبّد تكاليف إضافية. - استدعاء الوظائف غير المتزامن: غير متاح بعد. لا يتوفّر استدعاء الوظائف إلا بشكل متزامن. لن يبدأ النموذج في الردّ إلى أن ترسل ردّ الأداة. يُرجى الاطّلاع على استدعاء الوظائف غير المتزامن.
- الصوت الاستباقي والحوار العاطفي: لا تتوفّر هاتان الميزتان بعد في Gemini 3.1 Flash Live. يُرجى إزالة أي إعدادات لهاتين الميزتين من الرمز البرمجي. يُرجى الاطّلاع على الصوت الاستباقي و الحوار العاطفي.
لمقارنة الميزات بالتفصيل، يُرجى الاطّلاع على جدول مقارنة النماذج في دليل الإمكانات.