Gemini 3.1 Flash Live Preview هو نموذج من نوع "صوت إلى صوت" يتميّز بزمن استجابة منخفض، وهو محسّن للحوار في الوقت الفعلي وتطبيقات الذكاء الاصطناعي التي تعتمد على الصوت أولاً، مع رصد الفروقات الصوتية الدقيقة والتعرّف على الأرقام بدقة والوعي بالوسائط المتعددة.
الوثائق
يُرجى الانتقال إلى دليل Live API للاطّلاع على تغطية كاملة للميزات والإمكانات.
gemini-3.1-flash-live-preview
| الموقع | الوصف |
|---|---|
| رمز النموذج |
gemini-3.1-flash-live-preview
|
| أنواع البيانات المتوافقة |
المدخلات نص وصور وصوت وفيديو الناتج نص وصوت |
| حدود الرموز المميزة[*] |
الحد الأقصى للرموز المميزة للإدخال 131,072 الحد الأقصى للرموز المميزة للإخراج 65,536 |
| الإمكانات |
إنشاء الصوت متاح Batch API غير متاح التخزين المؤقت غير متاح تنفيذ الرموز البرمجية غير متاح البحث عن الملفات غير متاح استدعاء الوظائف متاح استخدام "خرائط Google" كمصدر غير متاح إنشاء الصور غير متاح Live API متاح لتحديد المصادر في "بحث Google" متاح مُخرجات منظَّمة غير متاح طريقة التفكير متاح سياق عنوان URL غير متاح |
| الإصدارات |
|
| آخر تعديل | مارس 2026 |
| تاريخ آخر تحديث للبيانات | يناير 2025 |
نقل البيانات من Gemini 2.5 Flash Live
Gemini 3.1 Flash Live Preview محسّن للحوار في الوقت الفعلي بزمن استجابة منخفض.
عند نقل البيانات من gemini-2.5-flash-native-audio-preview-12-2025، يُرجى مراعاة ما يلي:
- سلسلة النموذج: يُرجى تعديل سلسلة النموذج من
gemini-2.5-flash-native-audio-preview-12-2025إلىgemini-3.1-flash-live-preview. - إعدادات طريقة التفكير: يستخدم Gemini 3.1 السمة
thinkingLevel(مع إعدادات مثلminimalوlowوmediumوhigh) بدلاً منthinkingBudget. الإعداد التلقائي هوminimalلتحسين زمن الاستجابة الأقل. يُرجى الاطّلاع على مستويات طريقة التفكير وميزانياتها. - أحداث الخادم: يمكن أن يحتوي حدث
BidiGenerateContentServerContentواحد الآن على أجزاء متعدّدة من المحتوى في الوقت نفسه (على سبيل المثال، أجزاء صوتية ونسخة نصية). يُرجى تعديل الرمز البرمجي لمعالجة جميع الأجزاء في كل حدث لتجنُّب فقدان المحتوى. - محتوى العميل: لا تتوفّر السمة
send_client_contentإلا لملء سجلّ سياق المحادثة الأولي (يتطلّب ذلك ضبطinitial_history_in_client_contentفيhistory_config). يُرجى استخدامsend_realtime_inputلإرسال تعديلات نصية أثناء المحادثة. يُرجى الاطّلاع على التعديلات المتزايدة على المحتوى. - تغطية المحادثة: يتم ضبطها تلقائيًا على
TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEOبدلاً منTURN_INCLUDES_ONLY_ACTIVITY. تتضمّن المحادثة في النموذج الآن النشاط الصوتي الذي تم رصده وجميع إطارات الفيديو. إذا كان تطبيقك يرسل حاليًا دفقًا ثابتًا من إطارات الفيديو، قد يكون من الأفضل تعديل تطبيقك لإرسال إطارات الفيديو فقط عند حدوث نشاط صوتي لتجنُّب تكبّد تكاليف إضافية. - استدعاء الوظائف غير المتزامن: غير متاح بعد. لا يتوفّر استدعاء الوظائف إلا بشكل متزامن. لن يبدأ النموذج في الردّ إلى أن ترسل ردّ الأداة. يُرجى الاطّلاع على استدعاء الوظائف غير المتزامن.
- الصوت الاستباقي والحوار العاطفي: لا تتوفّر هاتان الميزتان بعد في Gemini 3.1 Flash Live. يُرجى إزالة أي إعدادات لهاتين الميزتين من الرمز البرمجي. يُرجى الاطّلاع على الصوت الاستباقي و الحوار العاطفي.
لمقارنة الميزات بالتفصيل، يُرجى الاطّلاع على جدول مقارنة النماذج في دليل الإمكانات.