Gemini 3.1 Flash Live Preview هو نموذج منخفض وقت الاستجابة من الصوت إلى الصوت، وهو محسّن للتواصل في الوقت الفعلي وتطبيقات الذكاء الاصطناعي التي تعتمد على الصوت، مع إمكانية رصد الفروق الدقيقة الصوتية، والدقة العددية، والوعي المتعدّد الوسائط.
الوثائق
يمكنك الانتقال إلى دليل Live API للاطّلاع على التغطية الكاملة للميزات والإمكانات.
gemini-3.1-flash-live-preview
| الموقع | الوصف |
|---|---|
| رمز النموذج |
gemini-3.1-flash-live-preview
|
| أنواع البيانات المتوافقة |
المدخلات النصوص والصور والمحتوى الصوتي والفيديوهات الناتج النص والصوت |
| حدود الرموز المميزة[*] |
الحدّ الأقصى لعدد الرموز المميزة التي يمكن إدخالها 131,072 الحد الأقصى لعدد الرموز المميزة في الناتج 65,536 |
| الإمكانات |
إنشاء الصوت متاح Batch API غير متاح التخزين المؤقت غير متاح تنفيذ الرمز غير متاح البحث عن الملفات غير متاح استدعاء الدوال متاح استخدام "خرائط Google" كمصدر غير متاح إنشاء الصور غير متاح Live API متاح تحديد المصادر في "بحث Google" متاح المخرجات المنظَّمة غير متاح التفكير متاح سياق عنوان URL غير متاح |
| إصدارات |
|
| آخر تعديل | مارس 2026 |
| تاريخ آخر تحديث للبيانات | يناير 2025 |
نقل البيانات من Gemini 2.5 Flash Live
تم تحسين ميزة "المعاينة المباشرة" في Gemini 3.1 Flash لإجراء حوار في الوقت الفعلي وبوقت استجابة منخفض.
عند نقل البيانات من gemini-2.5-flash-native-audio-preview-12-2025، يجب مراعاة ما يلي:
- سلسلة النموذج: عدِّل سلسلة النموذج من
gemini-2.5-flash-native-audio-preview-12-2025إلىgemini-3.1-flash-live-preview. - إعدادات التفكير: يستخدم Gemini 3.1
thinkingLevel(مع إعدادات مثلminimalوlowوmediumوhigh) بدلاً منthinkingBudget. القيمة التلقائية هيminimalلتحسين وقت الاستجابة إلى أدنى حدّ. يمكنك الاطّلاع على مستويات التفكير والميزانيات. - أحداث الخادم: يمكن أن يحتوي حدث واحد
BidiGenerateContentServerContentالآن على أجزاء متعدّدة من المحتوى في الوقت نفسه (على سبيل المثال، مقاطع صوتية ونص). عدِّل الرمز البرمجي لمعالجة جميع الأجزاء في كل حدث لتجنُّب فقدان المحتوى. - محتوى العميل: لا تتوفّر السمة
send_client_contentإلا لإنشاء سجلّ سياق أولي (يتطلّب ذلك ضبطinitial_history_in_client_contentفيhistory_config). استخدِمsend_realtime_inputلإرسال تعديلات نصية أثناء المحادثة. يمكنك الاطّلاع على تعديلات المحتوى التدريجية. - معدّل التغطية: القيمة التلقائية هي
TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEOبدلاً منTURN_INCLUDES_ONLY_ACTIVITY. يتضمّن دور النموذج الآن نشاطًا صوتيًا تم رصده وجميع إطارات الفيديو. إذا كان تطبيقك يرسل حاليًا بثًا مستمرًا للقطات الفيديو، ننصحك بتعديل تطبيقك لإرسال لقطات الفيديو فقط عند توفّر نشاط صوتي لتجنُّب تكبُّد تكاليف إضافية. - استدعاء الدوال غير المتزامنة: غير متاح بعد. تتوفّر ميزة "استدعاء الدالة" بشكل متزامن فقط. لن يبدأ النموذج في الردّ إلى أن ترسل ردّ الأداة. اطّلِع على استدعاء الدوال غير المتزامنة.
- الصوت الاستباقي والحوار العاطفي: هاتان الميزتان غير متاحتَين بعد في Gemini 3.1 Flash Live. أزِل أي إعدادات لهذه الميزات من الرمز. اطّلِع على الصوت الاستباقي والحوار العاطفي.
للحصول على مقارنة تفصيلية بين الميزات، يُرجى الاطّلاع على جدول مقارنة النماذج في دليل الإمكانات.