معاينة Gemini 3.1 Flash Live

‫Gemini 3.1 Flash Live Preview هو نموذج منخفض وقت الاستجابة يحوّل الصوت إلى صوت، وهو محسّن للحوار في الوقت الفعلي وتطبيقات الذكاء الاصطناعي التي تعتمد على الصوت أولاً، مع رصد الفروقات الدقيقة الصوتية والدقة العددية والوعي المتعدد الوسائط.

الوثائق

يُرجى الانتقال إلى دليل Live API للاطّلاع على تغطية كاملة للميزات والإمكانات.

gemini-3.1-flash-live-preview

الموقع الوصف
رمز النموذج gemini-3.1-flash-live-preview
أنواع البيانات المتوافقة

المدخلات

النص والصور والصوت والفيديو

الناتج

النص والصوت

حدود الرموز المميّزة[*]

الحد الأقصى للرموز المميّزة للإدخال

131,072

الحد الأقصى للرموز المميّزة للإخراج

65,536

الإمكانات

إنشاء الصوت

متاح

التخزين المؤقت

غير متاح

تنفيذ الرموز البرمجية

غير متاح

البحث عن الملفات

غير متاح

استدعاء الوظائف

متاح

استخدام "خرائط Google" كمصدر

غير متاح

إنشاء الصور

غير متاح

**Live API**

متاح

لتحديد المصادر في "بحث Google"

متاح

مُخرجات منظَّمة

غير متاح

طريقة التفكير

متاح

سياق عنوان URL

غير متاح

خيارات الاستهلاك

‫**Batch API**

غير متاح

الإصدارات
يُرجى قراءة أنماط إصدارات النماذج لمزيد من التفاصيل.
  • معاينة: gemini-3.1-flash-live-preview
آخر تعديل مارس 2026
تاريخ آخر تحديث للبيانات يناير 2025

نقل البيانات من Gemini 2.5 Flash Live

‫Gemini 3.1 Flash Live Preview محسّن للحوار في الوقت الفعلي ومنخفض وقت الاستجابة. عند نقل البيانات من gemini-2.5-flash-native-audio-preview-12-2025، يُرجى مراعاة ما يلي:

  • سلسلة النموذج: يُرجى تعديل سلسلة النموذج من gemini-2.5-flash-native-audio-preview-12-2025 إلى gemini-3.1-flash-live-preview.
  • إعدادات طريقة التفكير: يستخدم Gemini 3.1 السمة thinkingLevel (مع إعدادات مثل minimal وlow وmedium وhigh) بدلاً من thinkingBudget. الإعداد التلقائي هو minimal لتحسين وقت الاستجابة إلى أدنى مستوى. يُرجى الاطّلاع على مستويات طريقة التفكير وميزانياتها.
  • أحداث الخادم: يمكن أن يحتوي حدث BidiGenerateContentServerContent واحد الآن على أجزاء متعدّدة من المحتوى في الوقت نفسه (على سبيل المثال، أجزاء الصوت والنسخة النصية). يُرجى تعديل الرمز البرمجي لمعالجة جميع الأجزاء في كل حدث لتجنُّب فقدان المحتوى.
  • محتوى العميل: لا تتوفّر السمة send_client_content إلا لملء سجلّ سياق المحتوى الأولي (يتطلّب ذلك ضبط initial_history_in_client_content في history_config). يُرجى استخدام send_realtime_input لإرسال تعديلات نصية أثناء المحادثة. يُرجى الاطّلاع على التعديلات المتزايدة على المحتوى.
  • تغطية الدور: يتم ضبطها تلقائيًا على TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO بدلاً من TURN_INCLUDES_ONLY_ACTIVITY. يتضمّن دور النموذج الآن النشاط الصوتي الذي تم رصده وجميع إطارات الفيديو. إذا كان تطبيقك يرسل حاليًا دفقًا ثابتًا من إطارات الفيديو، قد يكون من الأفضل تعديل تطبيقك لإرسال إطارات الفيديو فقط عند حدوث نشاط صوتي لتجنُّب تكبّد تكاليف إضافية.
  • استدعاء الوظائف غير المتزامن: غير متاح بعد. لا يتوفّر استدعاء الوظائف إلا بشكل متزامن. لن يبدأ النموذج في الردّ إلى أن ترسل ردّ الأداة. يُرجى الاطّلاع على استدعاء الوظائف غير المتزامن.
  • الصوت الاستباقي والحوار العاطفي: لا تتوفّر هاتان الميزتان بعد في Gemini 3.1 Flash Live. يُرجى إزالة أي إعدادات لهاتين الميزتين من الرمز البرمجي. يُرجى الاطّلاع على الصوت الاستباقي و الحوار العاطفي.

لمقارنة الميزات بالتفصيل، يُرجى الاطّلاع على جدول مقارنة النماذج في دليل الإمكانات.