معاينة Gemini 3.1 Flash Live

‫Gemini 3.1 Flash Live Preview هو نموذج منخفض وقت الاستجابة من الصوت إلى الصوت، وهو محسّن للتواصل في الوقت الفعلي وتطبيقات الذكاء الاصطناعي التي تعتمد على الصوت، مع إمكانية رصد الفروق الدقيقة الصوتية، والدقة العددية، والوعي المتعدّد الوسائط.

الوثائق

يمكنك الانتقال إلى دليل Live API للاطّلاع على التغطية الكاملة للميزات والإمكانات.

gemini-3.1-flash-live-preview

الموقع الوصف
رمز النموذج gemini-3.1-flash-live-preview
أنواع البيانات المتوافقة

المدخلات

النصوص والصور والمحتوى الصوتي والفيديوهات

الناتج

النص والصوت

حدود الرموز المميزة[*]

الحدّ الأقصى لعدد الرموز المميزة التي يمكن إدخالها

131,072

الحد الأقصى لعدد الرموز المميزة في الناتج

65,536

الإمكانات

إنشاء الصوت

متاح

Batch API

غير متاح

التخزين المؤقت

غير متاح

تنفيذ الرمز

غير متاح

البحث عن الملفات

غير متاح

استدعاء الدوال

متاح

استخدام "خرائط Google" كمصدر

غير متاح

إنشاء الصور

غير متاح

Live API

متاح

تحديد المصادر في "بحث Google"

متاح

المخرجات المنظَّمة

غير متاح

التفكير

متاح

سياق عنوان URL

غير متاح

إصدارات
يمكنك الاطّلاع على أنماط إصدارات النماذج لمزيد من التفاصيل.
  • معاينة: gemini-3.1-flash-live-preview
آخر تعديل مارس 2026
تاريخ آخر تحديث للبيانات يناير 2025

نقل البيانات من Gemini 2.5 Flash Live

تم تحسين ميزة "المعاينة المباشرة" في Gemini 3.1 Flash لإجراء حوار في الوقت الفعلي وبوقت استجابة منخفض. عند نقل البيانات من gemini-2.5-flash-native-audio-preview-12-2025، يجب مراعاة ما يلي:

  • سلسلة النموذج: عدِّل سلسلة النموذج من gemini-2.5-flash-native-audio-preview-12-2025 إلى gemini-3.1-flash-live-preview.
  • إعدادات التفكير: يستخدم Gemini 3.1 thinkingLevel (مع إعدادات مثل minimal وlow وmedium وhigh) بدلاً من thinkingBudget. القيمة التلقائية هي minimal لتحسين وقت الاستجابة إلى أدنى حدّ. يمكنك الاطّلاع على مستويات التفكير والميزانيات.
  • أحداث الخادم: يمكن أن يحتوي حدث واحد BidiGenerateContentServerContent الآن على أجزاء متعدّدة من المحتوى في الوقت نفسه (على سبيل المثال، مقاطع صوتية ونص). عدِّل الرمز البرمجي لمعالجة جميع الأجزاء في كل حدث لتجنُّب فقدان المحتوى.
  • محتوى العميل: لا تتوفّر السمة send_client_content إلا لإنشاء سجلّ سياق أولي (يتطلّب ذلك ضبط initial_history_in_client_content في history_config). استخدِم send_realtime_input لإرسال تعديلات نصية أثناء المحادثة. يمكنك الاطّلاع على تعديلات المحتوى التدريجية.
  • معدّل التغطية: القيمة التلقائية هي TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO بدلاً من TURN_INCLUDES_ONLY_ACTIVITY. يتضمّن دور النموذج الآن نشاطًا صوتيًا تم رصده وجميع إطارات الفيديو. إذا كان تطبيقك يرسل حاليًا بثًا مستمرًا للقطات الفيديو، ننصحك بتعديل تطبيقك لإرسال لقطات الفيديو فقط عند توفّر نشاط صوتي لتجنُّب تكبُّد تكاليف إضافية.
  • استدعاء الدوال غير المتزامنة: غير متاح بعد. تتوفّر ميزة "استدعاء الدالة" بشكل متزامن فقط. لن يبدأ النموذج في الردّ إلى أن ترسل ردّ الأداة. اطّلِع على استدعاء الدوال غير المتزامنة.
  • الصوت الاستباقي والحوار العاطفي: هاتان الميزتان غير متاحتَين بعد في Gemini 3.1 Flash Live. أزِل أي إعدادات لهذه الميزات من الرمز. اطّلِع على الصوت الاستباقي والحوار العاطفي.

للحصول على مقارنة تفصيلية بين الميزات، يُرجى الاطّلاع على جدول مقارنة النماذج في دليل الإمكانات.