معاينة Gemini 3.1 Flash Live

‫Gemini 3.1 Flash Live Preview هو نموذج من نوع "صوت إلى صوت" يتميّز بزمن استجابة منخفض، وهو محسّن للحوار في الوقت الفعلي وتطبيقات الذكاء الاصطناعي التي تعتمد على الصوت أولاً، مع رصد الفروقات الصوتية الدقيقة والتعرّف على الأرقام بدقة والوعي بالوسائط المتعددة.

الوثائق

يُرجى الانتقال إلى دليل Live API للاطّلاع على تغطية كاملة للميزات والإمكانات.

gemini-3.1-flash-live-preview

الموقع الوصف
رمز النموذج gemini-3.1-flash-live-preview
أنواع البيانات المتوافقة

المدخلات

نص وصور وصوت وفيديو

الناتج

نص وصوت

حدود الرموز المميزة[*]

الحد الأقصى للرموز المميزة للإدخال

131,072

الحد الأقصى للرموز المميزة للإخراج

65,536

الإمكانات

إنشاء الصوت

متاح

Batch API

غير متاح

التخزين المؤقت

غير متاح

تنفيذ الرموز البرمجية

غير متاح

البحث عن الملفات

غير متاح

استدعاء الوظائف

متاح

استخدام "خرائط Google" كمصدر

غير متاح

إنشاء الصور

غير متاح

Live API

متاح

لتحديد المصادر في "بحث Google"

متاح

مُخرجات منظَّمة

غير متاح

طريقة التفكير

متاح

سياق عنوان URL

غير متاح

الإصدارات
يُرجى قراءة أنماط إصدارات النماذج لمزيد من التفاصيل.
  • معاينة: gemini-3.1-flash-live-preview
آخر تعديل مارس 2026
تاريخ آخر تحديث للبيانات يناير 2025

نقل البيانات من Gemini 2.5 Flash Live

‫Gemini 3.1 Flash Live Preview محسّن للحوار في الوقت الفعلي بزمن استجابة منخفض. عند نقل البيانات من gemini-2.5-flash-native-audio-preview-12-2025، يُرجى مراعاة ما يلي:

  • سلسلة النموذج: يُرجى تعديل سلسلة النموذج من gemini-2.5-flash-native-audio-preview-12-2025 إلى gemini-3.1-flash-live-preview.
  • إعدادات طريقة التفكير: يستخدم Gemini 3.1 السمة thinkingLevel (مع إعدادات مثل minimal وlow وmedium وhigh) بدلاً من thinkingBudget. الإعداد التلقائي هو minimal لتحسين زمن الاستجابة الأقل. يُرجى الاطّلاع على مستويات طريقة التفكير وميزانياتها.
  • أحداث الخادم: يمكن أن يحتوي حدث BidiGenerateContentServerContent واحد الآن على أجزاء متعدّدة من المحتوى في الوقت نفسه (على سبيل المثال، أجزاء صوتية ونسخة نصية). يُرجى تعديل الرمز البرمجي لمعالجة جميع الأجزاء في كل حدث لتجنُّب فقدان المحتوى.
  • محتوى العميل: لا تتوفّر السمة send_client_contentإلا لملء سجلّ سياق المحادثة الأولي (يتطلّب ذلك ضبط initial_history_in_client_content في history_config). يُرجى استخدام send_realtime_input لإرسال تعديلات نصية أثناء المحادثة. يُرجى الاطّلاع على التعديلات المتزايدة على المحتوى.
  • تغطية المحادثة: يتم ضبطها تلقائيًا على TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO بدلاً من TURN_INCLUDES_ONLY_ACTIVITY. تتضمّن المحادثة في النموذج الآن النشاط الصوتي الذي تم رصده وجميع إطارات الفيديو. إذا كان تطبيقك يرسل حاليًا دفقًا ثابتًا من إطارات الفيديو، قد يكون من الأفضل تعديل تطبيقك لإرسال إطارات الفيديو فقط عند حدوث نشاط صوتي لتجنُّب تكبّد تكاليف إضافية.
  • استدعاء الوظائف غير المتزامن: غير متاح بعد. لا يتوفّر استدعاء الوظائف إلا بشكل متزامن. لن يبدأ النموذج في الردّ إلى أن ترسل ردّ الأداة. يُرجى الاطّلاع على استدعاء الوظائف غير المتزامن.
  • الصوت الاستباقي والحوار العاطفي: لا تتوفّر هاتان الميزتان بعد في Gemini 3.1 Flash Live. يُرجى إزالة أي إعدادات لهاتين الميزتين من الرمز البرمجي. يُرجى الاطّلاع على الصوت الاستباقي و الحوار العاطفي.

لمقارنة الميزات بالتفصيل، يُرجى الاطّلاع على جدول مقارنة النماذج في دليل الإمكانات.