أصبحت Interactions API متاحة الآن للجميع. ننصحك باستخدام واجهة برمجة التطبيقات هذه للوصول إلى جميع أحدث الميزات والنماذج.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

معاينة Gemini 3.1 Flash Live

‫Gemini 3.1 Flash Live Preview هو نموذج منخفض وقت الاستجابة يحوّل الصوت إلى صوت، وهو محسّن للحوار في الوقت الفعلي وتطبيقات الذكاء الاصطناعي التي تعتمد على الصوت أولاً، مع رصد الفروقات الدقيقة الصوتية والدقة العددية والوعي المتعدد الوسائط.

تجربة النموذج في Google AI Studio

الوثائق

يُرجى الانتقال إلى دليل Live API للاطّلاع على تغطية كاملة للميزات والإمكانات.

gemini-3.1-flash-live-preview

الموقع	الوصف
رمز النموذج	`gemini-3.1-flash-live-preview`
أنواع البيانات المتوافقة	المدخلات النص والصور والصوت والفيديو الناتج النص والصوت
حدود الرموز المميّزة^[*]	الحد الأقصى للرموز المميّزة للإدخال 131,072 الحد الأقصى للرموز المميّزة للإخراج 65,536
الإمكانات	إنشاء الصوت متاح التخزين المؤقت غير متاح تنفيذ الرموز البرمجية غير متاح البحث عن الملفات غير متاح استدعاء الوظائف متاح استخدام "خرائط Google" كمصدر غير متاح إنشاء الصور غير متاح Live API متاح لتحديد المصادر في "بحث Google" متاح مُخرجات منظَّمة غير متاح طريقة التفكير متاح سياق عنوان URL غير متاح
خيارات الاستهلاك	‫Batch API غير متاح
الإصدارات	يُرجى قراءة أنماط إصدارات النماذج لمزيد من التفاصيل. معاينة: `gemini-3.1-flash-live-preview`
آخر تعديل	مارس 2026
تاريخ آخر تحديث للبيانات	يناير 2025

نقل البيانات من Gemini 2.5 Flash Live

‫Gemini 3.1 Flash Live Preview محسّن للحوار في الوقت الفعلي ومنخفض وقت الاستجابة. عند نقل البيانات من gemini-2.5-flash-native-audio-preview-12-2025، يُرجى مراعاة ما يلي:

سلسلة النموذج: يُرجى تعديل سلسلة النموذج من gemini-2.5-flash-native-audio-preview-12-2025 إلى gemini-3.1-flash-live-preview.
إعدادات طريقة التفكير: يستخدم Gemini 3.1 السمة thinkingLevel (مع إعدادات مثل minimal وlow وmedium وhigh) بدلاً من thinkingBudget. الإعداد التلقائي هو minimal لتحسين وقت الاستجابة إلى أدنى مستوى. يُرجى الاطّلاع على مستويات طريقة التفكير وميزانياتها.
أحداث الخادم: يمكن أن يحتوي حدث BidiGenerateContentServerContent واحد الآن على أجزاء متعدّدة من المحتوى في الوقت نفسه (على سبيل المثال، أجزاء الصوت والنسخة النصية). يُرجى تعديل الرمز البرمجي لمعالجة جميع الأجزاء في كل حدث لتجنُّب فقدان المحتوى.
محتوى العميل: لا تتوفّر السمة send_client_content إلا لملء سجلّ سياق المحتوى الأولي (يتطلّب ذلك ضبط initial_history_in_client_content في history_config). يُرجى استخدام send_realtime_input لإرسال تعديلات نصية أثناء المحادثة. يُرجى الاطّلاع على التعديلات المتزايدة على المحتوى.
تغطية الدور: يتم ضبطها تلقائيًا على TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO بدلاً من TURN_INCLUDES_ONLY_ACTIVITY. يتضمّن دور النموذج الآن النشاط الصوتي الذي تم رصده وجميع إطارات الفيديو. إذا كان تطبيقك يرسل حاليًا دفقًا ثابتًا من إطارات الفيديو، قد يكون من الأفضل تعديل تطبيقك لإرسال إطارات الفيديو فقط عند حدوث نشاط صوتي لتجنُّب تكبّد تكاليف إضافية.
استدعاء الوظائف غير المتزامن: غير متاح بعد. لا يتوفّر استدعاء الوظائف إلا بشكل متزامن. لن يبدأ النموذج في الردّ إلى أن ترسل ردّ الأداة. يُرجى الاطّلاع على استدعاء الوظائف غير المتزامن.
الصوت الاستباقي والحوار العاطفي: لا تتوفّر هاتان الميزتان بعد في Gemini 3.1 Flash Live. يُرجى إزالة أي إعدادات لهاتين الميزتين من الرمز البرمجي. يُرجى الاطّلاع على الصوت الاستباقي و الحوار العاطفي.

لمقارنة الميزات بالتفصيل، يُرجى الاطّلاع على جدول مقارنة النماذج في دليل الإمكانات.