النسخة الحصرية من Gemini 2.5 Flash

تتيح Live API التفاعلات الصوتية والمرئية في الوقت الفعلي وبزمن استجابة منخفض مع Gemini 2.5 Flash. تعالج هذه الواجهة تدفقات مستمرة من الصوت أو الفيديو أو النص لتقديم ردود فورية منطوقة تشبه الردود البشرية، ما يتيح للمستخدمين التجربة الحوارية الطبيعية.

الوثائق

يمكنك الانتقال إلى دليل Live API للاطّلاع على التغطية الكاملة للميزات والإمكانات.

gemini-2.5-flash-native-audio-preview-12-2025

الموقع الوصف
رمز النموذج gemini-2.5-flash-native-audio-preview-12-2025
أنواع البيانات المتوافقة

المدخلات

الصوت والفيديو والنص

الناتج

الصوت والنص

حدود الرموز المميزة[*]

الحدّ الأقصى لعدد الرموز المميزة التي يمكن إدخالها

131,072

الحدّ الأقصى لعدد الرموز المميزة الناتجة

8,192

الإمكانات

إنشاء الصوت

متاح

التخزين المؤقت

غير متاح

تنفيذ الرموز البرمجية

غير متاح

البحث عن الملفات

غير متاح

استدعاء الدوال

متاح

استخدام "خرائط Google" كمصدر

غير متاح

إنشاء الصور

غير متاح

Live API

متاح

تحديد المصادر في "بحث Google"

متاح

المُخرجات المنظَّمة

غير متاح

التفكير

متاح

سياق عنوان URL

غير متاح

خيارات الاستهلاك

Batch API

غير متاح

الاستدلال المرن

غير متاح

استنتاج الأولوية

غير متاح

الإصدارات
يمكنك الاطّلاع على أنماط إصدارات النماذج لمزيد من التفاصيل.
  • معاينة: gemini-2.5-flash-native-audio-preview-12-2025
آخر تعديل سبتمبر 2025
تاريخ آخر تحديث للبيانات يناير 2025