النسخة الحصرية من Gemini 2.5 Flash

تتيح Live API التفاعلات الصوتية والمرئية في الوقت الفعلي وبزمن استجابة منخفض مع Gemini 2.5 Flash. تعالج هذه الواجهة تدفقات مستمرة من الصوت أو الفيديو أو النص لتقديم ردود فورية منطوقة تشبه ردود البشر، ما يتيح للمستخدمين تجربة محادثة طبيعية.

الوثائق

يمكنك الانتقال إلى دليل Live API للاطّلاع على التغطية الكاملة للميزات والإمكانات.

gemini-2.5-flash-native-audio-preview-12-2025

الموقع الوصف
رمز النموذج gemini-2.5-flash-native-audio-preview-12-2025
أنواع البيانات المتوافقة

المدخلات

الصوت والفيديو والنص

الناتج

الصوت والنص

حدود الرموز المميزة[*]

حد الرموز المميزة المدخلة

131,072

الحد الأقصى لعدد الرموز المميزة في الناتج

8,192

الإمكانات

إنشاء الصوت

متاح

Batch API

غير متاح

التخزين المؤقت

غير متاح

تنفيذ الرمز

غير متاح

البحث عن الملفات

غير متاح

استدعاء الدوال

متاح

استخدام "خرائط Google" كمصدر

غير متاح

إنشاء الصور

غير متاح

Live API

متاح

تحديد المصادر في "بحث Google"

متاح

المخرجات المنظَّمة

غير متاح

التفكير

متاح

سياق عنوان URL

غير متاح

إصدارات
يمكنك الاطّلاع على أنماط إصدارات النماذج لمزيد من التفاصيل.
  • معاينة: gemini-2.5-flash-native-audio-preview-12-2025
  • معاينة: gemini-2.5-flash-native-audio-preview-09-2025
آخر تعديل سبتمبر 2025
تاريخ آخر تحديث للبيانات يناير 2025