أصبحت Interactions API متاحة الآن للجميع. ننصحك باستخدام واجهة برمجة التطبيقات هذه للوصول إلى جميع أحدث الميزات والنماذج.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

إنشاء الفيديوهات في Gemini API

توفر Gemini API نموذجين لإنشاء الفيديوهات، Gemini Omni Flash وVeo. تم تصميم كلّ منهما لسير عمل مختلف.

استخدِم Gemini Omni Flash كنموذج تلقائي لإنشاء الفيديوهات. يوفّر هذا النموذج اتساقًا فائقًا للفيديوهات، واستدلالًا متعدد الإدخالات (يدعم إدخالات النصوص والصور والمقاطع الصوتية والفيديوهات في الوقت نفسه)، واتساق الشخصيات، ودقة الحقائق، وتعديل المحادثات المترابطة (مثل استبدال العناصر أو تغيير المنظورات). استخدِم Veo 3.1 إذا كنت بحاجة إلى إمكانات معيّنة، مثل توسيع المشهد أو التحكّم في الإطار الأخير أو الدمج مع مسارات البيانات القديمة.

Gemini Omni Flash

‫Gemini Omni Flash هو نموذج سريع ومتعدّد الوسائط لإنشاء الفيديوهات وتعديلها في المحادثات. يتفوّق هذا النموذج في تحويل الطلبات النصية والصور بسرعة إلى فيديوهات قصيرة، ويسمح لك بتحسين النتائج على مدار عدة أدوار باستخدام Interactions API.

ابدأ باستخدام Gemini Omni Flash ←

Veo 3.1

‫Veo 3.1 هو نموذج لإنشاء الفيديوهات مع مقاطع صوتية أصلية. يدعم هذا النموذج ميزات مثل توسيع الفيديوهات والإنشاء على مستوى الإطار والتوجيه المستند إلى الصور من خلال generateContent API.

ابدأ باستخدام Veo 3.1 ←

فهم الفيديوهات

إذا كنت بحاجة إلى استيعاب محتوى الفيديو الحالي وتحليله بدلاً من إنشاء فيديو جديد، اطّلِع على دليل فهم الفيديوهات.