تولید ویدیو در Gemini API

رابط برنامه‌نویسی نرم‌افزار Gemini دو مدل برای تولید ویدیو ارائه می‌دهد: Gemini Omni Flash و Veo . هر کدام برای گردش‌های کاری متفاوتی طراحی شده‌اند.

از Gemini Omni Flash به عنوان مدل پیش‌فرض خود برای تولید ویدیو استفاده کنید. این نرم‌افزار انسجام ویدیویی برتر، استدلال چند ورودی (پشتیبانی همزمان از متن، تصاویر، صدا و ورودی‌های ویدیو)، ثبات شخصیت، دقت واقعی و ویرایش مکالمه چند مرحله‌ای (مثلاً جایگزینی عنصر یا تغییرات پرسپکتیو) را ارائه می‌دهد. از Veo 3.1 برای قابلیت‌های خاصی مانند گسترش صحنه، کنترل آخرین فریم یا ادغام با خطوط لوله قدیمی مورد نیاز استفاده کنید.

فلش جمینی اومنی

Gemini Omni Flash یک مدل سریع و چندوجهی برای تولید ویدیو و ویرایش ویدیوی محاوره‌ای است. این مدل در تبدیل سریع متن‌های پیشنهادی و تصاویر به ویدیوهای کوتاه عالی عمل می‌کند و به شما امکان می‌دهد نتایج را در چندین نوبت با استفاده از Interactions API اصلاح کنید.

شروع کار با Gemini Omni Flash →

وئو ۳.۱

Veo 3.1 مدلی برای تولید ویدیو با صدای بومی است. این مدل از ویژگی‌هایی مانند افزونه ویدیو، تولید فریم-محور و جهت‌دهی مبتنی بر تصویر از طریق generateContent API پشتیبانی می‌کند.

شروع به کار با Veo 3.1 →

درک ویدیو

اگر به جای تولید ویدیوی جدید، نیاز به دریافت و تحلیل محتوای ویدیوی موجود دارید، به راهنمای درک ویدیو مراجعه کنید.