Interactions API kini tersedia secara umum. Sebaiknya gunakan API ini untuk mengakses semua fitur dan model terbaru.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Pembuatan video di Gemini API

Gemini API menawarkan dua model untuk membuat video, Gemini Omni Flash dan Veo. Setiap model dirancang untuk alur kerja yang berbeda.

Gunakan Gemini Omni Flash sebagai model default untuk pembuatan video. Model ini memberikan koherensi video yang unggul, penalaran multi-input (mendukung input teks, gambar, audio, dan video secara bersamaan), konsistensi karakter, akurasi faktual, dan pengeditan via percakapan multi-giliran (misalnya, penggantian elemen atau perubahan perspektif). Gunakan Veo 3.1 jika kemampuan tertentu seperti ekstensi adegan, kontrol frame terakhir, atau integrasi dengan pipeline lama diperlukan.

Gemini Omni Flash

Gemini Omni Flash adalah model multimodal yang cepat untuk pembuatan video dan pengeditan video percakapan. Model ini unggul dalam mengubah perintah teks dan gambar menjadi video pendek dengan cepat, dan memungkinkan Anda menyempurnakan hasil di beberapa giliran menggunakan Interactions API.

Mulai menggunakan Gemini Omni Flash →

Veo 3.1

Veo 3.1 adalah model untuk membuat video dengan audio asli. Model ini mendukung fitur seperti ekstensi video, pembuatan khusus frame, dan arah berbasis gambar melalui generateContent API.

Mulai menggunakan Veo 3.1 →

Pemahaman video

Jika Anda perlu menyerap dan menganalisis konten video yang ada, bukan membuat video baru, lihat panduan Pemahaman video.