Gemini API 影片生成功能

Gemini API 提供兩種影片生成模型:Gemini Omni FlashVeo。兩者適用於不同的工作流程。

將 Gemini Omni Flash 設為影片生成的預設模型。這項模型可提供優異的影片連貫性、多輸入推論 (同時支援文字、圖片、音訊和影片輸入)、角色一致性、事實準確度,以及多輪對話式編輯 (例如更換元素或變更視角)。使用 Veo 3.1 處理特定功能,例如場景擴充、最後一格控制,或整合舊版管道。

Gemini Omni Flash

Gemini Omni Flash 是快速的多模態模型,可生成影片及透過對話編輯影片。這項 API 擅長快速將文字提示和圖片轉換為短片,並可讓您使用 Interactions API,在多個回合中修正結果。

開始使用 Gemini Omni Flash →

Veo 3.1

Veo 3.1 是一種模型,可生成含有原生音訊的影片。透過 generateContent API,這項功能支援影片擴充、特定影格生成,以及以圖片為基礎的導向等功能。

開始使用 Veo 3.1 →

影片解讀

如要擷取及分析現有影片內容,而非生成新影片,請參閱影片理解指南