Interactions API 現已正式發布。建議使用這個 API，存取所有最新功能和模型。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini API 影片生成功能

Gemini API 提供兩種影片生成模型：Gemini Omni Flash 和 Veo。兩者適用於不同的工作流程。

將 Gemini Omni Flash 設為影片生成的預設模型。這項模型可提供優異的影片連貫性、多輸入推論 (同時支援文字、圖片、音訊和影片輸入)、角色一致性、事實準確度，以及多輪對話式編輯 (例如更換元素或變更視角)。使用 Veo 3.1 處理特定功能，例如場景擴充、最後一格控制，或整合舊版管道。

Gemini Omni Flash

Gemini Omni Flash 是快速的多模態模型，可生成影片及透過對話編輯影片。這項 API 擅長快速將文字提示和圖片轉換為短片，並可讓您使用 Interactions API，在多個回合中修正結果。

開始使用 Gemini Omni Flash →

Veo 3.1

Veo 3.1 是一種模型，可生成含有原生音訊的影片。透過 generateContent API，這項功能支援影片擴充、特定影格生成，以及以圖片為基礎的導向等功能。

開始使用 Veo 3.1 →

影片解讀

如要擷取及分析現有影片內容，而非生成新影片，請參閱影片理解指南。