Interactions API 現已正式發布。建議使用這個 API，存取所有最新功能和模型。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

模型

Gemini 3

穩定

Gemini 3.5 Flash

最聰明的模型，在代理和程式設計工作方面，能持續展現尖端效能。

穩定

Gemini 3.1 Flash-Lite

效能可與大型模型匹敵，但成本遠低於大型模型。

穩定

Nano Banana 2

強大高效的圖像生成和編輯功能，可快速處理大量使用案例。

穩定

Nano Banana 2 Lite

超低延遲且符合成本效益的圖像生成和編輯模型，專為大量互動式用途設計。

穩定

Nano Banana Pro

最先進的圖像生成和編輯模型，可根據情境建立原生圖像。

穩定

預覽

Gemini 3.1 Pro

進階智慧、複雜問題解決能力，以及強大的代理和氛圍編碼功能。

預覽

Gemini 3 Flash

效能可與大型模型匹敵，但成本遠低於大型模型。

預覽

Gemini 3.5 Live Translate

低延遲的即時語音對語音翻譯模型，支援超過 70 種語言。

新預覽

Gemini 3.1 Flash Live

高品質低延遲的 Live API 模型，適用於即時對話和語音優先的 AI 應用程式。

新預覽

Gemini 3.1 Flash TTS

強大且低延遲的語音生成功能。

新預覽

Gemini Omni Flash

快速生成及編輯影片，就像聊天一樣簡單。將文字和圖片轉換成影片，並透過自然語言調整結果。

新預覽

Gemini 2.5 Flash

我們提供最佳成本效益的模型，適用於需要推論能力的大量低延遲工作。

Nano Banana

最先進的圖像生成和編輯功能，專為快速的創作工作流程設計。

Gemini 2.5 Flash Live 預先發布版

專為即時對話式代理程式設計，可串流原生音訊，延遲時間不到一秒。

Gemini 2.5 Flash TTS 預先發布版

可控制的文字轉語音音訊生成功能，可微調風格和速度。

Gemini 2.5 Flash-Lite

2.5 系列中速度最快、最經濟實惠的多模態模型。

Gemini 2.5 Pro

Google 最先進的模型，能處理複雜工作，具備深度推論和程式設計能力。

Gemini 2.5 Pro TTS 預先發布版

高傳真語音合成技術，可針對 Podcast 和有聲書等結構化工作流程，提供最佳音質。

音訊模型

這個部分包含所有音訊模型，包括可能已列在其他部分中的模型

Gemini 3.1 Flash Live 預先發布版

我們的高品質低延遲音訊對音訊 (A2A) 模型，專為即時對話和語音優先 AI 應用程式設計。

Gemini 3.1 Flash TTS 預先發布版

生成語音的延遲時間短，輸出內容自然，可透過提示詞控制，並提供新的生動音訊標記，精確控制旁白。

Gemini 2.5 Flash Live 預先發布版

我們的主打 Live API 模型，可與語音和視訊代理進行低延遲的雙向互動，並提供原生音訊推理功能。

Gemini 2.5 Flash TTS 預先發布版

快速生成可控制的文字轉語音音訊，適用於低延遲、經濟實惠的應用程式和即時助理。

Gemini 2.5 Pro TTS 預先發布版

高傳真語音合成技術，可針對 Podcast 和有聲書等結構化工作流程，提供最佳音質。

生成式媒體模型

這個專區包含所有生成式媒體模型，包括可能已列在其他專區的模型

Nano Banana 2

結合 Gemini 3 系列的智慧功能和極快的生成速度，高效製作大量圖片。

Nano Banana 2 Lite

專為圖像生成系列設計的效率專家，提供超低延遲和具成本效益的圖像生成和編輯功能。

Veo 3.1 預覽版

最先進的電影效果影片生成技術，提供進階創作控制選項，並可原生同步音訊。

Nano Banana Pro

專業設計引擎，具備推理核心，可生成工作室品質的 4K 影像、複雜版面配置，以及精確的文字算繪。

Veo 3.1 Lite 預覽版

Veo 3.1 系列模型可供開發人員高效益、低成本地生成及編輯影片，並控制電影風格。

Gemini Omni Flash 預先發布版

快速生成及編輯影片，就像聊天一樣簡單。將文字和圖片轉換成影片，並透過自然語言調整結果。

Nano Banana

最先進的圖像生成和編輯功能，專為快速的創作工作流程設計。

Imagen 4 已淘汰

這款模型可將文字轉換成圖像，生成速度極快，且圖像清晰度極高，最高可達 2K 解析度。

音樂生成模型

這個專區包含所有音樂生成模型，包括可能已列在其他專區的模型

Lyria 3 Pro 預先發布版

Google 的旗艦音樂生成模型，經過最佳化調整，可生成結構複雜且連貫的完整歌曲。

Lyria 3 Clip 預先發布版

最適合生成短音樂片段、循環和試聽內容，最長 30 秒。

Lyria RealTime 實驗版

高保真音樂生成模型，可提供精細的創作控制選項和即時串流功能。

工具和代理模型

電腦使用預先發布版

這項專用模型可以「看見」數位螢幕，並執行點選、輸入和瀏覽等 UI 動作，自動執行複雜的瀏覽器工作。

Gemini Deep Research 搶先體驗版

自主規劃並執行多步驟研究的代理模型，可從數百個來源取得資訊，並生成註明出處的互動式報告。

Gemini Deep Research Max 搶先版

自動從數百個來源收集和統整情境資訊，盡可能提供最全面的資訊。

Antigravity Agent 預先發布版

這項功能是用途廣泛的受管理代理，可在安全隔離的 Linux 沙箱中自主規劃、推論、執行程式碼、管理檔案及瀏覽網路。

專用工作模型

Gemini Embedding 2

這是我們第一個多模態嵌入模型，可將文字、圖片、影片、音訊和 PDF 對應至統一的嵌入空間，以供進階語意搜尋和 RAG 系統使用。

Gemini Embedding

高維度向量表示法，適用於進階語意搜尋、文字分類和 RAG 系統。

Gemini Robotics-ER 1.6預先發布版

進階具體化推理模型，可瞭解實體空間，並為機器人代理程式規劃多步驟工作，具備儀器讀取、空間和物理推理等新功能。

舊款機型

Gemini 2.0 Flash 關機

這是我們第二代的主力模型，具備新一代功能和改良能力，包括優異的速度、原生工具使用，以及 100 萬個詞元的脈絡窗口。

Gemini 2.0 Flash-Lite 關機

這是我們速度最快的第二代模型，延遲時間最短，成本效益最高。

Gemini 3.1 Flash-Lite 預先發布版關機

這是我們成本效益最高的多模態模型，可快速執行輕量型工作，且執行頻率高。

Gemini 3 Pro 預先發布版關閉

Google 最先進的推論模型，具備進階多模態理解能力。

模型版本名稱模式

Gemini 模型提供穩定、預先發布、最新或實驗版本。

穩定

指向特定穩定模型。穩定模型通常不會變更。大多數正式版應用程式應使用特定穩定模型。

例如：gemini-3.5-flash。

預覽

指向可用於正式環境的預覽模型。預先發布版模型通常會啟用帳單功能，可能設有較嚴格的速率限制，且至少會提前 2 週通知停用。

例如：gemini-2.5-flash-preview-09-2025。

實驗功能

指向實驗性模型，通常不適合用於正式環境，且有更嚴格的速率限制。我們發布實驗模型是為了收集意見回饋，並快速將最新更新內容提供給開發人員。

實驗性模型不穩定，模型端點的可用性可能會有所變動。

模型淘汰

如要瞭解模型淘汰項目，請前往「Gemini 淘汰項目」頁面。