模型


Gemini 3


Gemini 2.5 Flash

Gemini 2.5 Flash

我們提供最佳成本效益的模型,適用於需要推理能力的大量低延遲工作。

Nano Banana

最先進的原生圖像生成和編輯功能,可加快創作工作流程。

Gemini 2.5 Flash Live 預先發布版

專為即時對話式代理程式設計,可串流原生音訊,延遲時間不到一秒。

Gemini 2.5 Flash TTS 預先發布版

可控制的文字轉語音音訊生成功能,可精細控制風格和速度。


Gemini 2.5 Flash-Lite

Gemini 2.5 Flash-Lite

2.5 系列中最快速且經濟實惠的多模態模型。


Gemini 2.5 Pro

Gemini 2.5 Pro

Google 最先進的模型,能處理複雜工作,具備深入推理和程式設計能力。

Gemini 2.5 Pro TTS 預先發布版

高傳真語音合成技術,可針對 Podcast 和有聲書等結構化工作流程,提供最佳音質。


音訊模型

這個專區包含所有音訊模型,包括可能已列在其他專區的模型

Gemini 2.5 Flash Live 預先發布版

我們的主打 Live API 模型,可與語音和視訊代理進行低延遲的雙向互動,並提供原生音訊推理功能。

Gemini 2.5 Flash TTS 預先發布版

快速生成可控制的文字轉語音音訊,適用於延遲時間短、經濟實惠的應用程式和即時助理。

Gemini 2.5 Pro TTS 預先發布版

高傳真語音合成技術,可針對 Podcast 和有聲書等結構化工作流程,提供最佳音質。

Lyria 實驗版

高傳真音樂生成模型,可精細控制樂器、BPM 和複雜的樂曲。


生成式媒體模型

這個部分包含所有生成式媒體模型,包括可能已列在其他部分的模型

Veo 3.1 預覽

最先進的電影效果影片生成技術,提供進階創意控制選項,並支援原生音訊同步。

Nano Banana Pro 預覽版

專業設計引擎,具備推理核心,可生成工作室品質的 4K 影像、複雜版面配置和精確的文字算繪。

Nano Banana

最先進的原生圖像生成和編輯功能,專為快速的創作工作流程設計。

Lyria 實驗版

高傳真音樂生成模型,可精細控制樂器、BPM 和複雜的樂曲。

Imagen 4

這款模型可根據文字生成圖像,生成速度極快,且圖像清晰度極高,最高可達 2K 解析度。


工具和代理程式模型

電腦使用情況 預先發布版

這項專用模型可以「看到」數位螢幕,並執行點選、輸入和導覽等 UI 動作,自動執行複雜的瀏覽器工作。

Gemini Deep Research 搶先版

這項代理模型會自主規劃及執行多階段研究,從數百個來源取得資料,並生成附上出處的互動式報告。


專用工作模型

Gemini Embeddings

高維度向量表示法,適用於進階語意搜尋、文字分類和 RAG 系統。

Gemini Robotics 預先發布版

進階具體化推理模型,可理解實體空間,並為機器人代理規劃多步驟工作。


舊款機型

Gemini 2.0 Flash 已淘汰

這是我們第二代的主力模型,具備新一代功能和改良的效能,包括速度更快、可使用原生工具,以及 100 萬個詞元的脈絡窗口。

Gemini 2.0 Flash-Lite 已淘汰

這是我們速度最快的第二代模型,延遲時間最短,成本效益最高。


模型版本名稱模式

Gemini 模型提供穩定預覽最新實驗版本。

穩定

指向特定穩定模型。穩定模型通常不會變更。大多數正式版應用程式應使用特定穩定模型。

例如:gemini-2.5-flash

預覽

指向可用於正式環境的預覽模型。預覽版模型通常會啟用帳單功能,可能設有較嚴格的速率限制,且至少會在 2 週前通知停用。

例如:gemini-2.5-flash-preview-09-2025

最新

指向特定模型變體的最新版本。可以是穩定版、預覽版或實驗版。每當特定模型變體發布新版本時,這個別名就會熱切換。如果版本落後最新版本,系統會提前 2 週透過電子郵件通知您。

例如:gemini-flash-latest

實驗功能

指向實驗模型,通常不適合用於正式環境,且有更嚴格的速率限制。我們發布實驗模型是為了收集意見回饋,並盡快將最新更新提供給開發人員。

實驗性模型不穩定,模型端點的可用性可能會有所變動。

模型淘汰

如要瞭解模型淘汰項目,請前往「Gemini 淘汰項目」頁面。