Gemini 模型

模型變化版本

Gemini API 提供各種模型,可針對特定用途進行最佳化調整。以下簡要介紹可用的 Gemini 變化版本:

模型變化版本 輸入內容 輸出 適合用途
Gemini 2.0 Flash
gemini-2.0-flash-exp
音訊、圖片、影片和文字 文字、圖片 (即將推出) 和音訊 (即將推出) 新一代功能、速度和多模態生成功能,可用於各種任務
Gemini 1.5 Flash
gemini-1.5-flash
音訊、圖片、影片和文字 文字 在各種任務中提供快速且多功能的效能
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
音訊、圖片、影片和文字 文字 大量且較不智慧的工作
Gemini 1.5 Pro
gemini-1.5-pro
音訊、圖片、影片和文字 文字 需要更多智慧功能的複雜推論工作
(2025 年 2 月 15 日停用) Gemini 1.0 Pro
gemini-1.0-pro
文字 文字 自然語言工作、多輪文字和程式碼對話,也能生成程式碼
文字嵌入
text-embedding-004
文字 文字嵌入 評估文字字串的相關性
AQA
aqa
文字 文字 為問題提供來源可靠的解答

(實驗功能) Gemini 2.0 Flash

Gemini 2.0 Flash 提供新一代功能和強化功能,包括優異的速度、原生工具使用、多模態生成,以及 100 萬個符號脈絡窗口。如要進一步瞭解 Gemini 2.0 Flash,請參閱總覽頁面

在 Google AI Studio 中試用

模型詳細資料

屬性 說明
模型代碼 models/gemini-2.0-flash-exp
:支援的資料類型

輸入裝置

音訊、圖片、影片和文字

輸出內容

音訊 (即將推出)、圖片 (即將推出) 和文字

權杖限制[*]

輸入符號限制

1,048,576

輸出符記限制

8,192

費率限制[**]
  • 10 RPM
  • 4 百萬個 TPM
  • 1,500 RPD
功能

結構化輸出內容

支援

快取

不支援

調整

不支援

函式呼叫

支援

程式碼執行

支援

搜尋

支援

圖像生成

支援

使用原生工具

支援

音訊產生

支援

版本
詳情請參閱模型版本模式
  • 最新:gemini-2.0-flash-exp
:最新更新 2024 年 12 月

Gemini 1.5 Flash

Gemini 1.5 Flash 是一款快速且多用途的多模態模型,可用於各種工作。

在 Google AI Studio 中試用

模型詳細資料

屬性 說明
模型代碼 models/gemini-1.5-flash
:支援的資料類型

輸入裝置

音訊、圖片、影片和文字

輸出內容

文字

權杖限制[*]

輸入符號限制

1,048,576

輸出符記限制

8,192

影音規格

每個提示的圖片數量上限

3,600

影片長度上限

1 小時

音訊長度上限

約 9.5 小時

費率限制[**]
免費:
  • 15 RPM
  • 100 萬個 TPM
  • 1,500 RPD
Pay-as-you-go:
  • 2,000 RPM
  • 400 萬個 TPM
功能

系統操作說明

支援

JSON 模式

支援

JSON 結構定義

支援

可調整的安全性設定

支援

快取

支援

調整

支援

函式呼叫

支援

程式碼執行

支援

雙向串流

不支援

版本
詳情請參閱模型版本模式
  • 最新:gemini-1.5-flash-latest
  • 最新穩定版:gemini-1.5-flash
  • 穩定版:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
:最新更新 2024 年 9 月

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B 是小型模型,專為較低智慧程度的任務而設計。

在 Google AI Studio 中試用

模型詳細資料

屬性 說明
模型代碼 models/gemini-1.5-flash-8b
:支援的資料類型

輸入裝置

音訊、圖片、影片和文字

輸出內容

文字

權杖限制[*]

輸入符號限制

1,048,576

輸出符記限制

8,192

影音規格

每個提示的圖片數量上限

3,600

影片長度上限

1 小時

音訊長度上限

約 9.5 小時

費率限制[**]
免費:
  • 15 RPM
  • 100 萬個 TPM
  • 1,500 RPD
Pay-as-you-go:
  • 4,000 RPM
  • 400 萬個 TPM
功能

系統操作說明

支援

JSON 模式

支援

JSON 結構定義

支援

可調整的安全性設定

支援

快取

支援

調整

支援

函式呼叫

支援

程式碼執行

支援

雙向串流

不支援

版本
詳情請參閱模型版本模式
  • 最新:gemini-1.5-flash-8b-latest
  • 最新穩定版:gemini-1.5-flash-8b
  • 穩定版:
    • gemini-1.5-flash-8b-001
:最新更新 2024 年 10 月

Gemini 1.5 Pro

Gemini 1.5 Pro 是一種中型多模態模型,經過最佳化處理,可處理多種推理工作。1.5 Pro 可一次處理大量資料,包括 2 小時的影片、19 小時的音訊、60,000 行程式碼的程式碼集,或 2,000 頁的文字。

在 Google AI Studio 中試用

模型詳細資料

屬性 說明
模型代碼 models/gemini-1.5-pro
:支援的資料類型

輸入裝置

音訊、圖片、影片和文字

輸出內容

文字

權杖限制[*]

輸入符號限制

2,097,152

輸出符記限制

8,192

影音規格

每個提示的圖片數量上限

7,200

影片長度上限

2 小時

音訊長度上限

約 19 小時

費率限制[**]
免費:
  • 2 RPM
  • 32,000 TPM
  • 50 RPD
Pay-as-you-go:
  • 1,000 RPM
  • 400 萬個 TPM
功能

系統操作說明

支援

JSON 模式

支援

JSON 結構定義

支援

可調整的安全性設定

支援

快取

支援

調整

不支援

函式呼叫

支援

程式碼執行

支援

雙向串流

不支援

版本
詳情請參閱模型版本模式
  • 最新:gemini-1.5-pro-latest
  • 最新穩定版:gemini-1.5-pro
  • 穩定版:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
:最新更新 2024 年 9 月

(已淘汰) Gemini 1.0 Pro

Gemini 1.0 Pro 是自然語言處理模型,可處理多輪文字和程式碼對話,也能生成程式碼。

在 Google AI Studio 中試用

模型詳細資料

屬性 說明
模型代碼 models/gemini-1.0-pro
:支援的資料類型

輸入功率

文字

輸出內容

文字

費率限制[**]
免費:
  • 15 RPM
  • 32,000 TPM
  • 1,500 RPD
Pay-as-you-go:
  • 360 RPM
  • 120,000 TPM
  • 30,000 RPD
功能

系統操作說明

不支援

JSON 模式

不支援

JSON 結構定義

不支援

可調整的安全性設定

支援

快取

不支援

調整

支援

函式呼叫

支援

函式呼叫設定

不支援

程式碼執行

不支援

雙向串流

不支援

版本
  • 最新:gemini-1.0-pro-latest
  • 最新穩定版:gemini-1.0-pro
  • 穩定版:gemini-1.0-pro-001
:最新更新 2024 年 2 月

文字嵌入和嵌入

文字嵌入

文字嵌入可用於評估字串的關聯性,並廣泛用於許多 AI 應用程式。

text-embedding-004 在標準 MTEB 嵌入基準測試中,取得更強的擷取效能,並勝過現有模型,且具有可比較的維度。

模型詳細資料
屬性 說明
模型代碼

Gemini API

models/text-embedding-004

支援的資料類型

輸入功率

文字

輸出內容

文字嵌入

權杖限制[*]

輸入符號限制

2,048

輸出維度大小

768

費率限制[**] 每分鐘 1,500 個要求
可調整的安全設定 不支援
:最新更新 2024 年 4 月

嵌入

您可以使用嵌入模型為輸入文字產生文字嵌入

嵌入模型經過最佳化處理,可為最多 2,048 個符記的文字建立 768 維度的嵌入。

嵌入模型詳細資料
屬性 說明
模型代碼 models/embedding-001
:支援的資料類型

輸入功率

文字

輸出內容

文字嵌入

權杖限制[*]

輸入符號限制

2,048

輸出維度大小

768

費率限制[**] 每分鐘 1,500 個要求
可調整的安全設定 不支援
:最新更新 2023 年 12 月

AQA

您可以使用 AQA 模型,針對文件、語料庫或一組段落執行歸因問答 (AQA) 相關任務。AQA 模型會傳回問題的答案,這些答案會根據提供的來源進行基準化,並估算可回答的機率。

模型詳細資料

屬性 說明
模型代碼 models/aqa
:支援的資料類型

輸入功率

文字

輸出內容

文字

:支援的語言 英文
權杖限制[*]

輸入符號限制

7,168

輸出符記限制

1,024

費率限制[**] 每分鐘 1,500 個要求
可調整的安全設定 支援
:最新更新 2023 年 12 月

請參閱範例,瞭解這些模型變化版本的功能。

[*] 對於 Gemini 模型,一個詞元相當於約 4 個字元。100 個符記大約等於 60 到 80 個英文單字。

[**] RPM:每分鐘要求次數
TPM:每分鐘符記
RPD:每天要求次數
TPD:每天符記

由於容量有限,我們無法保證指定的最高速率限制。

模型版本名稱模式

Gemini 模型可在預先發布穩定版本中使用。您可以在程式碼中使用下列任一模型名稱格式,指定要使用的模型和版本。

  • 最新:指向指定世代和變化版本的最新模型。基礎模型會定期更新,且可能為搶先體驗版。只有探索性測試應用程式和原型才能使用這個別名。

    如要指定最新版本,請使用下列模式:<model>-<generation>-<variation>-latest。例如 gemini-1.0-pro-latest

  • 最新穩定版:指向針對指定模型世代和變化版本發布的最新穩定版。

    如要指定最新的穩定版本,請使用以下模式:<model>-<generation>-<variation>。例如 gemini-1.0-pro

  • 穩定:指向特定的穩定模型。穩定模型不會變更。大多數正式版應用程式都應使用特定的穩定模型。

    如要指定穩定版本,請使用下列格式:<model>-<generation>-<variation>-<version>。例如 gemini-1.0-pro-001

  • 實驗:指的是預先發布版中提供的實驗模型,如條款所定義,這類模型不適用於正式上線環境。我們會發布實驗模型,收集意見回饋、讓開發人員快速取得最新更新,並強調 Google 的創新速度。我們會參考實驗推出的結果,決定如何在更多國家/地區推出模型。實驗模型可在事先未經通知的情況下,換成其他實驗模型。我們無法保證實驗模型日後會成為穩定模型。

    如要指定實驗版本,請使用以下模式:<model>-<generation>-<variation>-<version>。例如 gemini-exp-1121

支援語言

Gemini 模型經過訓練後可支援下列語言:

  • 阿拉伯文 (ar)
  • 孟加拉文 (bn)
  • 保加利亞文 (bg)
  • 簡體中文和繁體中文 (zh)
  • 克羅埃西亞文 (hr)
  • 捷克文 (cs)
  • 丹麥文 (da)
  • 荷蘭文 (nl)
  • 英文 (en)
  • 愛沙尼亞文 (et)
  • 芬蘭文 (fi)
  • 法文 (fr)
  • 德文 (de)
  • 希臘文 (el)
  • 希伯來文 (iw)
  • 北印度文 (hi)
  • 匈牙利文 (hu)
  • Indonesian (id)
  • 義大利文 (it)
  • 日文 (ja)
  • 韓文 (ko)
  • 拉脫維亞文 (lv)
  • 立陶宛文 (lt)
  • 挪威文 (no)
  • 波蘭文 (pl)
  • 葡萄牙文 (pt)
  • 羅馬尼亞文 (ro)
  • 俄文 (ru)
  • 塞爾維亞文 (sr)
  • 斯洛伐克文 (sk)
  • 斯洛維尼亞文 (sl)
  • 西班牙文 (es)
  • 斯瓦希里文 (sw)
  • 瑞典文 (sv)
  • 泰文 (th)
  • 土耳其文 (tr)
  • 烏克蘭文 (uk)
  • 越南文 (vi)