Gemini

模型變化版本

Gemini API 提供各種經最佳化調整的模型,適合特定用途。以下簡要說明可用的 Gemini 變化版本:

模型變化版本 輸入內容 輸出內容 適合用途
Gemini 1.5 Pro
gemini-1.5-pro
音訊、圖片、影片和文字 文字 複雜的推理工作,例如程式碼及文字生成、文字編輯、問題解決、資料擷取及生成
Gemini 1.5 Flash
gemini-1.5-flash
音訊、圖片、影片和文字 文字 快速靈活地執行各種工作
Gemini 1.0 Pro
gemini-1.0-pro
文字 文字 自然語言工作、多輪文字和程式碼即時通訊,以及生成程式碼
(已淘汰) Gemini 1.0 Pro Vision
gemini-pro-vision
圖片、影片和文字 文字 視覺相關工作,例如產生圖片說明或識別圖片中的物件
嵌入文字
text-embedding-004
文字 文字嵌入 測量文字字串的關聯性
品質確保
aqa
文字 文字 為問題提供基礎的答案

下表說明所有模型變化版本常見的 Gemini 模型屬性:

屬性 說明
訓練資料 Gemini 的知識截止日期為 2023 年 11 月。瞭解這段時間後的事件相關知識。
支援的語言 查看支援的語言
可設定的模型參數
  • 可能性總和為 P
  • 前 K 個
  • Temperature
  • 停止序列
  • 輸出內容長度上限
  • 應試者人數

如要進一步瞭解這些參數,請參閱生成式模型指南的模型參數一節

Gemini 1.5 Flash

Gemini 1.5 Flash 是快速且功能多樣的多模態模型,可以擴充各種工作。

在 AI Studio 中試用

模型詳細資料

屬性 說明
模型代碼 models/gemini-1.5-flash
支援的資料類型

輸入裝置

音訊、圖片、影片和文字

輸出功率

文字

符記限制[*]

輸入符記限制

1,048,576 人

輸出符記限制

8,192

影音規格

每則提示的圖片數量上限

3,600 人

影片長度上限

1 小時

音訊長度上限

約 9.5 小時

頻率限制[**]
免費:
  • 15 千次觀看收益
  • 100 萬 TPM
  • 每秒要求數 1,500
Pay-as-you-go:
  • 每分鐘 1,000 次
  • 200 萬 TPM
能力

系統操作說明

支援

JSON 模式

支援

JSON 結構定義

不支援

可調整的安全設定

支援

快取

支援

微調

不支援

函式呼叫

支援

函式呼叫設定

支援

執行程式碼

支援

最近更新 2024 年 5 月

Gemini 1.5 Pro

Gemini 1.5 Pro 是中型的多模態模型,專為各種推理工作而最佳化。1.5 Pro 可以一次處理大量資料,包括 2 小時的影片、19 小時的音訊、含有 60,000 行程式碼的程式碼集,或是 2,000 頁的文字。

在 AI Studio 中試用

模型詳細資料

屬性 說明
模型代碼 models/gemini-1.5-pro
支援的資料類型

輸入裝置

音訊、圖片、影片和文字

輸出功率

文字

符記限制[*]

輸入符記限制

2,097,152 人

輸出符記限制

8,192

影音規格

每則提示的圖片數量上限

7,200 人

影片長度上限

2 小時

音訊長度上限

約 19 小時

頻率限制[**]
免費:
  • 每分鐘 2 轉
  • 32,000 TPM
  • 每秒要求數 50
Pay-as-you-go:
  • 360 千次曝光收益
  • 200 萬 TPM
  • 每秒要求數 10,000 次
能力

系統操作說明

支援

JSON 模式

支援

JSON 結構定義

支援

可調整的安全設定

支援

快取

支援

微調

不支援

函式呼叫

支援

函式呼叫設定

支援

執行程式碼

支援

最近更新 2024 年 5 月

Gemini 1.0 Pro

Gemini 1.0 Pro 是自然語言處理模型,可處理多輪文字和程式碼對話,以及生成程式碼等工作。

在 AI Studio 中試用

模型詳細資料

屬性 說明
模型代碼 models/gemini-1.0-pro
支援的資料類型

輸入功率

文字

輸出功率

文字

頻率限制[**]
免費:
  • 15 千次觀看收益
  • 32,000 TPM
  • 每秒要求數 1,500
Pay-as-you-go:
  • 360 千次曝光收益
  • 120,000 TPM
  • 每秒要求數 30,000 個
能力

系統操作說明

不支援

JSON 模式

不支援

JSON 結構定義

不支援

可調整的安全設定

支援

快取

不支援

微調

支援

函式呼叫

支援

函式呼叫設定

不支援

執行程式碼

不支援

最近更新 2024 年 2 月

(已淘汰) Gemini 1.0 Pro Vision

Gemini 1.0 Pro Vision 是效能最佳化的多模態模型,可以執行視覺相關工作。舉例來說,1.0 Pro Vision 可以產生圖片說明、辨識圖片中的物件、提供圖片中地點或物件的相關資訊等。

模型詳細資料

屬性 說明
模型代碼 models/gemini-pro-vision
支援的資料類型

輸入裝置

圖片、影片和文字

輸出功率

文字

符記限制[*]

輸入符記限制

12,288

輸出符記限制

4,096

影音規格

影片長度上限

2 分鐘

頻率限制[**] 每分鐘 60 個要求
能力

系統操作說明

不支援

JSON 模式

不支援

JSON 結構定義

不支援

可調整的安全設定

支援

快取

不支援

微調

不支援

函式呼叫

支援

函式呼叫設定

不支援

執行程式碼

不支援

最近更新 2023 年 12 月

文字嵌入和嵌入

文字嵌入

您可以使用文字嵌入模型,為輸入文字產生文字嵌入。如要進一步瞭解文字嵌入模型,請參閱 Vertex AI 的生成式 AI 說明文件,瞭解文字嵌入功能。

文字嵌入模型已針對最多 2,048 個符記的文字建立具備 768 個維度的嵌入,藉此建立嵌入項目。Text Embeding 提供小於 768 的彈性嵌入大小。您可以使用彈性嵌入功能產生較小的輸出維度,或許也能在效能下降的情況下節省運算和儲存空間費用。

模型詳細資料
屬性 說明
模型代碼

Gemini API

models/text-embedding-004

Vertex AI

text-embedding-preview-0409

支援的資料類型

輸入功率

文字

輸出功率

文字嵌入

符記限制[*]

輸入符記限制

2,048

輸出尺寸大小

768

頻率限制[**] 每分鐘 1,500 個要求
可調整的安全設定 不支援
最近更新 2024 年 4 月

嵌入

您可以使用嵌入模型產生輸入文字的文字嵌入

嵌入模型已針對最多 2,048 個符記的文字建立具有 768 個維度的嵌入項目,已經過最佳化調整。

嵌入模型詳細資料
屬性 說明
模型代碼 models/embedding-001
支援的資料類型

輸入功率

文字

輸出功率

文字嵌入

符記限制[*]

輸入符記限制

2,048

輸出尺寸大小

768

頻率限制[**] 每分鐘 1,500 個要求
可調整的安全設定 不支援
最近更新 2023 年 12 月

AQA

您可以使用 AQA 模型,針對文件、語料庫或一組段落執行歸因問題回答 (AQA) 相關工作。AQA 模型會針對所提供來源的基礎問題傳回答案,並預估「可回答的機率」。

模型詳細資料

屬性 說明
模型代碼 models/aqa
支援的資料類型

輸入功率

文字

輸出功率

文字

支援的語言 英文
符記限制[*]

輸入符記限制

7,168

輸出符記限制

1,024

頻率限制[**] 每分鐘 1,500 個要求
可調整的安全設定 支援
最近更新 2023 年 12 月

請參閱範例,瞭解這些模型變化版本的功能。

[*] 一個符記相當於 Gemini 模型的 4 個字元。100 個符記大約介於 60 至 80 個英文單字。

[**] 每分鐘要求數
TPM:每分鐘權杖數
每秒要求數:每日要求數
TPD:每日權杖數

由於容量限制,我們無法對指定頻率上限提出保證。

模型版本名稱模式

Gemini 模型提供預先發布版穩定版。您可在程式碼中使用下列其中一種模型名稱格式,指定要使用的模型和版本。

  • 最新:指向特定生成版本和變化版本的最先進的模型。基礎模型會定期更新,且可能是預覽版本。只有探索性測試應用程式和原型才能使用這個別名。

    如要指定最新版本,請使用下列模式:<model>-<generation>-<variation>-latest。例如 gemini-1.0-pro-latest

  • 最新穩定版本:會指向指定模型產生作業和變化版本的最新穩定版本。

    如要指定最新的穩定版本,請使用下列模式:<model>-<generation>-<variation>。例如 gemini-1.0-pro

  • 穩定版:指向特定的穩定模型。穩定模型不會改變。 大多數正式版應用程式都應使用特定的穩定模型。

    如要指定穩定版,請使用下列模式:<model>-<generation>-<variation>-<version>。例如 gemini-1.0-pro-001

支援語言

Gemini 模型經過訓練,可處理下列語言:

  • 阿拉伯文 (ar)
  • 孟加拉文 (bn)
  • 保加利亞文 (bg)
  • 簡體中文 (繁體) (zh)
  • 克羅埃西亞文 (hr)
  • 捷克文 (cs)
  • 丹麥文 (da)
  • 荷蘭文 (nl)
  • 英文 (en)
  • 愛沙尼亞文 (et)
  • 芬蘭文 (fi)
  • 法文 (fr)
  • 德文 (de)
  • 希臘文 (el)
  • 希伯來文 (iw)
  • 北印度文 (hi)
  • 匈牙利文 (hu)
  • 印尼文 (id)
  • 義大利文 (it)
  • 日文 (ja)
  • 韓文 (ko)
  • 拉脫維亞文 (lv)
  • 立陶宛文 (lt)
  • 挪威文 (no)
  • 波蘭文 (pl)
  • 葡萄牙文 (pt)
  • 羅馬尼亞文 (ro)
  • 俄文 (ru)
  • 塞爾維亞文 (sr)
  • 斯洛伐克文 (sk)
  • 斯洛維尼亞文 (sl)
  • 西班牙文 (es)
  • 斯瓦希里文 (sw)
  • 瑞典文 (sv)
  • 泰文 (th)
  • 土耳其文 (tr)
  • 烏克蘭文 (uk)
  • 越南文 (vi)