Gemini

模型變化版本

Gemini API 提供各種專為特定用途最佳化的模型 用途以下簡要說明可用的 Gemini 變化版本:

模型變化版本 輸入內容 輸出 適合用途
Gemini 1.5 Pro
gemini-1.5-pro
音訊、圖片、影片和文字 文字 複雜的推理任務,例如程式碼和文字生成 文字編輯、問題解決、資料擷取與生成
Gemini 1.5 Flash
gemini-1.5-flash
音訊、圖片、影片和文字 文字 快速靈活地執行各種工作
Gemini 1.0 Pro
gemini-1.0-pro
文字 文字 自然語言工作、多輪文字和程式碼即時通訊,以及程式碼 代別
(已淘汰) Gemini 1.0 Pro Vision
gemini-pro-vision
圖片、影片和文字 文字 視覺相關工作,例如產生圖片 或識別圖像中物件
文字嵌入
text-embedding-004
文字 文字嵌入 測量文字字串的關聯性
品質確保
aqa
文字 文字 為問題提供基礎解答

下表說明 Gemini 模型的各項屬性 所有模型變化版本的共通點:

屬性 說明
訓練資料 Gemini 的知識截止日期為 2023 年 11 月。 瞭解這段時間後的事件相關知識。
支援的語言 查看支援的語言
可設定的模型參數
  • 可能性總和為 P
  • 前 K 個
  • 溫度
  • 停止序列
  • 輸出內容長度上限
  • 應試者人數

查看模型參數 一節 生成式模型指南。

Gemini 1.5 Flash

Gemini 1.5 Flash 是快速且功能多樣的多模態模型,可以擴展您的 多種任務

在 AI Studio 中試用

模型詳細資料

屬性 說明
模型代碼 models/gemini-1.5-flash
支援的資料類型

輸入裝置

音訊、圖片、影片和文字

輸出內容

文字

符記限制[*]

輸入符記限制

1,048,576 人

輸出符記限制

8,192

影音規格

每則提示的圖片數量上限

3,600 人

影片長度上限

1 小時

音訊長度上限

約 9.5 小時

頻率限制[**]
免費:
  • 15 千次觀看收益
  • 100 萬 TPM
  • 每秒要求數 1,500
Pay-as-you-go:
  • 每分鐘 1,000 次
  • 200 萬 TPM
能力

系統操作說明

支援

JSON 模式

支援

JSON 結構定義

不支援

可調整的安全設定

支援

快取

支援

微調

不支援

函式呼叫

支援

函式呼叫設定

支援

執行程式碼

支援

最近更新 2024 年 5 月

Gemini 1.5 Pro

Gemini 1.5 Pro 是中型的多模態模型,經過最佳化調整 以各種推理任務1.5 Pro 可以處理大量資料 包括影片長度 2 小時、19 小時的音訊、程式碼集 60,000 行程式碼或 2,000 頁文字。

在 AI Studio 中試用

模型詳細資料

屬性 說明
模型代碼 models/gemini-1.5-pro
支援的資料類型

輸入裝置

音訊、圖片、影片和文字

輸出內容

文字

符記限制[*]

輸入符記限制

2,097,152 人

輸出符記限制

8,192

影音規格

每則提示的圖片數量上限

7,200 人

影片長度上限

2 小時

音訊長度上限

約 19 小時

頻率限制[**]
免費:
  • 每分鐘 2 轉
  • 32,000 TPM
  • 每秒要求數 50
Pay-as-you-go:
  • 360 千次曝光收益
  • 200 萬 TPM
  • 每秒要求數 10,000 次
能力

系統操作說明

支援

JSON 模式

支援

JSON 結構定義

支援

可調整的安全設定

支援

快取

支援

微調

不支援

函式呼叫

支援

函式呼叫設定

支援

執行程式碼

支援

最近更新 2024 年 5 月

Gemini 1.0 Pro

Gemini 1.0 Pro 是自然語言處理模型,可處理多輪文字和 以及生成程式碼

在 AI Studio 中試用

模型詳細資料

屬性 說明
模型代碼 models/gemini-1.0-pro
支援的資料類型

輸入功率

文字

輸出內容

文字

頻率限制[**]
免費:
  • 15 千次觀看收益
  • 32,000 TPM
  • 每秒要求數 1,500
Pay-as-you-go:
  • 360 千次曝光收益
  • 120,000 TPM
  • 每秒要求數 30,000 個
能力

系統操作說明

不支援

JSON 模式

不支援

JSON 結構定義

不支援

可調整的安全設定

支援

快取

不支援

微調

支援

函式呼叫

支援

函式呼叫設定

不支援

執行程式碼

不支援

最近更新 2024 年 2 月

(已淘汰) Gemini 1.0 Pro Vision

Gemini 1.0 Pro Vision 是效能最佳化的多模態模型 可以執行視覺相關工作以 1.0 Pro Vision 為例 生成圖片說明、識別圖像中呈現的物件、提供 圖片中出現的地點或物件等相關資訊。

模型詳細資料

屬性 說明
模型代碼 models/gemini-pro-vision
支援的資料類型

輸入裝置

圖片、影片和文字

輸出內容

文字

符記限制[*]

輸入符記限制

12,288

輸出符記限制

4,096

影音規格

影片長度上限

2 分鐘

頻率限制[**] 每分鐘 60 個要求
能力

系統操作說明

不支援

JSON 模式

不支援

JSON 結構定義

不支援

可調整的安全設定

支援

快取

不支援

微調

不支援

函式呼叫

支援

函式呼叫設定

不支援

執行程式碼

不支援

最近更新 2023 年 12 月

文字嵌入和嵌入

文字嵌入

您可以使用文字嵌入模型 文字嵌入, 輸入文字如需進一步瞭解文字嵌入模型,請造訪 Vertex AI 的生成式 AI 說明文件 文字嵌入的相關知識

文字嵌入模型已針對使用 768 建立嵌入進行最佳化 最多可包含 2,048 個符記的文字Text Embeding 提供彈性 大小低於 768您可以使用彈性嵌入 更小的輸出維度,並有可能節省運算和儲存費用 稍微降低效能

模型詳細資料
屬性 說明
模型代碼

Gemini API

models/text-embedding-004

Vertex AI

text-embedding-preview-0409

支援的資料類型

輸入功率

文字

輸出內容

文字嵌入

符記限制[*]

輸入符記限制

2,048

輸出尺寸大小

768

頻率限制[**] 每分鐘 1,500 個要求
可調整的安全設定 不支援
最近更新 2024 年 4 月

嵌入

您可以使用嵌入模型 文字嵌入, 輸入文字

嵌入模型已針對建立具有 768 個維度的嵌入進行最佳化 文字,最多包含 2,048 個符記

嵌入模型詳細資料
屬性 說明
模型代碼 models/embedding-001
支援的資料類型

輸入功率

文字

輸出內容

文字嵌入

符記限制[*]

輸入符記限制

2,048

輸出尺寸大小

768

頻率限制[**] 每分鐘 1,500 個要求
可調整的安全設定 不支援
最近更新 2023 年 12 月

AQA

您可以使用 AQA 模型執行 歸因性問題回答 與文件、語料庫或一組段落相關的 (AQA) 相關工作。AQA 這個模型能針對所提供的來源,傳回奠立的基礎問題的答案 以及評估可解答的機率

模型詳細資料

屬性 說明
模型代碼 models/aqa
支援的資料類型

輸入功率

文字

輸出內容

文字

支援的語言 英文
符記限制[*]

輸入符記限制

7,168

輸出符記限制

1,024

頻率限制[**] 每分鐘 1,500 個要求
可調整的安全設定 支援
最近更新 2023 年 12 月

請參閱範例,瞭解這些模型的功能 變化版本。

[*] 一個符記相當於 Gemini 模型的 4 個字元。100 個符記 大約有 60-80 個英文單字

[**] RPM:每分鐘要求數
TPM:每分鐘權杖數
每秒要求數:每日要求數
TPD:每日權杖數

由於容量限制,系統無法指定的頻率上限 保證。

模型版本名稱模式

Gemini 模型提供預先發布版穩定版。在您的 程式碼,您可以使用下列任一模型名稱格式來指定模型。 以及要使用的版本

  • 最新:指向指定模型的最先進的版本。 以及衍生出的變化基礎模型會定期更新 也就是預覽版本只有探索性測試應用程式和原型 使用這個別名

    如要指定最新版本,請使用下列模式: <model>-<generation>-<variation>-latest。例如 gemini-1.0-pro-latest

  • 最新穩定版本:指向該版本發布的最新穩定版本 指定的模型生成與變化

    如要指定最新的穩定版本,請使用下列模式: <model>-<generation>-<variation>。例如 gemini-1.0-pro

  • 穩定版:指向特定的穩定模型。穩定模型不會有任何改變。 大多數正式版應用程式都應使用特定的穩定模型。

    如要指定穩定版,請使用下列模式: <model>-<generation>-<variation>-<version>。例如 gemini-1.0-pro-001

支援語言

Gemini 模型經過訓練,可處理下列語言:

  • 阿拉伯文 (ar)
  • 孟加拉文 (bn)
  • 保加利亞文 (bg)
  • 簡體中文 (繁體) (zh)
  • 克羅埃西亞文 (hr)
  • 捷克文 (cs)
  • 丹麥文 (da)
  • 荷蘭文 (nl)
  • 英文 (en)
  • 愛沙尼亞文 (et)
  • 芬蘭文 (fi)
  • 法文 (fr)
  • 德文 (de)
  • 希臘文 (el)
  • 希伯來文 (iw)
  • 北印度文 (hi)
  • 匈牙利文 (hu)
  • 印尼文 (id)
  • 義大利文 (it)
  • 日文 (ja)
  • 韓文 (ko)
  • 拉脫維亞文 (lv)
  • 立陶宛文 (lt)
  • 挪威文 (no)
  • 波蘭文 (pl)
  • 葡萄牙文 (pt)
  • 羅馬尼亞文 (ro)
  • 俄文 (ru)
  • 塞爾維亞文 (sr)
  • 斯洛伐克文 (sk)
  • 斯洛維尼亞文 (sl)
  • 西班牙文 (es)
  • 斯瓦希里文 (sw)
  • 瑞典文 (sv)
  • 泰文 (th)
  • 土耳其文 (tr)
  • 烏克蘭文 (uk)
  • 越南文 (vi)