Gemini 是一系列生成式 AI 模型,可讓開發人員生成內容及解決問題。這類模型經過設計及訓練,可將文字和圖片做為輸入內容。本指南提供每個模型變化版本的資訊,協助您判斷何者最符合您的用途。
模型變化版本
Gemini API 提供各種經最佳化調整的模型,適合特定用途。以下簡要說明可用的 Gemini 變化版本:
模型變化版本 | 輸入內容 | 輸出內容 | 適合用途 |
---|---|---|---|
Gemini 1.5 Pro
gemini-1.5-pro |
音訊、圖片、影片和文字 | 文字 | 複雜的推理工作,例如程式碼及文字生成、文字編輯、問題解決、資料擷取及生成 |
Gemini 1.5 Flash
gemini-1.5-flash |
音訊、圖片、影片和文字 | 文字 | 快速靈活地執行各種工作 |
Gemini 1.0 Pro
gemini-1.0-pro |
文字 | 文字 | 自然語言工作、多輪文字和程式碼即時通訊,以及生成程式碼 |
(已淘汰) Gemini 1.0 Pro Vision
gemini-pro-vision
|
圖片、影片和文字 | 文字 | 視覺相關工作,例如產生圖片說明或識別圖片中的物件 |
嵌入文字
text-embedding-004 |
文字 | 文字嵌入 | 測量文字字串的關聯性 |
下表說明所有模型變化版本常見的 Gemini 模型屬性:
屬性 | 說明 |
---|---|
訓練資料 | Gemini 的知識截止日期為 2023 年 11 月。瞭解這段時間後的事件相關知識。 |
支援的語言 | 查看支援的語言 |
可設定的模型參數 |
|
如要進一步瞭解這些參數,請參閱生成式模型指南的模型參數一節。
Gemini 1.5 Pro
Gemini 1.5 Pro 是中型的多模態模型,最適合用於各種推理工作,例如:
- 程式碼生成
- 文字生成
- 文字編輯
- 解決問題
- 產生建議
- 資訊擷取
- 資料擷取或產生
- 建立 AI 虛擬服務專員
1.5 Pro 可以一次處理大量資料,包括 1 小時的影片、9.5 小時的音訊、含有超過 30,000 行程式碼或超過 700,000 字的程式碼集。
1.5 Pro 可以處理零樣本、單一和少量樣本的學習工作。
模型詳細資料
屬性 | 說明 |
---|---|
模型程式碼 | models/gemini-1.5-pro-latest |
輸入 | 音訊、圖片、影片和文字 |
輸出內容 | 文字 |
支援的產生方法 |
generateContent
|
輸入符記限制[**] | 1,048,576 人 |
輸出符記數量上限[**] | 8,192 |
每則提示的圖片數量上限 | 3,600 人 |
影片長度上限 | 1 小時 |
音訊長度上限 | 約 9.5 小時 |
每則提示的音訊檔案數量上限 | 1 |
模型安全性 | 自動套用安全設定,可由開發人員調整。詳情請參閱安全性設定頁面。 |
頻率限制[*] |
|
系統指示 | 有權限 |
JSON 模式 | 有權限 |
最新版本 | gemini-1.5-pro-latest |
最新的穩定版 | gemini-1.5-pro |
穩定版 | gemini-1.5-pro-001 |
上次更新時間 | 2024 年 5 月 |
Gemini 1.5 Flash
Gemini 1.5 Flash 是快速且功能多樣的多模態模型,可以擴充各種工作。
模型詳細資料
屬性 | 說明 |
---|---|
模型程式碼 | gemini-1.5-flash-latest |
輸入內容 | 音訊、圖片、影片和文字 |
輸出內容 | 文字 |
支援的產生方法 |
generateContent
|
輸入符記限制[**] | 1,048,576 人 |
輸出符記數量上限[**] | 8,192 |
每則提示的圖片數量上限 | 3,600 人 |
影片長度上限 | 1 小時 |
音訊長度上限 | 約 9.5 小時 |
每則提示的音訊檔案數量上限 | 1 |
模型安全性 | 自動套用安全設定,可由開發人員調整。詳情請參閱安全性設定頁面。 |
頻率限制[*] |
|
系統指示 | 有權限 |
JSON 模式 | 有權限 |
模型調整 | 即將推出 |
最新版本 | gemini-1.5-flash-latest |
最新的穩定版 | gemini-1.5-flash |
穩定版 | gemini-1.5-flash-001 |
上次更新時間 | 2024 年 5 月 |
Gemini 1.0 Pro
Gemini 1.0 Pro 是自然語言處理模型,可處理多輪文字和程式碼對話,以及生成程式碼等工作。
1.0 Pro 可以處理零樣本、單一和少量樣本的學習工作。
模型詳細資料
屬性 | 說明 |
---|---|
模型程式碼 | models/gemini-1.0-pro |
輸入內容 | 文字 |
輸出內容 | 文字 |
支援的產生方法 |
generate_content
generateContent
|
頻率限制[*] |
|
系統指示 | 不支援 |
JSON 模式 | 不支援 |
模型調整 | 支援:gemini-1.0-pro-001 |
最新版本 | gemini-1.0-pro-latest |
最新的穩定版 | gemini-1.0-pro |
穩定版 | gemini-1.0-pro-001 |
上次更新時間 | 2024 年 2 月 |
(已淘汰) Gemini 1.0 Pro Vision
Gemini 1.0 Pro Vision 是效能最佳化的多模態模型,可以執行視覺相關工作。舉例來說,1.0 Pro Vision 可以產生圖片說明、辨識圖片中的物件、提供圖片中地點或物件的相關資訊等。
1.0 Pro Vision 可以處理零樣本、單一和少量任務的工作。
模型詳細資料
屬性 | 說明 |
---|---|
模型程式碼 | models/gemini-pro-vision |
輸入 | 文字、影片和圖片 |
輸出內容 | 文字 |
支援的產生方法 |
generate_content
generateContent
|
輸入符記限制[*] | 12,288 |
輸出符記數量上限[*] | 4,096 |
圖片大小上限 | 無限制 |
每則提示的圖片數量上限 | 16 |
影片長度上限 | 2 分鐘 |
每則提示的影片數量上限 | 1 |
模型安全性 | 自動套用安全設定,可由開發人員調整。詳情請參閱安全性設定頁面。 |
頻率限制[*] | 每分鐘 60 個要求 |
最新版本 | gemini-1.0-pro-vision-latest |
最新的穩定版 | gemini-1.0-pro-vision |
上次更新時間 | 2023 年 12 月 |
文字嵌入和嵌入
文字嵌入
您可以使用文字嵌入模型,為輸入文字產生文字嵌入。如要進一步瞭解文字嵌入模型,請參閱 Vertex AI 的生成式 AI 說明文件,瞭解文字嵌入功能。
文字嵌入模型已針對最多 2,048 個符記的文字建立具備 768 個維度的嵌入,藉此建立嵌入項目。Text Embeding 提供小於 768 的彈性嵌入大小。您可以使用彈性嵌入功能產生較小的輸出維度,或許也能在效能下降的情況下節省運算和儲存空間費用。
模型詳細資料
屬性 | 說明 |
---|---|
模型程式碼 |
models/text-embedding-004 (Vertex AI 中的 text-embedding-preview-0409 ) |
輸入內容 | 文字 |
輸出內容 | 文字嵌入 |
輸入詞元限制 | 2,048 |
輸出尺寸大小 | 768 |
支援的產生方法 |
embed_content
embedContent
|
模型安全性 | 沒有可調整的安全設定。 |
頻率限制[*] | 每分鐘 1,500 個要求 |
上次更新時間 | 2024 年 4 月 |
嵌入
您可以使用嵌入模型產生輸入文字的文字嵌入。
嵌入模型已針對最多 2,048 個符記的文字建立具有 768 個維度的嵌入項目,已經過最佳化調整。
嵌入模型詳細資料
屬性 | 說明 |
---|---|
模型程式碼 | models/embedding-001 |
輸入內容 | 文字 |
輸出內容 | 文字嵌入 |
輸入詞元限制 | 2,048 |
輸出尺寸大小 | 768 |
支援的產生方法 |
embed_content
embedContent
|
模型安全性 | 沒有可調整的安全設定。 |
頻率限制[*] | 每分鐘 1,500 個要求 |
上次更新時間 | 2023 年 12 月 |
AQA
您可以使用 AQA 模型,針對文件、語料庫或一組段落執行歸因問題回答 (AQA) 相關工作。AQA 模型會針對所提供來源的基礎問題傳回答案,並預估「可回答的機率」。
模型詳細資料
屬性 | 說明 |
---|---|
模型程式碼 | models/aqa |
輸入內容 | 文字 |
輸出內容 | 文字 |
支援的產生方法 |
GenerateAnswerRequest
generateAnswer
|
支援的語言 | 英文 |
輸入符記限制[**] | 7,168 |
輸出符記數量上限[**] | 1,024 |
模型安全性 | 自動套用安全設定,可由開發人員調整。詳情請參閱安全性設定頁面。 |
頻率限制[*] | 每分鐘 60 個要求 |
上次更新時間 | 2023 年 12 月 |
請參閱範例,瞭解這些模型變化版本的功能。
[*] 一個符記相當於 Gemini 模型的 4 個字元。100 個符記大約介於 60 至 80 個英文單字。
[**] 每分鐘要求數
TPM:每分鐘權杖數
每秒要求數:每日要求數
TPD:每日權杖數
由於容量限制,我們無法對指定頻率上限提出保證。
模型版本名稱模式
Gemini 模型提供預先發布版或穩定版。您可在程式碼中使用下列其中一種模型名稱格式,指定要使用的模型和版本。
最新:指向特定生成版本和變化版本的最先進的模型。基礎模型會定期更新,且可能是預覽版本。只有探索性測試應用程式和原型才能使用這個別名。
如要指定最新版本,請使用下列模式:
<model>-<generation>-<variation>-latest
。例如gemini-1.0-pro-latest
。最新穩定版本:會指向指定模型產生作業和變化版本的最新穩定版本。
如要指定最新的穩定版本,請使用下列模式:
<model>-<generation>-<variation>
。例如gemini-1.0-pro
。穩定版:指向特定的穩定模型。穩定模型不會改變。 大多數正式版應用程式都應使用特定的穩定模型。
如要指定穩定版,請使用下列模式:
<model>-<generation>-<variation>-<version>
。例如gemini-1.0-pro-001
。
支援語言
Gemini 模型經過訓練,可處理下列語言:
- 阿拉伯文 (
ar
) - 孟加拉文 (
bn
) - 保加利亞文 (
bg
) - 簡體中文 (繁體) (
zh
) - 克羅埃西亞文 (
hr
) - 捷克文 (
cs
) - 丹麥文 (
da
) - 荷蘭文 (
nl
) - 英文 (
en
), - 愛沙尼亞文 (
et
) - 芬蘭文 (
fi
) - 法文 (
fr
) - 德文 (
de
) - 希臘文 (
el
) - 希伯來文 (
iw
) - 北印度文 (
hi
) - 匈牙利文 (
hu
) - 印尼文 (
id
) - 義大利文 (
it
) - 日文 (
ja
) - 韓文 (
ko
) - 拉脫維亞文 (
lv
), - 立陶宛文 (
lt
) - 挪威文 (
no
) - 波蘭文 (
pl
) - 葡萄牙文 (
pt
) - 羅馬尼亞文 (
ro
) - 俄文 (
ru
) - 塞爾維亞文 (
sr
) - 斯洛伐克文 (
sk
) - 斯洛維尼亞文 (
sl
) - 西班牙文 (
es
) - 斯瓦希里文 (
sw
) - 瑞典文 (
sv
) - 泰文 (
th
) - 土耳其文 (
tr
) - 烏克蘭文 (
uk
) - 越南文 (
vi
)