Gemma 系列開放模型提供各種模型大小、功能和專為特定工作設計的變體,協助您建構自訂生成式解決方案。在應用程式中使用 Gemma 模型時,主要有以下幾種做法:
- 選取模型並直接部署至應用程式
- 選取模型、針對特定工作進行調整,然後在應用程式中部署模型,或與社群分享。
這份指南可協助您開始挑選模型、測試模型功能,以及視需要微調所選模型,以供應用程式使用。
在 Kaggle 上取得 在 Hugging Face 上取得
選擇模型
本節將協助您瞭解 Gemma 模型系列的正式版本,並為應用程式選取合適的模型。模型變體提供一般功能或專為特定工作設計,並提供不同大小的參數,方便您選擇偏好的功能,以及符合運算需求。
下表列出 Gemma 模型系列的主要變體,以及預計部署的平台:
Gemma 4 Family
最新一代,支援多模態 (文字、圖像、音訊) 輸入。
| 大小 | Variant | 輸入 ➔ 輸出 | 預定平台 |
|---|---|---|---|
| E2B | Gemma 4 (核心) | 文字、圖片、音訊 ➔ 文字 | 行動裝置 |
| E4B | Gemma 4 (核心) | 文字、圖片、音訊 ➔ 文字 | 行動裝置和筆電 |
| A4B | Gemma 4 (核心) | 文字、圖片 ➔ 文字 | 桌上型電腦和小型伺服器 |
| 31B | Gemma 4 (核心) | 文字、圖片 ➔ 文字 | 大型伺服器或伺服器叢集 |
Gemma 3 和 3n 系列
用於可擴充文字和圖片處理的核心模型,另有「3n」變體可處理更多多模態輸入內容。
| 大小 | Variant | 輸入 ➔ 輸出 | 預定平台 |
|---|---|---|---|
| 2.7 億 | Gemma 3 (核心) | 文字 ➔ 文字 | 行動裝置和單板電腦 |
| 1B | Gemma 3 (核心) | 文字 ➔ 文字 | 行動裝置和單板電腦 |
| E2B | Gemma 3n | 文字、圖片、音訊 ➔ 文字 | 行動裝置 |
| 4B | Gemma 3 (核心) | 文字、圖片 ➔ 文字 | 桌上型電腦和小型伺服器 |
| E4B | Gemma 3n | 文字、圖片、音訊 ➔ 文字 | 行動裝置和筆電 |
| 12B | Gemma 3 (核心) | 文字、圖片 ➔ 文字 | 高階桌上型電腦和伺服器 |
| 27B | Gemma 3 (核心) | 文字、圖片 ➔ 文字 | 大型伺服器或伺服器叢集 |
Gemma 2 系列
包括標準文字模型和 PaliGemma 2 多模態視覺語言變體。
| 大小 | Variant | 輸入 ➔ 輸出 | 預定平台 |
|---|---|---|---|
| 2B | Gemma 2 (核心) | 文字 ➔ 文字 | 行動裝置和筆電 |
| 3B | PaliGemma 2 | 文字、圖片 ➔ 文字 | 桌上型電腦和小型伺服器 |
| 9B | Gemma 2 (核心) | 文字 ➔ 文字 | 高階桌上型電腦和伺服器 |
| 10B | PaliGemma 2 | 文字、圖片 ➔ 文字 | 高階桌上型電腦和伺服器 |
| 27B | Gemma 2 (核心) | 文字 ➔ 文字 | 大型伺服器或伺服器叢集 |
| 28B | PaliGemma 2 | 文字、圖片 ➔ 文字 | 大型伺服器或伺服器叢集 |
Gemma 1 系列
原始生成內容,包括特定編碼變體。
| 大小 | Variant | 輸入 ➔ 輸出 | 預定平台 |
|---|---|---|---|
| 2B | Gemma (核心) CodeGemma |
文字 ➔ 文字 | 行動裝置和筆電 |
| 7B | Gemma (核心) CodeGemma |
文字 ➔ 文字 | 桌上型電腦和小型伺服器 |
Gemma 系列模型也包含專用和研究模型,包括 ShieldGemma、DataGemma、Gemma Scope 和 Gemma-APS。
測試模型
您可以設定開發環境,並下載模型和支援軟體,測試 Gemma 模型。接著,您可以提示模型並評估其回覆。請使用下列其中一個 Python 筆記本和偏好的機器學習架構,設定測試環境並提示 Gemma 模型:
調整模型
您可以對 Gemma 模型進行微調,改變模型的行為。微調模型需要輸入內容和預期回應的資料集,且資料量和變化程度都必須足夠,才能引導模型行為。與執行 Gemma 模型生成文字相比,完成微調作業也需要更多運算和記憶體資源。請使用下列其中一個 Python 筆記本,設定微調開發環境並微調 Gemma 模型:
後續步驟
如要使用 Gemma 建構更多解決方案,請參閱下列指南: