Gemma 系列開放模型提供各種模型大小、功能和專為特定工作設計的變體,協助您建構自訂生成式解決方案。在應用程式中使用 Gemma 模型時,主要有以下幾種做法:
- 選取模型並直接部署至應用程式
- 選取模型、針對特定工作進行調整,然後在應用程式中部署模型,或與社群分享。
本指南可協助您開始挑選模型、測試模型功能,以及視需要微調所選模型,以供應用程式使用。
在 Kaggle 上取得 在 Hugging Face 上取得
選擇模型
本節將協助您瞭解 Gemma 模型系列的正式變體,並為應用程式選取模型。模型變體提供一般功能,或專為特定工作而設計,並提供不同大小的參數,方便您選擇偏好的功能,以及符合運算需求的模型。
Gemma 模型清單
下表列出 Gemma 模型系列的主要變體,以及預定部署平台:
| 參數大小 | 輸入功率 | 輸出內容 | Variant | Foundation | 預定平台 |
|---|---|---|---|---|---|
| 2.7 億 | 文字 | 文字 | Gemma 3 | 行動裝置和單板電腦 | |
| 10 億 | 文字 | 文字 | Gemma 3 | 行動裝置和單板電腦 | |
| E2B | 文字、圖片、音訊 | 文字 | Gemma 3n | 行動裝置 | |
| 20 億 | 文字 | 文字 | Gemma 2 | 行動裝置和筆電 | |
| Gemma 1 | |||||
| 30 億次 | 文字、圖片 | 文字 | Gemma 2 | 桌上型電腦和小型伺服器 | |
| E4B | 文字、圖片、音訊 | 文字 | Gemma 3n | 行動裝置和筆電 | |
| 4B | 文字、圖片 | 文字 | Gemma 3 | 桌上型電腦和小型伺服器 | |
| 7B | 文字 | 文字 | Gemma 1 | 桌上型電腦和小型伺服器 | |
| 90 億 | 文字 | 文字 | Gemma 2 | 高階桌上型電腦和伺服器 | |
| 10B | 文字、圖片 | 文字 | Gemma 2 | 高階桌上型電腦和伺服器 | |
| 120 億 | 文字、圖片 | 文字 | Gemma 3 | 高階桌上型電腦和伺服器 | |
| 27B | 文字、圖片 | 文字 | Gemma 3 | 大型伺服器或伺服器叢集 | |
| 文字 | 文字 | Gemma 2 | |||
| 28B | 文字、圖片 | 文字 | Gemma 2 | 大型伺服器或伺服器叢集 |
Gemma 系列模型也包含專用和研究模型,包括 ShieldGemma、DataGemma、Gemma Scope 和 Gemma-APS。
測試模型
如要測試 Gemma 模型,請設定開發環境,並下載模型和支援軟體。接著,您可以提示模型並評估其回覆。使用下列其中一個 Python 筆記本和偏好的機器學習架構,設定測試環境並提示 Gemma 模型:
調整模型
您可以對 Gemma 模型進行微調,改變模型的行為。如要調整模型,需要有足夠大小和變化的輸入內容與預期回應資料集,引導模型行為。此外,與執行 Gemma 模型生成文字相比,完成微調作業需要更多運算和記憶體資源。請使用下列其中一個 Python 筆記本,設定微調開發環境並微調 Gemma 模型:
後續步驟
如要使用 Gemma 建構更多解決方案,請參閱下列指南: