開始使用 Gemma 模型

Gemma 系列開放模型提供各種模型大小、功能和專為特定工作設計的變體,協助您建構自訂生成式解決方案。在應用程式中使用 Gemma 模型時,主要有以下幾種做法:

  • 選取模型並直接部署至應用程式
  • 選取模型、針對特定工作進行調整,然後在應用程式中部署模型,或與社群分享。

這份指南可協助您開始挑選模型、測試模型功能,以及視需要微調所選模型,以供應用程式使用。

在 Kaggle 上取得 在 Hugging Face 上取得

選擇模型

本節將協助您瞭解 Gemma 模型系列的正式版本,並為應用程式選取合適的模型。模型變體提供一般功能或專為特定工作設計,並提供不同大小的參數,方便您選擇偏好的功能,以及符合運算需求。

下表列出 Gemma 模型系列的主要變體,以及預計部署的平台:

Gemma 4 Family

最新一代,支援多模態 (文字、圖像、音訊) 輸入。

大小 Variant 輸入 ➔ 輸出 預定平台
E2B Gemma 4 (核心) 文字、圖片、音訊 ➔ 文字 行動裝置
E4B Gemma 4 (核心) 文字、圖片、音訊 ➔ 文字 行動裝置和筆電
A4B Gemma 4 (核心) 文字、圖片 ➔ 文字 桌上型電腦和小型伺服器
31B Gemma 4 (核心) 文字、圖片 ➔ 文字 大型伺服器或伺服器叢集

Gemma 3 和 3n 系列

用於可擴充文字和圖片處理的核心模型,另有「3n」變體可處理更多多模態輸入內容。

大小 Variant 輸入 ➔ 輸出 預定平台
2.7 億 Gemma 3 (核心) 文字 ➔ 文字 行動裝置和單板電腦
1B Gemma 3 (核心) 文字 ➔ 文字 行動裝置和單板電腦
E2B Gemma 3n 文字、圖片、音訊 ➔ 文字 行動裝置
4B Gemma 3 (核心) 文字、圖片 ➔ 文字 桌上型電腦和小型伺服器
E4B Gemma 3n 文字、圖片、音訊 ➔ 文字 行動裝置和筆電
12B Gemma 3 (核心) 文字、圖片 ➔ 文字 高階桌上型電腦和伺服器
27B Gemma 3 (核心) 文字、圖片 ➔ 文字 大型伺服器或伺服器叢集

Gemma 2 系列

包括標準文字模型和 PaliGemma 2 多模態視覺語言變體。

大小 Variant 輸入 ➔ 輸出 預定平台
2B Gemma 2 (核心) 文字 ➔ 文字 行動裝置和筆電
3B PaliGemma 2 文字、圖片 ➔ 文字 桌上型電腦和小型伺服器
9B Gemma 2 (核心) 文字 ➔ 文字 高階桌上型電腦和伺服器
10B PaliGemma 2 文字、圖片 ➔ 文字 高階桌上型電腦和伺服器
27B Gemma 2 (核心) 文字 ➔ 文字 大型伺服器或伺服器叢集
28B PaliGemma 2 文字、圖片 ➔ 文字 大型伺服器或伺服器叢集

Gemma 1 系列

原始生成內容,包括特定編碼變體。

大小 Variant 輸入 ➔ 輸出 預定平台
2B Gemma (核心)
CodeGemma
文字 ➔ 文字 行動裝置和筆電
7B Gemma (核心)
CodeGemma
文字 ➔ 文字 桌上型電腦和小型伺服器

Gemma 系列模型也包含專用和研究模型,包括 ShieldGemmaDataGemmaGemma ScopeGemma-APS

測試模型

您可以設定開發環境,並下載模型和支援軟體,測試 Gemma 模型。接著,您可以提示模型並評估其回覆。請使用下列其中一個 Python 筆記本和偏好的機器學習架構,設定測試環境並提示 Gemma 模型:

調整模型

您可以對 Gemma 模型進行微調,改變模型的行為。微調模型需要輸入內容和預期回應的資料集,且資料量和變化程度都必須足夠,才能引導模型行為。與執行 Gemma 模型生成文字相比,完成微調作業也需要更多運算和記憶體資源。請使用下列其中一個 Python 筆記本,設定微調開發環境並微調 Gemma 模型:

後續步驟

如要使用 Gemma 建構更多解決方案,請參閱下列指南: