Gemma 开放模型系列包含一系列不同大小、功能和任务专用变体,可帮助您构建自定义生成式解决方案。 在应用中使用 Gemma 模型时,您可以遵循以下主要路径:
- 选择模型,并在应用中按原样部署 该模型
- 选择模型,针对特定任务对其进行调优,然后在应用中部署该模型 ,或与社区分享。
本指南可帮助您开始选择模型、测试 其功能,并根据需要针对 您的应用调优所选模型。
在 Kaggle 上获取 在 Hugging Face 上获取
选择模型
本部分可帮助您了解 Gemma 模型系列的官方变体,并为您的应用选择模型。模型变体提供通用功能或专门用于特定任务,并且提供不同参数大小,因此您可以选择具有所需功能并满足计算要求的模型。
下表列出了 Gemma 模型系列的主要变体及其预期部署平台:
Gemma 4 系列
最新一代,具有多模态(文本、图片、音频)输入。
| 大小 | 变体 | 输入 ➔ 输出 | 预期平台 |
|---|---|---|---|
| E2B | Gemma 4(核心) | 文本、图片、音频 ➔ 文本 | 移动设备 |
| E4B | Gemma 4(核心) | 文本、图片、音频 ➔ 文本 | 移动设备和笔记本电脑 |
| A4B | Gemma 4(核心) | 文本、图片 ➔ 文本 | 桌面设备和小型服务器 |
| 31B | Gemma 4(核心) | 文本、图片 ➔ 文本 | 大型服务器或服务器集群 |
Gemma 3 和 3n 系列
用于可扩容文本和图片处理的核心模型,以及用于扩展多模态输入的“3n”变体。
| 大小 | 变体 | 输入 ➔ 输出 | 预期平台 |
|---|---|---|---|
| 270M | Gemma 3(核心) | 文本 ➔ 文本 | 移动设备和单板计算机 |
| 1B | Gemma 3(核心) | 文本 ➔ 文本 | 移动设备和单板计算机 |
| E2B | Gemma 3n | 文本、图片、音频 ➔ 文本 | 移动设备 |
| 4B | Gemma 3(核心) | 文本、图片 ➔ 文本 | 桌面设备和小型服务器 |
| E4B | Gemma 3n | 文本、图片、音频 ➔ 文本 | 移动设备和笔记本电脑 |
| 12B | Gemma 3(核心) | 文本、图片 ➔ 文本 | 高端桌面设备和服务器 |
| 27B | Gemma 3(核心) | 文本、图片 ➔ 文本 | 大型服务器或服务器集群 |
Gemma 2 系列
包括标准文本模型和 PaliGemma 2 多模态视觉语言变体。
| 大小 | 变体 | 输入 ➔ 输出 | 预期平台 |
|---|---|---|---|
| 2B | Gemma 2(核心) | 文本 ➔ 文本 | 移动设备和笔记本电脑 |
| 3B | PaliGemma 2 | 文本、图片 ➔ 文本 | 桌面设备和小型服务器 |
| 9B | Gemma 2(核心) | 文本 ➔ 文本 | 高端桌面设备和服务器 |
| 10B | PaliGemma 2 | 文本、图片 ➔ 文本 | 高端桌面设备和服务器 |
| 27B | Gemma 2(核心) | 文本 ➔ 文本 | 大型服务器或服务器集群 |
| 28B | PaliGemma 2 | 文本、图片 ➔ 文本 | 大型服务器或服务器集群 |
Gemma 1 系列
原始一代,包括特定于编码的变体。
| 大小 | 变体 | 输入 ➔ 输出 | 预期平台 |
|---|---|---|---|
| 2B | Gemma(核心) CodeGemma |
文本 ➔ 文本 | 移动设备和笔记本电脑 |
| 7B | Gemma(核心) CodeGemma |
文本 ➔ 文本 | 桌面设备和小型服务器 |
Gemma 模型系列还包括专用模型和研究模型, 包括 ShieldGemma、 DataGemma、 Gemma Scope、 和 Gemma-APS。
测试模型
您可以通过设置开发环境并下载模型和支持软件来测试 Gemma 模型。然后,您可以向模型发出提示并评估其回答。使用以下 Python 笔记本之一以及您偏好的机器学习框架来设置测试环境并提示 Gemma 模型:
调优模型
您可以通过对 Gemma 模型执行调优来更改其行为。调优模型需要足够大小和变化的数据集,其中包含输入和预期回答,以指导模型的行为。与运行 Gemma 模型进行文本生成相比,您还需要更多计算和内存资源才能完成调优运行。使用以下 Python 笔记本之一来设置调优开发环境并调优 Gemma 模型:
后续步骤
如需了解如何使用 Gemma 构建更多解决方案,请参阅以下指南: