Gemma 开放模型系列包含各种模型大小、功能和任务专用变体,可帮助您构建自定义生成式解决方案。 在应用中使用 Gemma 模型时,您可以遵循以下主要途径:
- 选择模型,然后在应用中按原样部署
- 选择模型,针对特定任务对其进行调整,然后将其部署到应用中,或与社区分享。
本指南可帮助您开始选择模型、测试模型的功能,并可选择性地调整所选模型以适应您的应用。
在 Kaggle 上获取 在 Hugging Face 上获取
选择模型
本部分将帮助您了解 Gemma 模型系列的官方变体,并为您的应用选择合适的模型。模型变体提供通用功能或专门用于特定任务,并且提供不同的参数大小,因此您可以选择具有所需功能并满足计算要求的模型。
Gemma 模型列表
下表列出了 Gemma 模型系列的主要变体及其预期部署平台:
| 参数大小 | 输入 | 输出 | Variant | 基础 | 目标平台 |
|---|---|---|---|---|---|
| 2.7 亿 | 文本 | 文本 | Gemma 3 | 移动设备和单板计算机 | |
| 1B | 文本 | 文本 | Gemma 3 | 移动设备和单板计算机 | |
| E2B | 文本、图片、音频 | 文本 | Gemma 3n | 移动设备 | |
| 2B | 文本 | 文本 | Gemma 2 | 移动设备和笔记本电脑 | |
| Gemma 1 | |||||
| 30 亿 | 文字、图片 | 文本 | Gemma 2 | 桌面设备和小型服务器 | |
| E4B | 文本、图片、音频 | 文本 | Gemma 3n | 移动设备和笔记本电脑 | |
| 4B | 文字、图片 | 文本 | Gemma 3 | 桌面设备和小型服务器 | |
| 7B | 文本 | 文本 | Gemma 1 | 桌面设备和小型服务器 | |
| 90 亿 | 文本 | 文本 | Gemma 2 | 高端桌面设备和服务器 | |
| 10B | 文字、图片 | 文本 | Gemma 2 | 高端桌面设备和服务器 | |
| 12B | 文字、图片 | 文本 | Gemma 3 | 高端桌面设备和服务器 | |
| 27B | 文字、图片 | 文本 | Gemma 3 | 大型服务器或服务器集群 | |
| 文本 | 文本 | Gemma 2 | |||
| 28B | 文字、图片 | 文本 | Gemma 2 | 大型服务器或服务器集群 |
Gemma 系列模型还包括专用模型和研究模型,例如 ShieldGemma、DataGemma、Gemma Scope 和 Gemma-APS。
测试模型
您可以设置一个开发环境,其中包含下载的模型和支持软件,以测试 Gemma 模型。然后,您可以向模型发出提示并评估其回答。使用以下 Python 笔记本和您偏好的机器学习框架来设置测试环境并提示 Gemma 模型:
调优模型
您可以通过对 Gemma 模型进行调优来更改其行为。对模型进行调优需要一个包含输入和预期回答的数据集,该数据集的大小和变化程度要足以引导模型的行为。与运行 Gemma 模型生成文本相比,您还需要更多计算和内存资源才能完成调优运行。使用以下任一 Python 笔记本设置微调开发环境并微调 Gemma 模型:
后续步骤
如需了解如何使用 Gemma 构建更多解决方案,请参阅以下指南: