开始使用 Gemma 模型

Gemma 开放模型系列包含一系列不同大小、功能和任务专用变体,可帮助您构建自定义生成式解决方案。 在应用中使用 Gemma 模型时,您可以遵循以下主要路径:

  • 选择模型,并在应用中按原样部署 该模型
  • 选择模型,针对特定任务对其进行调优,然后在应用中部署该模型 ,或与社区分享。

本指南可帮助您开始选择模型、测试 其功能,并根据需要针对 您的应用调优所选模型。

在 Kaggle 上获取 在 Hugging Face 上获取

选择模型

本部分可帮助您了解 Gemma 模型系列的官方变体,并为您的应用选择模型。模型变体提供通用功能或专门用于特定任务,并且提供不同参数大小,因此您可以选择具有所需功能并满足计算要求的模型。

下表列出了 Gemma 模型系列的主要变体及其预期部署平台:

Gemma 4 系列

最新一代,具有多模态(文本、图片、音频)输入。

大小 变体 输入 ➔ 输出 预期平台
E2B Gemma 4(核心) 文本、图片、音频 ➔ 文本 移动设备
E4B Gemma 4(核心) 文本、图片、音频 ➔ 文本 移动设备和笔记本电脑
A4B Gemma 4(核心) 文本、图片 ➔ 文本 桌面设备和小型服务器
31B Gemma 4(核心) 文本、图片 ➔ 文本 大型服务器或服务器集群

Gemma 3 和 3n 系列

用于可扩容文本和图片处理的核心模型,以及用于扩展多模态输入的“3n”变体。

大小 变体 输入 ➔ 输出 预期平台
270M Gemma 3(核心) 文本 ➔ 文本 移动设备和单板计算机
1B Gemma 3(核心) 文本 ➔ 文本 移动设备和单板计算机
E2B Gemma 3n 文本、图片、音频 ➔ 文本 移动设备
4B Gemma 3(核心) 文本、图片 ➔ 文本 桌面设备和小型服务器
E4B Gemma 3n 文本、图片、音频 ➔ 文本 移动设备和笔记本电脑
12B Gemma 3(核心) 文本、图片 ➔ 文本 高端桌面设备和服务器
27B Gemma 3(核心) 文本、图片 ➔ 文本 大型服务器或服务器集群

Gemma 2 系列

包括标准文本模型和 PaliGemma 2 多模态视觉语言变体。

大小 变体 输入 ➔ 输出 预期平台
2B Gemma 2(核心) 文本 ➔ 文本 移动设备和笔记本电脑
3B PaliGemma 2 文本、图片 ➔ 文本 桌面设备和小型服务器
9B Gemma 2(核心) 文本 ➔ 文本 高端桌面设备和服务器
10B PaliGemma 2 文本、图片 ➔ 文本 高端桌面设备和服务器
27B Gemma 2(核心) 文本 ➔ 文本 大型服务器或服务器集群
28B PaliGemma 2 文本、图片 ➔ 文本 大型服务器或服务器集群

Gemma 1 系列

原始一代,包括特定于编码的变体。

大小 变体 输入 ➔ 输出 预期平台
2B Gemma(核心)
CodeGemma
文本 ➔ 文本 移动设备和笔记本电脑
7B Gemma(核心)
CodeGemma
文本 ➔ 文本 桌面设备和小型服务器

Gemma 模型系列还包括专用模型和研究模型, 包括 ShieldGemmaDataGemmaGemma Scope、 和 Gemma-APS

测试模型

您可以通过设置开发环境并下载模型和支持软件来测试 Gemma 模型。然后,您可以向模型发出提示并评估其回答。使用以下 Python 笔记本之一以及您偏好的机器学习框架来设置测试环境并提示 Gemma 模型:

调优模型

您可以通过对 Gemma 模型执行调优来更改其行为。调优模型需要足够大小和变化的数据集,其中包含输入和预期回答,以指导模型的行为。与运行 Gemma 模型进行文本生成相比,您还需要更多计算和内存资源才能完成调优运行。使用以下 Python 笔记本之一来设置调优开发环境并调优 Gemma 模型:

后续步骤

如需了解如何使用 Gemma 构建更多解决方案,请参阅以下指南: