此页面由 Cloud Translation API 翻译。

Gemma 开放模型

一系列轻量级、先进的开放式模型，采用与创建 Gemini 模型相同的研究和技术构建而成

开始使用

负责任的设计

这些模型结合了全面的安全措施，可通过精选数据集和严格的调优，帮助确保负责任、值得信赖的 AI 解决方案。

在规模上实现卓越性能

Gemma 模型在大小为 20 亿和 70 亿时，均实现了出色的基准测试结果，甚至超过了一些较大的开放模型。

框架灵活

使用 Keras 3.0，您可以无缝兼容 JAX、TensorFlow 和 PyTorch，从而能够根据您的任务轻松选择和切换框架。

Gemma 模型变体

杰玛

Gemma 模型是轻量级文本到文本、仅使用解码器的大型语言模型，基于包含文本、代码和数学内容的大型数据集进行训练，可用于执行各种自然语言处理任务。

使用入门

CodeGemma

CodeGemma 以我们最初的预训练 Gemma 模型为基础，提供强大的代码补全和生成功能，其大小适合本地计算机。

使用入门

PaliGemma

PaliGemma 是一种开放式视觉语言模型，旨在针对各种视觉语言任务进行一流的微调性能。

使用入门

RecurrentGemma

RecurrentGemma 从技术上来讲是一种独特的模型，它利用循环神经网络和局部注意力来提高内存效率。

使用入门

面向开发者的快速入门指南

在 Kaggle 上浏览快速入门

访问 Kaggle 模型页面，查看关于 Gemma 的快速入门、代码示例和讨论内容。

在 Kaggle 中打开

在 Google Cloud 上训练和部署

Gemma 可在 Google Cloud 上出色地完成工作，支持端到端 TPU 优化，在 Vertex 上实现市场领先的性能并降低总拥有成本。

在 Vertex AI 中打开

通过 Keras 3 使用 JAX 尝试低秩自适应

通过 Keras 3，使用您选择的后端框架让 Gemma 模型适应您的独特领域和数据。

在 Colab 中打开

查看文档中的所有快速入门查看所有快速入门

合作伙伴快速入门指南

Hugging Face

利用 Hugging Face Transformer 和 TRL，通过 Gemma 模型进行微调和推理任务。

在 Hugging Face 上查看

NVIDIA

使用 NVIDIA NeMo 框架对 Gemma 模型进行微调，并将其导出到 TensorRT-LLM 以在生产环境中使用。

在 GitHub 中查看

LangChain

本教程介绍了如何开始在 Google Cloud 或 Colab 环境中运行 Gemma 和 LangChain。

在 Colab 中打开

任意规模

以下文档介绍了如何通过 Anyscale Endpoint 将 Gemma 用作全代管式 API 端点。

在 Anyscale 上查看

MongoDB

本文介绍如何在检索增强生成流水线或系统中，利用 Gemma 作为基础模型。

在 MongoDB 上查看

权重和偏差

通过使用 Google Gemma 模型的分步示例，深入了解 W&B 的模型注册表和启动工具。

查看权重和偏差

基准

与 Llama 2 和 Mistral 7B 等热门模型相比，Gemma 在尺寸方面的优越性能设定了新标准。

5-shot、top-1

MMLU 的

MMLU 基准是一种测试，用于衡量大语言模型在预训练期间获得的知识和问题解决能力。

0 样本

HellaSwag

HellaSwag 基准测试通过选择故事的最逻辑结局，挑战语言模型理解和应用常识推理的能力。

0 样本

毕业认证 (PIQA)

PIQA 基准测试通过回答关于日常身体互动的问题，测试语言模型理解和应用物理常识的能力。

0 样本

SIQA

SIQA 基准通过询问有关人们的行为及其社会影响的问题，来评估语言模型对社交互动和社会常识的理解。

0 样本

布尔值

BoolQ 基准测试语言模型回答自然出现（在无提示和不受限制的设置中生成）是/否问题的能力，测试模型执行真实自然语言推理任务的能力。

部分评分

维诺格兰德

Winogrande 基准测试语言模型使用二元选项解决模糊的填空任务的能力，需要通用的常识推理。

7 张照片

CQA

CQA 基准用于评估语言模型在选择题方面的性能，需要不同类型的常识知识。

OBQA

OBQA 基准用于评估语言模型在进行多步推理、常识知识和富文本理解能力方面的高级问题回答能力，其模型基于开放式图书考试。

ARC-e

ARC-e 基准可测试语言模型的高级问答技能，测试真实的年级选择题科学题。

ARC-C

ARC-c 基准是 ARC-e 数据集中更集中的子集，仅包含常见算法（检索库和字词共现）算法错误回答的问题。

5 张照片

TriviaQA

TriviaQA 基准测试通过三分之三的问答来考查理解能力。

Pass@1

HumanEval

HumanEval 基准通过评估其解决方案是否通过编程问题的功能单元测试来测试语言模型的代码生成能力。

3 拍

MBPP

MBPP 基准用于测试语言模型解决基本 Python 编程问题的能力，侧重于基本编程概念和标准库用法。

maj@1

GSM8K

GSM8K 基准测试用于测试语言模型解决小学级数学问题（通常需要多步推理）的能力。

4 张照片

MATH

MATH 基准可评估语言模型解决复杂数学文字问题的能力，需要推理能力、解决多步问题以及理解数学概念。

AGIEval

AGIEval 基准根据从现实世界考试中衍生出的问题来测试语言模型的一般智力，旨在评估人类智力（大学入学考试、法律考试等）。

BBH

BBH (BIG-Bench Hard) 基准测试关注的是超出当前语言模型能力的任务，测试它们在各种推理和理解领域的极限。

100%

75%

50%

25%

100%

75%

50%

25%

Gemma

70 亿

64.3 岁

Gemma

20 亿

42.3

米斯特拉尔

70 亿

土耳其里拉

LLAMA-2

130 亿

土耳其里拉

LLAMA-2

70 亿

土耳其里拉

Gemma

70 亿

81.2

Gemma

20 亿

土耳其里拉

米斯特拉尔

70 亿

土耳其里拉

LLAMA-2

130 亿

土耳其里拉

LLAMA-2

70 亿

77.2 岁

Gemma

70 亿

81.2

Gemma

20 亿

77.3 岁

米斯特拉尔

70 亿

土耳其里拉

LLAMA-2

130 亿

土耳其里拉

LLAMA-2

70 亿

土耳其里拉

Gemma

70 亿

土耳其里拉

Gemma

20 亿

土耳其里拉

米斯特拉尔

70 亿

47.0*

LLAMA-2

130 亿

土耳其里拉

LLAMA-2

70 亿

土耳其里拉

Gemma

70 亿

83.2

Gemma

20 亿

69.42 岁

米斯特拉尔

70 亿

83.2*

LLAMA-2

130 亿

土耳其里拉

LLAMA-2

70 亿

土耳其里拉

Gemma

70 亿

72.3 岁

Gemma

20 亿

65.4 岁

米斯特拉尔

70 亿

土耳其里拉

LLAMA-2

130 亿

土耳其里拉

LLAMA-2

70 亿

69.2 岁

Gemma

70 亿

71.3 岁

Gemma

20 亿

65.3 岁

米斯特拉尔

70 亿

66.3*

LLAMA-2

130 亿

67.3 岁

LLAMA-2

70 亿

57.8 岁

Gemma

70 亿

土耳其里拉

Gemma

20 亿

土耳其里拉

米斯特拉尔

70 亿

52.2 岁

LLAMA-2

130 亿

土耳其里拉

LLAMA-2

70 亿

土耳其里拉

Gemma

70 亿

81.5

Gemma

20 亿

73.2 岁

米斯特拉尔

70 亿

土耳其里拉

LLAMA-2

130 亿

77.3 岁

LLAMA-2

70 亿

土耳其里拉

Gemma

70 亿

53.2 岁

Gemma

20 亿

42.06

米斯特拉尔

70 亿

土耳其里拉

LLAMA-2

130 亿

49.4 岁

LLAMA-2

70 亿

土耳其里拉

Gemma

70 亿

63.4 岁

Gemma

20 亿

53.2 岁

米斯特拉尔

70 亿

土耳其里拉

LLAMA-2

130 亿

79.6

LLAMA-2

70 亿

土耳其里拉

Gemma

70 亿

32.3 岁

Gemma

20 亿

土耳其里拉

米斯特拉尔

70 亿

26.2 岁

LLAMA-2

130 亿

18.3 岁

LLAMA-2

70 亿

12.8

Gemma

70 亿

土耳其里拉

Gemma

20 亿

29.2

米斯特拉尔

70 亿

40.2*

LLAMA-2

130 亿

30.6

LLAMA-2

70 亿

20.8 岁

Gemma

70 亿

土耳其里拉

Gemma

20 亿

17.7

米斯特拉尔

70 亿

35.4*

LLAMA-2

130 亿

28.7 岁

LLAMA-2

70 亿

土耳其里拉

Gemma

70 亿

24.3 岁

Gemma

20 亿

11.8

米斯特拉尔

70 亿

12.7

LLAMA-2

130 亿

3.9

LLAMA-2

70 亿

2.5

Gemma

70 亿

土耳其里拉

Gemma

20 亿

24.2 岁

米斯特拉尔

70 亿

41.2*

LLAMA-2

130 亿

39.1 岁

LLAMA-2

70 亿

29.3 岁

Gemma

70 亿

55.1

Gemma

20 亿

35.2 岁

米斯特拉尔

70 亿

56.1*

LLAMA-2

130 亿

39.4 岁

LLAMA-2

70 亿

32.6

*有关其他方法的效果详情，请参阅技术报告

阅读技术报告

立即访问 Gemma

你喜爱的所有模型中心都可以找到 Gemma 模型。

Kaggle 模型

在许多流行的框架以及不断扩大的社区测试代码示例库中查找 Gemma 模型。

使用入门

Vertex AI Model Garden

使用您自己的数据自定义 Gemma 模型，一键部署到应用，并利用内置的端到端机器学习运维 (MLOps) 功能进行扩缩。

使用入门

拥抱脸部模型

使用 Hugging Face Transformer、PEFT 和文本生成推理库访问、微调和部署 Gemma 模型。

使用入门

Responsible AI 开发

《从设计上保证责任》

基于精心挑选的数据进行预训练，并在顶部优化安全性，帮助基于 Gemma 模型实现安全且负责任的 AI 开发。

可靠且透明的评估

全面评估和透明的报告揭示了模型限制，以便在每个应用场景下采用负责任的方法。

支持负责任开发

Responsible Generative AI Toolkit 可帮助开发者设计和实施 Responsible AI 最佳实践。

探索 Responsible Generative AI Toolkit

专为 Google Cloud 优化

借助 Google Cloud 上的 Gemma 模型，您可以使用 Vertex AI 的全托管式工具或 GKE 的自行管理方案，根据您的具体需求深入自定义模型，并将其部署到灵活且经济实惠的 AI 优化型基础架构中。

在 Google Cloud 博客中了解详情

利用 Google Cloud 赠金，加速学术研究

利用 Google Cloud 中的 PaliGemma 模型推进您的研究。这波新一波的多模态开放模型扩展了我们对前沿研究的支持。立即申请获得 Google Cloud 赠金，推动您的研究不断取得突破，并为科学社区的进步做出贡献。

入选的研究人员将获得 Google Cloud 赠金，以加快其科学研究。

立即申请

加入社区

与机器学习模型社区中的其他人联系、探索并分享您的知识。

Gemma 开放模型

负责任的设计

在规模上实现卓越性能

框架灵活

Gemma 模型变体

杰玛

CodeGemma

PaliGemma

RecurrentGemma

面向开发者的快速入门指南

在 Kaggle 上浏览快速入门

在 Google Cloud 上训练和部署

通过 Keras 3 使用 JAX 尝试低秩自适应

合作伙伴快速入门指南

基准

立即访问 Gemma

Responsible AI 开发

《从设计上保证责任》

可靠且透明的评估

支持负责任开发

专为 Google Cloud 优化

利用 Google Cloud 赠金，加速学术研究

加入社区

Kaggle

Discord

博客