Gemma 开放模型

一系列先进的轻量级开放模型,利用与 Gemini 模型相同的技术和研究成果构建而成

<ph type="x-smartling-placeholder"></ph> 开始设置
“从设计上保证责任”图标

从设计上保证负责任

这些模型采用全面的安全措施,通过精心挑选的数据集和严格的调参,有助于确保提供负责任且值得信赖的 AI 解决方案。

“卓越的性能”图标

无论何种大小,均有卓越性能

Gemma 模型在规模达到 20 亿、70 亿、90 亿和 270 亿时取得了出色的基准效果,甚至优于一些更大的开放式模型。

框架灵活

框架灵活

借助 Keras 3.0,您可以无缝兼容 JAX、TensorFlow 和 PyTorch,使您可以根据自己的任务轻松选择和切换框架。

隆重推出
Gemma 2

Gemma 2 经过重新设计,性能和效率均出类拔萃,经过优化,可在各种硬件上实现超快的推理。

<ph type="x-smartling-placeholder"></ph> 在 Google AI Studio 中试用 Gemma 2

5 样本

MMLU

MMLU 基准测试可衡量大语言模型在预训练期间获得的知识广度和问题解决能力。

25 样本

ARC-C

ARC-c 基准是 ARC-e 数据集中更具针对性的子集,仅包含常见(检索基准和字词共现)算法答错的问题。

5 样本

GSM8K

GSM8K 基准测试了语言模型解决经常需要多个推理步骤的小学阶段数学问题的能力。

3-5 样本

AGIEval

AGIEval 基准测试使用从旨在评估人类智力能力的真实考试中得到的问题,来测试语言模型的一般智力。

3 样本,哥伦比亚时间

BBH

BBH (BIG-Bench Hard) 基准测试侧重于被认为超出了当前语言模型能力的任务,会在各种推理和理解领域测试它们的极限。

3 次,F1

DROP

DROP 是一项阅读理解基准,需要对段落进行离散推理。

5 样本

威诺格兰德

Winogrande 基准测试了语言模型使用二元选项解决模糊填空任务的能力,需要广义常识推理。

10 样本

HellaSwag

HellaSwag 基准测试通过为故事选择最符合逻辑的结局,考验语言模型理解和应用常识推理的能力。

4 样本

数学

MATH 可评估语言模型解决复杂数学文字问题的能力,这需要推理、多步骤解决问题以及对数学概念的理解。

0 样本

ARC-e

ARC-e 基准测试是真实的小学水平的单选题科学题,用于测试语言模型的高级问答技能。

0 样本

PIQA

PIQA 基准测试通过回答日常身体互动问题来测试语言模型理解和应用身体常识知识的能力。

0 样本

SIQA

SIQA 基准评估了语言模型通过询问有关人们行为及其社会影响的问题,对社交互动和社会常识的理解。

0 样本

Boolq

BoolQ 基准测试语言模型回答自然出现的是/非问题的能力,从而测试模型执行现实世界的自然语言推理任务的能力。

5 样本

TriviaQA

TriviaQA 这项基准测试以三倍的“问答证据”属性来测试阅读理解能力。

5 样本

NQ

NQ(自然语言)基准测试了语言模型模拟实际问答场景、在整个维基百科文章中查找和理解答案的能力。

通过@1

HumanEval

HumanEval 基准测试通过评估语言模型的解决方案是否通过针对编程问题的功能单元测试来测试语言模型的代码生成能力。

3 样本

MBPP

MBPP 基准测试测试语言模型解决基本 Python 编程问题的能力,重点关注基本编程概念和标准库用法。

100%

75%

50%

25%

0%

100%

75%

50%

25%

0%

Gemma 1

25 亿

42.3

Gemma 2

26 亿

51.3

Mistral

70 亿

62.5

LLAMA 3

8B

66.6

Gemma 1

70 亿

64.4

Gemma 2

90 亿

71.3

Gemma 2

270 亿

75.2

Gemma 1

25 亿

48.5

Gemma 2

26 亿

55.4

Mistral

70 亿

60.5

LLAMA 3

8B

59.2

Gemma 1

70 亿

61.1

Gemma 2

90 亿

68.4

Gemma 2

270 亿

71.4

Gemma 1

25 亿

15.1

Gemma 2

26 亿

23.9

Mistral

70 亿

39.6

LLAMA 3

8B

45.7

Gemma 1

70 亿

51.8

Gemma 2

90 亿

68.6

Gemma 2

270 亿

74.0

Gemma 1

25 亿

24.2

Gemma 2

26 亿

30.6

Mistral

70 亿

44.0

LLAMA 3

8B

45.9

Gemma 1

70 亿

44.9

Gemma 2

90 亿

52.8

Gemma 2

270 亿

55.1

Gemma 1

25 亿

35.2

Gemma 2

26 亿

41.9

Mistral

70 亿

56.0

LLAMA 3

8B

61.1

Gemma 1

70 亿

59.0

Gemma 2

90 亿

68.2

Gemma 2

270 亿

74.9

Gemma 1

25 亿

48.5

Gemma 2

26 亿

52.0

Mistral

70 亿

63.8

LLAMA 3

8B

58.4

Gemma 1

70 亿

56.3

Gemma 2

90 亿

69.4

Gemma 2

270 亿

74.2

Gemma 1

25 亿

66.8

Gemma 2

26 亿

70.9

Mistral

70 亿

78.5

LLAMA 3

8B

76.1

Gemma 1

70 亿

79.0

Gemma 2

90 亿

80.6

Gemma 2

270 亿

83.7

Gemma 1

25 亿

71.7

Gemma 2

26 亿

73.0

Mistral

70 亿

83.0

LLAMA 3

8B

82.0

Gemma 1

70 亿

82.3

Gemma 2

90 亿

81.9

Gemma 2

270 亿

86.4

Gemma 1

25 亿

11.8

Gemma 2

26 亿

15.0

Mistral

70 亿

12.7

Gemma 1

70 亿

24.3

Gemma 2

90 亿

36.6

Gemma 2

270 亿

42.3

Gemma 1

25 亿

73.2

Gemma 2

26 亿

80.1

Mistral

70 亿

80.5

Gemma 1

70 亿

81.5

Gemma 2

90 亿

88.0

Gemma 2

270 亿

88.6

Gemma 1

25 亿

77.3

Gemma 2

26 亿

77.8

Mistral

70 亿

82.2

Gemma 1

70 亿

81.2

Gemma 2

90 亿

81.7

Gemma 2

270 亿

83.2

Gemma 1

25 亿

49.7

Gemma 2

26 亿

51.9

Mistral

70 亿

47.0

Gemma 1

70 亿

51.8

Gemma 2

90 亿

53.4

Gemma 2

270 亿

53.7

Gemma 1

25 亿

69.4

Gemma 2

26 亿

72.5

Mistral

70 亿

83.2

Gemma 1

70 亿

83.2

Gemma 2

90 亿

84.2

Gemma 2

270 亿

84.8

Gemma 1

25 亿

53.2

Gemma 2

26 亿

59.4

Mistral

70 亿

62.5

Gemma 1

70 亿

63.4

Gemma 2

90 亿

76.6

Gemma 2

270 亿

83.7

Gemma 1

25 亿

12.5

Gemma 2

26 亿

16.7

Mistral

70 亿

23.2

Gemma 1

70 亿

23.0

Gemma 2

90 亿

29.2

Gemma 2

270 亿

34.5

Gemma 1

25 亿

22.0

Gemma 2

26 亿

17.7

Mistral

70 亿

26.2

Gemma 1

70 亿

32.3

Gemma 2

90 亿

40.2

Gemma 2

270 亿

51.8

Gemma 1

25 亿

29.2

Gemma 2

26 亿

29.6

Mistral

70 亿

40.2

Gemma 1

70 亿

44.4

Gemma 2

90 亿

52.4

Gemma 2

270 亿

62.6

*这些是预训练模型的基准,请参阅技术报告,详细了解其他方法的性能。

<ph type="x-smartling-placeholder"></ph> 阅读技术报告

面向开发者的快速入门指南

Gemma 食谱

探索一系列实用食谱和示例,展示 Gemma 的强大功能和多功能性,例如使用 PaliGemma 制作图片标注、使用 CodeGemma 生成代码,以及使用经过微调的 Gemma 模型构建聊天机器人。

<ph type="x-smartling-placeholder"></ph> 开始烹饪

Responsible AI 开发

从设计上保证责任

使用经过精心挑选的数据进行预训练,并在最基础上针对安全性进行了调整,帮助利用 Gemma 模型以安全且负责任的方式开发 AI。

可靠透明的评估

全面的评估和透明的报告揭示了模型限制,为每个应用场景采用负责任的方法。

助力负责任的开发

Responsible AI 工具包支持开发者设计和实施 Responsible AI 最佳实践。

<ph type="x-smartling-placeholder"></ph> 探索 Responsible Gen AI 工具包
Google Cloud 图标

专为 Google Cloud 优化

借助 Google Cloud 上的 Gemma 模型,您可以使用 Vertex AI 的全代管式工具或 GKE 的自行管理方案,根据自己的具体需求对模型进行深度自定义,并将其部署到灵活且经济实惠的 AI 优化型基础架构中。

<ph type="x-smartling-placeholder"></ph> 前往 Google Cloud 博客了解详情

利用 Google Cloud 赠金加快学术研究

学术研究计划于近期结束了申请阶段,授予了 Google Cloud 赠金,以支持使用 Gemma 模型突破科学发现极限的研究人员。我们非常高兴看到这一计划所带来的开创性研究。

敬请关注未来利用 Google Cloud 推进研究的机会。

加入社区

与机器学习模型社区中的其他人交流、探索并分享您的知识。