“从设计上保证负责任”图标

从设计上保证负责任

这些模型整合了全方位的安全措施,采用精选数据集并经过严谨调优,旨在助力打造负责任、值得信赖的 AI 解决方案。

“卓越性能”图标

无论何种大小,均有卓越性能

即使只有 20 亿、70 亿、90 亿和 270 亿参数,Gemma 模型也能在基准测试中取得优异成绩,甚至超越了一些更大的开放模型。

框架灵活

灵活部署

使用 Keras、JAX、MediaPipe、PyTorch、Hugging Face 等工具,无缝部署到移动设备、网站和云端。

5 连拍

MMLU

MMLU 基准测试用于衡量大语言模型在预训练期间获得的知识广度和问题解决能力。

25 张

ARC-C

ARC-c 基准是 ARC-e 数据集的更专注的子集,仅包含常见(基于检索和基于词语共现)算法回答错误的问题。

5 连拍

GSM8K

GSM8K 基准测试语言模型解决小学数学问题的能力,这些问题通常需要多步推理。

3-5 个镜头

AGIEval

AGIEval 基准测试使用从实际考试中衍生的问题来测试语言模型的通用智能,这些考试旨在评估人类的智力能力。

3 个镜头,CoT

BBH

BBH(BIG-Bench Hard)基准测试侧重于测试当前语言模型无法完成的任务,在各种推理和理解领域测试其极限。

3 张照片,F1

DROP

DROP 是一项阅读理解基准测试,需要对段落进行离散推理。

5 连拍

Winogrande

Winogrande 基准测试语言模型解决含有二元选项的模糊填空任务的能力,需要进行泛化常识推理。

10 张照片

HellaSwag

HellaSwag 基准测试通过选择故事最合乎逻辑的结局,考验语言模型理解和运用常识推理的能力。

4 个镜头

MATH

MATH 用于评估语言模型解决复杂数学应用题的能力,这类题目需要推理、多步骤解题和理解数学概念。

零样本

ARC-e

ARC-e 基准测试使用真实的小学级科学多选题来测试语言模型的高级问答能力。

零样本

PIQA

PIQA 基准测试通过回答有关日常物理互动的问题,测试语言模型理解和应用物理常识知识的能力。

零样本

SIQA

SIQA 基准测试会通过询问与人们的行为及其社会影响有关的问题,评估语言模型对社交互动和社会常识的理解。

零样本

Boolq

BoolQ 基准测试语言模型回答自然发生的“是/否”问题的能力,从而测试模型执行真实自然语言推理任务的能力。

5 连拍

TriviaQA

TriviaQA 基准测试使用题目-答案-证据三元组来测试阅读理解能力。

5 连拍

NQ

NQ(自然问题)基准测试旨在测试语言模型在整个维基百科文章中查找和理解答案的能力,从而模拟真实问答场景。

pass@1

HumanEval

HumanEval 基准测试通过评估语言模型的解决方案是否通过编程问题的功能单元测试来测试语言模型的代码生成能力。

3 连拍

MBPP

MBPP 基准测试会测试语言模型解决基本 Python 编程问题的能力,重点关注编程基础知识和标准库用法。

100%

75%

50%

25%

0%

100%

75%

50%

25%

0%

Gemma 1

25 亿

42.3

Gemma 2

26 亿

51.3

Mistral

70 亿

62.5

LLAMA 3

8B

66.6

Gemma 1

70 亿

64.4

Gemma 2

90 亿

71.3

Gemma 2

270 亿

75.2

Gemma 1

25 亿

48.5

Gemma 2

26 亿

55.4

Mistral

70 亿

60.5

LLAMA 3

8B

59.2

Gemma 1

70 亿

61.1

Gemma 2

90 亿

68.4

Gemma 2

270 亿

71.4

Gemma 1

25 亿

15.1

Gemma 2

26 亿

23.9

Mistral

70 亿

39.6

LLAMA 3

8B

45.7

Gemma 1

70 亿

51.8

Gemma 2

90 亿

68.6

Gemma 2

270 亿

74.0

Gemma 1

25 亿

24.2

Gemma 2

26 亿

30.6

Mistral

70 亿

44.0

LLAMA 3

8B

45.9

Gemma 1

70 亿

44.9

Gemma 2

90 亿

52.8

Gemma 2

270 亿

55.1

Gemma 1

25 亿

35.2

Gemma 2

26 亿

41.9

Mistral

70 亿

56.0

LLAMA 3

8B

61.1

Gemma 1

70 亿

59.0

Gemma 2

90 亿

68.2

Gemma 2

270 亿

74.9

Gemma 1

25 亿

48.5

Gemma 2

26 亿

52.0

Mistral

70 亿

63.8

LLAMA 3

8B

58.4

Gemma 1

70 亿

56.3

Gemma 2

90 亿

69.4

Gemma 2

270 亿

74.2

Gemma 1

25 亿

66.8

Gemma 2

26 亿

70.9

Mistral

70 亿

78.5

LLAMA 3

8B

76.1

Gemma 1

70 亿

79.0

Gemma 2

90 亿

80.6

Gemma 2

270 亿

83.7

Gemma 1

25 亿

71.7

Gemma 2

26 亿

73.0

Mistral

70 亿

83.0

LLAMA 3

8B

82.0

Gemma 1

70 亿

82.3

Gemma 2

90 亿

81.9

Gemma 2

270 亿

86.4

Gemma 1

25 亿

11.8

Gemma 2

26 亿

15.0

Mistral

70 亿

12.7

Gemma 1

70 亿

24.3

Gemma 2

90 亿

36.6

Gemma 2

270 亿

42.3

Gemma 1

25 亿

73.2

Gemma 2

26 亿

80.1

Mistral

70 亿

80.5

Gemma 1

70 亿

81.5

Gemma 2

90 亿

88.0

Gemma 2

270 亿

88.6

Gemma 1

25 亿

77.3

Gemma 2

26 亿

77.8

Mistral

70 亿

82.2

Gemma 1

70 亿

81.2

Gemma 2

90 亿

81.7

Gemma 2

270 亿

83.2

Gemma 1

25 亿

49.7

Gemma 2

26 亿

51.9

Mistral

70 亿

47.0

Gemma 1

70 亿

51.8

Gemma 2

90 亿

53.4

Gemma 2

270 亿

53.7

Gemma 1

25 亿

69.4

Gemma 2

26 亿

72.5

Mistral

70 亿

83.2

Gemma 1

70 亿

83.2

Gemma 2

90 亿

84.2

Gemma 2

270 亿

84.8

Gemma 1

25 亿

53.2

Gemma 2

26 亿

59.4

Mistral

70 亿

62.5

Gemma 1

70 亿

63.4

Gemma 2

90 亿

76.6

Gemma 2

270 亿

83.7

Gemma 1

25 亿

12.5

Gemma 2

26 亿

16.7

Mistral

70 亿

23.2

Gemma 1

70 亿

23.0

Gemma 2

90 亿

29.2

Gemma 2

270 亿

34.5

Gemma 1

25 亿

22.0

Gemma 2

26 亿

17.7

Mistral

70 亿

26.2

Gemma 1

70 亿

32.3

Gemma 2

90 亿

40.2

Gemma 2

270 亿

51.8

Gemma 1

25 亿

29.2

Gemma 2

26 亿

29.6

Mistral

70 亿

40.2

Gemma 1

70 亿

44.4

Gemma 2

90 亿

52.4

Gemma 2

270 亿

62.6

*这些是预训练模型的基准,如需详细了解其他方法的效果,请参阅技术报告。

PaliGemma 2

PaliGemma 2 为 Gemma 2 语言模型带来了可轻松微调的视觉功能,支持各种结合文本和图片理解的应用。

DataGemma

DataGemma 是首批旨在将 LLM 与 Google 数据公共平台中丰富的真实数据相关联的开放式模型。

Gemma 镜重

Gemma Scope 可让研究人员前所未有地深入了解 Gemma 2 模型的决策过程。

探索 Gemmaverse

由社区创建的 Gemma 模型和工具构成的庞大生态系统,可为您的创新提供支持和灵感

部署模型

选择部署目标

“部署移动应用”图标移动设备

使用 Google AI Edge 在设备端部署

直接部署到设备,实现低延迟离线功能。非常适合需要实时响应能力和隐私保护的应用,例如移动应用、IoT 设备和嵌入式系统。

Web 图标网站

无缝集成到 Web 应用

借助先进的 AI 功能,为您的网站和 Web 服务赋能,实现互动功能、个性化内容和智能自动化。

云图标

借助云基础架构轻松扩缩

利用云的可伸缩性和灵活性,处理大规模部署、要求苛刻的工作负载和复杂的 AI 应用。