「負責任的設計」圖示

融入負責考量的設計

這些模型採用全面的安全措施,透過精心挑選的資料集和嚴格的調整,確保提供負責任且值得信賴的 AI 解決方案。

不相符的效能圖示

無可匹敵的規模

Gemma 模型在 20 億、70 億、90 億和 270 億的大小下,都獲得出色的基準測試結果,甚至勝過部分較大的開放式模型。

架構彈性

彈性部署

使用 Keras、JAX、MediaPipe、PyTorch、Hugging Face 等工具,順暢地將模型部署至行動裝置、網頁和雲端。

5 格畫面

MMLU

MMLU 基準測試可評估大型語言模型在預先訓練期間獲得的知識廣度和解決問題能力。

25 格

ARC-C

ARC-c 基準是 ARC-e 資料集的更精確子集,只包含常見 (擷取和字詞共現) 演算法回答錯誤的問題。

5 格式

GSM8K

GSM8K 基準測試可測試語言模型解決小學程度數學問題的能力,而這類問題通常需要多個推理步驟才能解決。

3-5-shot

AGIEval

AGIEval 基準測試會使用來自實際考試的問題,測試語言模型的一般智慧,這些考試旨在評估人類的智力。

3 次拍攝、思維鏈

BBH

BBH (BIG-Bench Hard) 基準測試著重於目前語言模型無法勝任的任務,在各種推理和理解領域測試其極限。

3 張相片,F1

丟棄

DROP 是閱讀理解基準測驗,需要針對段落進行獨立推理。

5 格式

Winogrande

Winogrande 基準測試可測試語言模型解決含糊的填空題任務的能力,這些任務需要一般常識推理,並提供二元選項。

10 格

HellaSwag

HellaSwag 基準測試會要求語言模型選擇最合乎邏輯的故事結局,以測試模型理解和運用常識推理的能力。

4 格式

MATH

MATH 會評估語言模型解決複雜數學應用題的能力,這類題目需要推理、多步驟解題,以及理解數學概念。

0 張相片

ARC-e

ARC-e 基準測試會使用真實的國中科學選擇題,測試語言模型的進階問答技巧。

0 張相片

PIQA

PIQA 基準測試會透過回答日常物理互動問題,測試語言模型理解和運用物理常識知識的能力。

0 張相片

SIQA

SIQA 基準評估語言模型對社交互動和社會常識的理解程度,方法是詢問有關人類行為和社會意涵的問題。

0 張相片

Boolq

BoolQ 基準測試可測試語言模型回答自然出現的「是/否」問題的能力,藉此測試模型執行真實自然語言推論作業的能力。

5 格式

TriviaQA

TriviaQA 基準測試會使用問答證據三元組測試閱讀理解技巧。

5 格式

NQ

NQ (自然問題) 基準測試可測試語言模型在整篇維基百科文章中尋找及理解答案的能力,模擬真實的問答情境。

pass@1

HumanEval

HumanEval 基準測試會評估語言模型的解決方案是否通過程式設計問題的功能單元測試,以此測試語言模型的程式碼產生能力。

3 張相片

MBPP

MBPP 基準測試可測試語言模型解決基本 Python 程式設計問題的能力,並著重於基本程式設計概念和標準程式庫的使用方式。

100%

75%

50%

25%

0%

100%

75%

50%

25%

0%

Gemma 1

25 億

42.3

Gemma 2

26 億

51.3

Mistral

7B

62.5

LLAMA 3

8B

66.6

Gemma 1

7B

64.4

Gemma 2

90 億

71.3

Gemma 2

27B

75.2

Gemma 1

25 億

48.5

Gemma 2

2.6B

55.4

Mistral

7B

60.5

LLAMA 3

8B

59.2

Gemma 1

7B

61.1

Gemma 2

90 億

68.4

Gemma 2

27B

71.4

Gemma 1

25 億

15.1

Gemma 2

2.6B

23.9

Mistral

7B

39.6

LLAMA 3

8B

45.7

Gemma 1

7B

51.8

Gemma 2

90 億

68.6

Gemma 2

27B

74.0

Gemma 1

25 億

24.2

Gemma 2

2.6B

30.6

Mistral

7B

44.0

LLAMA 3

8B

45.9

Gemma 1

7B

44.9

Gemma 2

90 億

52.8

Gemma 2

27B

55.1

Gemma 1

25 億

35.2

Gemma 2

26 億

41.9

Mistral

7B

56.0

LLAMA 3

8B

61.1

Gemma 1

7B

59.0

Gemma 2

90 億

68.2

Gemma 2

27B

74.9

Gemma 1

25 億

48.5

Gemma 2

26 億

52.0

Mistral

7B

63.8

LLAMA 3

8B

58.4

Gemma 1

7B

56.3

Gemma 2

90 億

69.4

Gemma 2

27B

74.2

Gemma 1

25 億

66.8

Gemma 2

26 億

70.9

Mistral

7B

78.5

LLAMA 3

8B

76.1

Gemma 1

7B

79.0

Gemma 2

90 億

80.6

Gemma 2

27B

83.7

Gemma 1

25 億

71.7

Gemma 2

2.6B

73.0

Mistral

7B

83.0

LLAMA 3

8B

82.0

Gemma 1

7B

82.3

Gemma 2

90 億

81.9

Gemma 2

27B

86.4

Gemma 1

25 億

11.8

Gemma 2

2.6B

15.0

Mistral

7B

12.7

Gemma 1

7B

24.3

Gemma 2

90 億

36.6

Gemma 2

27B

42.3

Gemma 1

25 億

73.2

Gemma 2

2.6B

80.1

Mistral

7B

80.5

Gemma 1

7B

81.5

Gemma 2

90 億

88.0

Gemma 2

27B

88.6

Gemma 1

25 億

77.3

Gemma 2

26 億

77.8

Mistral

7B

82.2

Gemma 1

7B

81.2

Gemma 2

90 億

81.7

Gemma 2

27B

83.2

Gemma 1

25 億

49.7

Gemma 2

2.6B

51.9

Mistral

7B

47.0

Gemma 1

7B

51.8

Gemma 2

90 億

53.4

Gemma 2

27B

53.7

Gemma 1

25 億

69.4

Gemma 2

2.6B

72.5

Mistral

7B

83.2

Gemma 1

7B

83.2

Gemma 2

90 億

84.2

Gemma 2

27B

84.8

Gemma 1

25 億

53.2

Gemma 2

2.6B

59.4

Mistral

7B

62.5

Gemma 1

7B

63.4

Gemma 2

90 億

76.6

Gemma 2

27B

83.7

Gemma 1

25 億

12.5

Gemma 2

2.6B

16.7

Mistral

7B

23.2

Gemma 1

7B

23.0

Gemma 2

90 億

29.2

Gemma 2

27B

34.5

Gemma 1

25 億

22.0

Gemma 2

26 億

17.7

Mistral

7B

26.2

Gemma 1

7B

32.3

Gemma 2

90 億

40.2

Gemma 2

27B

51.8

Gemma 1

25 億

29.2

Gemma 2

26 億

29.6

Mistral

7B

40.2

Gemma 1

7B

44.4

Gemma 2

90 億

52.4

Gemma 2

27B

62.6

*這是預先訓練模型的基準,如要進一步瞭解其他方法的成效,請參閱技術報告。

PaliGemma 2 新功能

PaliGemma 2 為 Gemma 2 語言模型提供容易微調的視覺功能,讓各種應用程式都能結合文字和圖像理解功能。

DataGemma

DataGemma 是第一個開放式模型,可將 LLM 與 Google Data Commons 提供的大量實際資料連結。

Gemma 範圍

Gemma Scope 可讓研究人員瞭解 Gemma 2 模型的決策過程,提供前所未有的透明度。

可部署模型

選擇部署目標

部署行動裝置圖示行動裝置

使用 Google AI Edge 在裝置上部署

直接部署至裝置,以便使用低延遲的離線功能。非常適合需要即時回應和隱私權的應用程式,例如行動應用程式、物聯網裝置和嵌入式系統。

網頁圖示網頁

完美整合至網頁應用程式

為網站和網路服務提供進階 AI 技術,讓您提供互動功能、個人化內容和智慧自動化功能。

雲端圖示雲端

透過雲端基礎架構輕鬆調度資源

善用雲端的擴充性和彈性,處理大規模部署、嚴苛的工作負載和複雜的 AI 應用程式。

開啟全球溝通管道

參加全球 Kaggle 競賽。為特定語言或獨特文化方面建立 Gemma 模型變化版本