Mô hình mở Gemma

Một nhóm các mô hình mở, hiện đại và gọn nhẹ được xây dựng từ cùng một nghiên cứu và công nghệ dùng để tạo mô hình Gemini

Biểu tượng Trách nhiệm trong thiết kế

Trách nhiệm từ trong thiết kế

Bằng cách kết hợp các biện pháp an toàn toàn diện, những mô hình này giúp đảm bảo các giải pháp AI có trách nhiệm và đáng tin cậy thông qua các tập dữ liệu được tuyển chọn và điều chỉnh nghiêm ngặt.

Biểu tượng hiệu suất không khớp

Hiệu suất không phù hợp với kích thước

Các mô hình Gemma đạt được kết quả điểm chuẩn vượt trội ở kích thước 2B, 7B, 9B và 27B, thậm chí còn vượt trội hơn một số mô hình mở lớn hơn.

Khung linh hoạt

Triển khai linh hoạt

Triển khai liền mạch cho thiết bị di động, web và đám mây bằng Keras, JAX, MediaPipe, PyTorch, Hugging Face và nhiều công cụ khác.

Dùng thử Gemma 2

Được thiết kế lại để mang lại hiệu suất vượt trội và hiệu quả không thể so sánh, Gemma 2 tối ưu hoá để dự đoán nhanh chóng trên nhiều loại phần cứng.

5 lần chụp

MMLU

Điểm chuẩn MMLU là một bài kiểm tra đo lường phạm vi kiến thức và khả năng giải quyết vấn đề mà các mô hình ngôn ngữ lớn có được trong quá trình huấn luyện trước.

25 ảnh

ARC-C

Điểm chuẩn ARC-c là một tập hợp con tập trung hơn của tập dữ liệu ARC-e, chỉ chứa những câu hỏi mà các thuật toán phổ biến (dựa trên truy xuất và đồng xuất hiện từ) trả lời không chính xác.

5 lần chụp

GSM8K

Điểm chuẩn GSM8K kiểm tra khả năng của một mô hình ngôn ngữ trong việc giải các bài toán ở cấp tiểu học, thường đòi hỏi nhiều bước suy luận.

3-5-shot

AGIEval

Điểm chuẩn AGIEval kiểm tra trí thông minh chung của một mô hình ngôn ngữ bằng cách sử dụng các câu hỏi bắt nguồn từ các bài kiểm tra thực tế được thiết kế để đánh giá khả năng trí tuệ của con người.

3 lần chụp, CoT

BBH

Điểm chuẩn BBH (BIG-Bench Hard) tập trung vào các nhiệm vụ được coi là vượt quá khả năng của các mô hình ngôn ngữ hiện tại, kiểm tra giới hạn của các mô hình này trên nhiều lĩnh vực suy luận và hiểu biết.

3 shot, F1

CÚI THẤP

DROP là điểm chuẩn về khả năng đọc hiểu, đòi hỏi phải có khả năng suy luận riêng biệt về các đoạn văn.

5 lần chụp

Winogrande

Điểm chuẩn Winogrande kiểm tra khả năng của một mô hình ngôn ngữ để giải quyết các nhiệm vụ điền vào chỗ trống không rõ ràng bằng các tuỳ chọn nhị phân, đòi hỏi phải có lý luận thông thường được tổng quát hoá.

10 cảnh

HellaSwag

Điểm chuẩn HellaSwag kiểm tra khả năng của mô hình ngôn ngữ trong việc hiểu và áp dụng suy luận theo lẽ thường bằng cách chọn kết thúc hợp lý nhất cho một câu chuyện.

4 cảnh quay

MATH

MATH đánh giá khả năng của một mô hình ngôn ngữ trong việc giải các bài toán đố toán học phức tạp, đòi hỏi phải suy luận, giải quyết vấn đề theo nhiều bước và hiểu các khái niệm toán học.

0-shot

ARC-e

Điểm chuẩn ARC-e kiểm tra kỹ năng trả lời câu hỏi nâng cao của một mô hình ngôn ngữ bằng các câu hỏi khoa học dạng trắc nghiệm ở cấp tiểu học.

0-shot

PIQA

Điểm chuẩn PIQA kiểm tra khả năng của một mô hình ngôn ngữ trong việc hiểu và áp dụng kiến thức thông thường về vật lý bằng cách trả lời các câu hỏi về các hoạt động tương tác vật lý hằng ngày.

0-shot

SIQA

Điểm chuẩn SIQA đánh giá khả năng hiểu biết của một mô hình ngôn ngữ về các hoạt động tương tác xã hội và tri thức xã hội thông thường bằng cách đặt câu hỏi về hành động của con người và tác động xã hội của hành động đó.

0-shot

Boolq

Điểm chuẩn BoolQ kiểm tra khả năng của mô hình ngôn ngữ trong việc trả lời các câu hỏi có/không xuất hiện tự nhiên, kiểm tra khả năng của mô hình trong việc thực hiện các nhiệm vụ suy luận bằng ngôn ngữ tự nhiên trong thực tế.

5 lần chụp

TriviaQA

Điểm chuẩn TriviaQA kiểm tra kỹ năng đọc hiểu bằng bộ ba câu hỏi-đáp án-bằng chứng.

5 lần chụp

NQ

Điểm chuẩn NQ (Câu hỏi tự nhiên) kiểm tra khả năng của một mô hình ngôn ngữ trong việc tìm và hiểu câu trả lời trong toàn bộ bài viết trên Wikipedia, mô phỏng các tình huống trả lời câu hỏi trong thực tế.

pass@1

HumanEval

Điểm chuẩn HumanEval kiểm tra khả năng tạo mã của mô hình ngôn ngữ bằng cách đánh giá xem các giải pháp của mô hình có vượt qua các bài kiểm thử đơn vị chức năng cho các vấn đề lập trình hay không.

3 lần chụp

MBPP

Điểm chuẩn MBPP kiểm tra khả năng của một mô hình ngôn ngữ trong việc giải quyết các vấn đề lập trình Python cơ bản, tập trung vào các khái niệm lập trình cơ bản và cách sử dụng thư viện chuẩn.

100%

75%

50%

25%

0%

100%

75%

50%

25%

0%

Gemma 1

2,5 tỷ

42,3

Gemma 2

2,6 tỷ

51,3

Mistral

7 tỷ

62,5

LLAMA 3

8B

66,6

Gemma 1

7 tỷ

64,4

Gemma 2

9B

71,3

Gemma 2

27 tỷ

75,2

Gemma 1

2,5 tỷ

48,5

Gemma 2

2,6 tỷ

55,4

Mistral

7 tỷ

60,5

LLAMA 3

8B

59,2

Gemma 1

7 tỷ

61,1

Gemma 2

9B

68,4

Gemma 2

27 tỷ

71,4

Gemma 1

2,5 tỷ

15.1

Gemma 2

2,6 tỷ

23,9

Mistral

7 tỷ

39,6

LLAMA 3

8B

45,7

Gemma 1

7 tỷ

51,8

Gemma 2

9B

68,6

Gemma 2

27 tỷ

74

Gemma 1

2,5 tỷ

24,2

Gemma 2

2,6 tỷ

30,6

Mistral

7 tỷ

44.0

LLAMA 3

8B

45,9

Gemma 1

7 tỷ

44,9

Gemma 2

9B

52,8

Gemma 2

27 tỷ

55.1

Gemma 1

2,5 tỷ

35.2

Gemma 2

2,6 tỷ

41,9

Mistral

7 tỷ

56

LLAMA 3

8B

61,1

Gemma 1

7 tỷ

59,0

Gemma 2

9B

68.2

Gemma 2

27 tỷ

74,9

Gemma 1

2,5 tỷ

48,5

Gemma 2

2,6 tỷ

52

Mistral

7 tỷ

63,8

LLAMA 3

8B

58,4

Gemma 1

7 tỷ

56,3

Gemma 2

9B

69,4

Gemma 2

27 tỷ

74,2

Gemma 1

2,5 tỷ

66,8

Gemma 2

2,6 tỷ

70,9

Mistral

7 tỷ

78,5

LLAMA 3

8B

76,1

Gemma 1

7 tỷ

79

Gemma 2

9B

80,6

Gemma 2

27 tỷ

83,7

Gemma 1

2,5 tỷ

71,7

Gemma 2

2,6 tỷ

73

Mistral

7 tỷ

83

LLAMA 3

8B

82

Gemma 1

7 tỷ

82,3

Gemma 2

9B

81,9

Gemma 2

27 tỷ

86,4

Gemma 1

2,5 tỷ

11.8

Gemma 2

2,6 tỷ

15

Mistral

7 tỷ

12,7

Gemma 1

7 tỷ

24,3

Gemma 2

9B

36,6

Gemma 2

27 tỷ

42,3

Gemma 1

2,5 tỷ

73,2

Gemma 2

2,6 tỷ

80,1

Mistral

7 tỷ

80,5

Gemma 1

7 tỷ

81,5

Gemma 2

9B

88,0

Gemma 2

27 tỷ

88,6

Gemma 1

2,5 tỷ

77,3

Gemma 2

2,6 tỷ

77,8

Mistral

7 tỷ

82,2

Gemma 1

7 tỷ

81,2

Gemma 2

9B

81,7

Gemma 2

27 tỷ

83,2

Gemma 1

2,5 tỷ

49,7

Gemma 2

2,6 tỷ

51,9

Mistral

7 tỷ

47.0

Gemma 1

7 tỷ

51,8

Gemma 2

9B

53,4

Gemma 2

27 tỷ

53,7

Gemma 1

2,5 tỷ

69,4

Gemma 2

2,6 tỷ

72,5

Mistral

7 tỷ

83,2

Gemma 1

7 tỷ

83,2

Gemma 2

9B

84,2

Gemma 2

27 tỷ

84,8

Gemma 1

2,5 tỷ

53,2

Gemma 2

2,6 tỷ

59,4

Mistral

7 tỷ

62,5

Gemma 1

7 tỷ

63,4

Gemma 2

9B

76,6

Gemma 2

27 tỷ

83,7

Gemma 1

2,5 tỷ

12,5

Gemma 2

2,6 tỷ

16,7

Mistral

7 tỷ

23,2

Gemma 1

7 tỷ

23.0

Gemma 2

9B

29,2

Gemma 2

27 tỷ

34,5

Gemma 1

2,5 tỷ

22.0

Gemma 2

2,6 tỷ

17,7

Mistral

7 tỷ

26,2

Gemma 1

7 tỷ

32.3

Gemma 2

9B

40,2

Gemma 2

27 tỷ

51,8

Gemma 1

2,5 tỷ

29,2

Gemma 2

2,6 tỷ

29,6

Mistral

7 tỷ

40,2

Gemma 1

7 tỷ

44,4

Gemma 2

9B

52,4

Gemma 2

27 tỷ

62,6

*Đây là điểm chuẩn cho các mô hình được huấn luyện trước, hãy xem báo cáo kỹ thuật để biết thông tin chi tiết về hiệu suất với các phương pháp khác.

PaliGemma 2 Mới

PaliGemma 2 mang đến các tính năng thị giác dễ dàng điều chỉnh cho các mô hình ngôn ngữ Gemma 2, cho phép nhiều ứng dụng kết hợp việc hiểu văn bản và hình ảnh.

DataGemma

DataGemma là các mô hình mở đầu tiên được thiết kế để kết nối LLM với dữ liệu phong phú trong thế giới thực được lấy từ Data Commons của Google.

Phạm vi Gemma

Gemma Scope cung cấp cho các nhà nghiên cứu thông tin minh bạch chưa từng có về quy trình ra quyết định của các mô hình Gemma 2.

Khám phá Gemmaverse

Một hệ sinh thái rộng lớn gồm các mô hình và công cụ Gemma do cộng đồng tạo ra, sẵn sàng hỗ trợ và truyền cảm hứng cho sự đổi mới của bạn

Triển khai mô hình

Chọn mục tiêu triển khai

Biểu tượng Triển khai thiết bị di độngThiết bị di động

Triển khai trên thiết bị bằng Google AI Edge

Triển khai trực tiếp trên thiết bị để có chức năng ngoại tuyến, độ trễ thấp. Lý tưởng cho các ứng dụng yêu cầu khả năng phản hồi và quyền riêng tư theo thời gian thực, chẳng hạn như ứng dụng di động, thiết bị IoT và hệ thống nhúng.

Biểu tượng webWeb

Tích hợp liền mạch vào các ứng dụng web

Nâng cao hiệu quả cho trang web và dịch vụ web của bạn bằng các tính năng AI nâng cao, cho phép các tính năng tương tác, nội dung được cá nhân hoá và tính năng tự động hoá thông minh.

Biểu tượng đám mâyĐám mây

Dễ dàng mở rộng quy mô bằng cơ sở hạ tầng đám mây

Tận dụng khả năng mở rộng và linh hoạt của đám mây để xử lý các hoạt động triển khai trên quy mô lớn, khối lượng công việc đòi hỏi cao và các ứng dụng AI phức tạp.

Mở khoá khả năng giao tiếp trên toàn cầu

Tham gia cuộc thi Kaggle toàn cầu của chúng tôi. Tạo biến thể mô hình Gemma cho một ngôn ngữ cụ thể hoặc khía cạnh văn hoá độc đáo