Mô hình Gemma mở
Một dòng mô hình mở, gọn nhẹ, hiện đại, được xây dựng dựa trên chính nghiên cứu và công nghệ dùng để tạo ra các mô hình Gemini
Giới thiệu
Gemma 2
Được thiết kế lại để mang lại hiệu suất vượt trội và hiệu quả chưa từng có, Gemma 2 tối ưu hoá cho khả năng suy luận cực nhanh trên phần cứng đa dạng.
5 ảnh
MMLU
Điểm chuẩn MMLU là một bài kiểm tra đánh giá phạm vi kiến thức và khả năng giải quyết vấn đề mà các mô hình ngôn ngữ lớn có được trong quá trình huấn luyện trước.
25 bức ảnh
ARC-C
Điểm chuẩn ARC-c là một tập dữ liệu ARC-e tập trung nhiều hơn, trong đó chỉ bao gồm những câu hỏi có câu trả lời sai bằng các thuật toán phổ biến (cơ sở truy xuất và từ cùng xuất hiện).
5 ảnh
GSM8K
Điểm chuẩn GSM8K kiểm tra khả năng giải các bài toán toán học ở cấp trường của một mô hình ngôn ngữ thường yêu cầu nhiều bước lập luận.
3-5 ảnh
AGIEval
Điểm chuẩn AGIEval kiểm tra trí thông minh tổng quát của mô hình ngôn ngữ bằng cách sử dụng các câu hỏi thu được từ các bài kiểm tra thực tế được thiết kế để đánh giá khả năng trí tuệ của con người.
Mũi tên 3 điểm, CoT
BBH
Điểm chuẩn BBH (BIG-Bench Hard) tập trung vào những nhiệm vụ được xem là vượt quá khả năng của các mô hình ngôn ngữ hiện tại, kiểm tra các giới hạn của những nhiệm vụ đó trên nhiều miền lý luận và hiểu biết.
3 ảnh, F1
CÚI THẤP
DROP là một điểm chuẩn kiểm tra đọc hiểu, đòi hỏi bạn phải có khả năng suy luận riêng biệt trong các đoạn văn.
5 ảnh
Tiếng Winogrande
Điểm chuẩn Winogrande kiểm tra khả năng giải quyết các công việc điền vào chỗ trống không rõ ràng của mô hình ngôn ngữ bằng quyền chọn nhị phân, đòi hỏi khả năng lập luận chung tổng quát.
Chụp 10 tấm
HellaSwag
Điểm chuẩn HellaSwag thử thách khả năng hiểu và áp dụng lập luận theo lý luận thông thường của một mô hình ngôn ngữ bằng cách chọn phần kết hợp lý nhất cho câu chuyện.
4 tấm
TOÁN
MATH đánh giá khả năng giải các bài toán đố phức tạp của một mô hình ngôn ngữ, đòi hỏi khả năng suy luận, giải quyết vấn đề qua nhiều bước và hiểu biết về các khái niệm toán học.
ảnh 0
ARC-e
Điểm chuẩn ARC-e sẽ kiểm tra kỹ năng trả lời câu hỏi nâng cao của một mô hình ngôn ngữ thông qua các câu hỏi khoa học trắc nghiệm, cấp trường học thực sự.
ảnh 0
PIQA
Điểm chuẩn PIQA kiểm tra khả năng hiểu và áp dụng kiến thức vật lý thông thường của một mô hình ngôn ngữ bằng cách trả lời các câu hỏi về các tương tác vật lý thường ngày.
ảnh 0
SIQA
Điểm chuẩn SIQA đánh giá mức độ hiểu biết của một mô hình ngôn ngữ về tương tác xã hội và ý thức xã hội thông thường bằng cách đặt câu hỏi về hành động của người dùng và ý nghĩa xã hội của họ.
ảnh 0
Boolq
Điểm chuẩn BoolQ kiểm tra khả năng trả lời các câu hỏi có/không xuất hiện tự nhiên của một mô hình ngôn ngữ, kiểm tra khả năng của các mô hình trong việc suy luận ngôn ngữ tự nhiên trong thực tế.
5 ảnh
TriviaQA
Điểm chuẩn của TriviaQA kiểm tra kỹ năng đọc hiểu với bộ ba số bằng chứng theo câu hỏi-trả lời.
5 ảnh
NQ
Điểm chuẩn NQ (Câu hỏi tự nhiên) kiểm tra khả năng tìm và hiểu câu trả lời của mô hình ngôn ngữ trong toàn bộ các bài viết trên Wikipedia, mô phỏng các tình huống trả lời câu hỏi trong thế giới thực.
truyền@1
HumanEval
Điểm chuẩn HumanEval kiểm thử khả năng tạo mã của mô hình ngôn ngữ bằng cách đánh giá xem các giải pháp của mô hình đó có vượt qua các bài kiểm thử đơn vị chức năng cho các vấn đề lập trình hay không.
Chụp 3 tấm
MBPP
Điểm chuẩn MBPP kiểm tra khả năng giải quyết các vấn đề lập trình Python cơ bản của mô hình ngôn ngữ, tập trung vào các khái niệm lập trình cơ bản và việc sử dụng thư viện tiêu chuẩn.
100%
75%
50%
25%
0%
100%
75%
50%
25%
0%
Gemma 1
2,5 tỷ
Gemma 2
2,6 TỶ
Mistral
7 TỶ
LLAMA 3 (Mã LLAMA 3)
8 TỶ
Gemma 1
7 TỶ
Gemma 2
9 TỶ
Gemma 2
27 TỶ
Gemma 1
2,5 tỷ
Gemma 2
2,6 TỶ
Mistral
7 TỶ
LLAMA 3 (Mã LLAMA 3)
8 TỶ
Gemma 1
7 TỶ
Gemma 2
9 TỶ
Gemma 2
27 TỶ
Gemma 1
2,5 tỷ
Gemma 2
2,6 TỶ
Mistral
7 TỶ
LLAMA 3 (Mã LLAMA 3)
8 TỶ
Gemma 1
7 TỶ
Gemma 2
9 TỶ
Gemma 2
27 TỶ
Gemma 1
2,5 tỷ
Gemma 2
2,6 TỶ
Mistral
7 TỶ
LLAMA 3
8 TỶ
Gemma 1
7 TỶ
Gemma 2
9 TỶ
Gemma 2
27 TỶ
Gemma 1
2,5 tỷ
Gemma 2
2,6 TỶ
Mistral
7 TỶ
LLAMA 3 (Mã LLAMA 3)
8 TỶ
Gemma 1
7 TỶ
Gemma 2
9 TỶ
Gemma 2
27 TỶ
Gemma 1
2,5 tỷ
Gemma 2
2,6 TỶ
Mistral
7 TỶ
LLAMA 3 (Mã LLAMA 3)
8 TỶ
Gemma 1
7 TỶ
Gemma 2
9 TỶ
Gemma 2
27 TỶ
Gemma 1
2,5 tỷ
Gemma 2
2,6 TỶ
Mistral
7 TỶ
LLAMA 3 (Mã LLAMA 3)
8 TỶ
Gemma 1
7 TỶ
Gemma 2
9 TỶ
Gemma 2
27 TỶ
Gemma 1
2,5 tỷ
Gemma 2
2,6 TỶ
Mistral
7 TỶ
LLAMA 3 (Mã LLAMA 3)
8 TỶ
Gemma 1
7 TỶ
Gemma 2
9 TỶ
Gemma 2
27 TỶ
Gemma 1
2,5 tỷ
Gemma 2
2,6 TỶ
Mistral
7 TỶ
Gemma 1
7 TỶ
Gemma 2
9 TỶ
Gemma 2
27 TỶ
Gemma 1
2,5 tỷ
Gemma 2
2,6 TỶ
Mistral
7 TỶ
Gemma 1
7 TỶ
Gemma 2
9 TỶ
Gemma 2
27 TỶ
Gemma 1
2,5 tỷ
Gemma 2
2,6 TỶ
Mistral
7 TỶ
Gemma 1
7 TỶ
Gemma 2
9 TỶ
Gemma 2
27 TỶ
Gemma 1
2,5 tỷ
Gemma 2
2,6 TỶ
Mistral
7 TỶ
Gemma 1
7 TỶ
Gemma 2
9 TỶ
Gemma 2
27 TỶ
Gemma 1
2,5 tỷ
Gemma 2
2,6 TỶ
Mistral
7 TỶ
Gemma 1
7 TỶ
Gemma 2
9 TỶ
Gemma 2
27 TỶ
Gemma 1
2,5 tỷ
Gemma 2
2,6 TỶ
Mistral
7 TỶ
Gemma 1
7 TỶ
Gemma 2
9 TỶ
Gemma 2
27 TỶ
Gemma 1
2,5 tỷ
Gemma 2
2,6 TỶ
Mistral
7 TỶ
Gemma 1
7 TỶ
Gemma 2
9 TỶ
Gemma 2
27 TỶ
Gemma 1
2,5 tỷ
Gemma 2
2,6 TỶ
Mistral
7 TỶ
Gemma 1
7 TỶ
Gemma 2
9 TỶ
Gemma 2
27 TỶ
Gemma 1
2,5 tỷ
Gemma 2
2,6 TỶ
Mistral
7 TỶ
Gemma 1
7 TỶ
Gemma 2
9 TỶ
Gemma 2
27 TỶ
*Đây là các điểm chuẩn cho các mô hình được huấn luyện trước, hãy xem báo cáo kỹ thuật để biết chi tiết về hiệu suất với các phương pháp khác.
Dòng mô hình Gemma
Khám phá các công cụ của chúng tôi
Hướng dẫn bắt đầu nhanh dành cho nhà phát triển
Hướng dẫn bắt đầu nhanh dành cho đối tác
Sổ tay nấu ăn Gemma
Khám phá bộ sưu tập các công thức nấu ăn và ví dụ thiết thực cho thấy sức mạnh và tính linh hoạt của Gemma trong những nhiệm vụ như tạo chú thích hình ảnh bằng PaliGemma, tạo mã bằng CodeGemma và tạo chatbot bằng các mô hình Gemma được tinh chỉnh.
Phát triển AI có trách nhiệm
Thiết kế để làm tròn trách nhiệm
Được đào tạo trước dựa trên dữ liệu được tuyển chọn kỹ lưỡng và luôn chú trọng đến vấn đề an toàn, qua đó hỗ trợ phát triển AI một cách an toàn và có trách nhiệm thông qua các mô hình của Gemma.
Quy trình đánh giá mạnh mẽ và minh bạch
Hoạt động đánh giá toàn diện và báo cáo minh bạch cho thấy các giới hạn của mô hình để áp dụng cách tiếp cận có trách nhiệm cho từng trường hợp sử dụng.
Thúc đẩy phát triển có trách nhiệm
Bộ công cụ AI tạo sinh có trách nhiệm giúp nhà phát triển thiết kế và triển khai các phương pháp hay nhất về AI có trách nhiệm.
Được tối ưu hoá cho Google Cloud
Với các mô hình Gemma trên Google Cloud, bạn có thể tuỳ chỉnh mô hình theo nhu cầu cụ thể của mình bằng các công cụ được quản lý hoàn toàn của Vertex AI hoặc lựa chọn tự quản lý của GKE và triển khai mô hình đó cho cơ sở hạ tầng AI linh hoạt và được tối ưu hoá về chi phí.
Đẩy nhanh quá trình nghiên cứu học thuật nhờ các khoản tín dụng của Google Cloud
Gần đây, Chương trình nghiên cứu học thuật đã kết thúc giai đoạn đăng ký và cấp tín dụng của Google Cloud để hỗ trợ các nhà nghiên cứu mở rộng giới hạn khám phá khoa học bằng các mô hình Gemma. Chúng tôi rất vui mừng khi được chứng kiến những nghiên cứu đột phá trong sáng kiến này.
Tham gia cộng đồng
Kết nối, khám phá và chia sẻ kiến thức với những người khác trong cộng đồng mô hình học máy.