Tổng quan về mô hình Gemma 3

Gemma là một nhóm các mô hình trí tuệ nhân tạo (AI) tạo sinh và bạn có thể sử dụng các mô hình này trong nhiều nhiệm vụ tạo sinh, bao gồm cả việc trả lời câu hỏi, tóm tắt và suy luận. Các mô hình Gemma được cung cấp trọng số mở và cho phép sử dụng thương mại một cách có trách nhiệm, cho phép bạn điều chỉnh và triển khai các mô hình đó trong các dự án và ứng dụng của riêng mình.

Bản phát hành Gemma 3 có các tính năng chính sau. Hãy dùng thử trong AI Studio:

Bạn có thể tải các mô hình Gemma 3 xuống từ KaggleHugging Face. Để biết thêm thông tin kỹ thuật về Gemma 3, hãy xem Thẻ mô hìnhBáo cáo kỹ thuật. Bạn cũng có thể tải các phiên bản trước của mô hình lõi Gemma xuống. Để biết thêm thông tin, hãy xem phần Các mô hình Gemma trước đây.

Dùng thử Gemma 3 Tải trên Kaggle Tải trên Hugging Face

Nhập văn bản và hình ảnh đa phương thức

Bạn có thể giải quyết các nhiệm vụ phân tích và tạo phức tạp hơn bằng Gemma 3 nhờ khả năng xử lý dữ liệu hình ảnh và văn bản. Bạn có thể sử dụng mô hình này để diễn giải dữ liệu hình ảnh, xác định đối tượng, trích xuất dữ liệu văn bản và hoàn thành nhiều tác vụ đầu vào hình ảnh khác thành đầu ra văn bản. Bắt đầu xây dựng

Cửa sổ ngữ cảnh 128 nghìn token

Mô hình Gemma 3 có thể xử lý các mục nhập lời nhắc lên đến 128K mã thông báo, lớn hơn gấp 16 lần cửa sổ ngữ cảnh so với các mô hình Gemma trước đó. Số lượng mã thông báo lớn có nghĩa là bạn có thể xử lý một số bài viết nhiều trang, bài viết lớn hơn hoặc hàng trăm hình ảnh trong một câu lệnh.

Hỗ trợ nhiều ngôn ngữ

Làm việc bằng ngôn ngữ của riêng bạn nhờ tính năng hỗ trợ tích hợp cho hơn 140 ngôn ngữ. Gemma 3 được huấn luyện để hỗ trợ nhiều ngôn ngữ so với các phiên bản Gemma trước, cho phép bạn thực hiện nhiều tác vụ hình ảnh và văn bản hơn bằng ngôn ngữ mà khách hàng sử dụng. Bắt đầu xây dựng

Kích thước tham số và lượng tử hoá

Các mô hình Gemma 3 có 4 kích thước tham số ở 5 cấp độ độ chính xác, từ độ chính xác đầy đủ ở 32 bit đến độ chính xác thấp nhất ở 4 bit. Các kích thước và độ chính xác khác nhau đại diện cho một tập hợp các yếu tố đánh đổi cho ứng dụng AI của bạn. Các mô hình có tham số và số bit cao hơn (độ chính xác cao hơn) thường có nhiều khả năng hơn, nhưng chi phí chạy cao hơn về chu kỳ xử lý, chi phí bộ nhớ và mức tiêu thụ điện năng. Các mô hình có thông số và số bit thấp hơn (độ chính xác thấp hơn) có ít chức năng hơn, nhưng có thể đủ cho tác vụ AI của bạn. Bảng sau đây trình bày chi tiết các yêu cầu gần đúng về bộ nhớ GPU hoặc TPU để chạy các phép suy luận với từng kích thước của các phiên bản mô hình Gemma 3.

Tham số 32 bit đầy đủ BF16 (16 bit) SFP8
(8 bit)
Q4_0
(4 bit)
INT4
(4 bit)
Gemma 3 1B (chỉ văn bản) 4 GB 1,5 GB 1,1 GB 892 MB 861 MB
Gemma 3 4B 16 GB 6,4 GB 4,4 GB 3,4 GB 3,2 GB
Gemma 3 12B 48 GB 20 GB 12,2 GB 8,7 GB 8,2 GB
Gemma 3 27B 108 GB 46,4 GB 29,1 GB 21 GB 19,9 GB

Bảng 1. Dung lượng bộ nhớ GPU hoặc TPU gần đúng cần thiết để tải các mô hình Gemma 3 dựa trên số lượng tham số và cấp độ lượng tử hoá (độ sâu bit).

Mức sử dụng bộ nhớ tăng lên dựa trên tổng số mã thông báo cần thiết cho lời nhắc mà bạn chạy. Số lượng mã thông báo cần thiết để xử lý câu lệnh của bạn càng lớn thì bộ nhớ cần thiết càng cao, ngoài bộ nhớ cần thiết để tải mô hình.

Các mẫu Gemma trước đây

Bạn có thể làm việc với các thế hệ mô hình Gemma trước đây. Các mô hình này cũng có sẵn trên KaggleHugging Face. Để biết thêm thông tin kỹ thuật về các mẫu Gemma trước đây, hãy xem các trang thẻ mô hình sau:

Bạn đã sẵn sàng bắt đầu xây dựng chưa? Bắt đầu sử dụng các mô hình Gemma!