Nhóm mô hình mở Gemma bao gồm nhiều kích thước mô hình, khả năng và biến thể chuyên biệt cho từng tác vụ để giúp bạn xây dựng các giải pháp tạo sinh tuỳ chỉnh. Sau đây là những lộ trình chính mà bạn có thể làm theo khi sử dụng mô hình Gemma trong một ứng dụng:
- Chọn một mô hình và triển khai mô hình đó nguyên trạng trong ứng dụng của bạn
- Chọn một mô hình, điều chỉnh mô hình đó cho một tác vụ cụ thể, sau đó triển khai mô hình đó trong một ứng dụng hoặc chia sẻ với cộng đồng.
Hướng dẫn này giúp bạn bắt đầu với việc chọn một mô hình, kiểm thử các khả năng của mô hình đó và tuỳ ý điều chỉnh mô hình bạn đã chọn cho ứng dụng của mình.
Tải xuống trên Kaggle Tải xuống trên Hugging Face
Chọn một mô hình
Phần này giúp bạn hiểu các biến thể chính thức của nhóm mô hình Gemma và chọn một mô hình cho ứng dụng của mình. Các biến thể mô hình cung cấp các khả năng chung hoặc được chuyên biệt hoá cho các tác vụ cụ thể và được cung cấp ở nhiều kích thước tham số để bạn có thể chọn một mô hình có các khả năng ưu tiên và đáp ứng các yêu cầu về điện toán.
Bảng sau đây liệt kê các biến thể chính của nhóm mô hình Gemma và các nền tảng triển khai dự kiến:
Nhóm Gemma 4
Thế hệ mới nhất có thông tin đầu vào đa phương thức (văn bản, hình ảnh, âm thanh).
| Kích thước | Biến thể | Thông tin đầu vào ➔ Thông tin đầu ra | Nền tảng dự kiến |
|---|---|---|---|
| E2B | Gemma 4 (core) | Văn bản, hình ảnh, âm thanh ➔ Văn bản | Thiết bị di động |
| E4B | Gemma 4 (core) | Văn bản, hình ảnh, âm thanh ➔ Văn bản | Thiết bị di động và máy tính xách tay |
| A4B | Gemma 4 (core) | Văn bản, hình ảnh ➔ Văn bản | Máy tính để bàn và máy chủ nhỏ |
| 31B | Gemma 4 (core) | Văn bản, hình ảnh ➔ Văn bản | Máy chủ lớn hoặc cụm máy chủ |
Nhóm Gemma 3 và 3n
Các mô hình cốt lõi để xử lý văn bản và hình ảnh có khả năng mở rộng, cùng với các biến thể "3n" cho thông tin đầu vào đa phương thức mở rộng.
| Kích thước | Biến thể | Thông tin đầu vào ➔ Thông tin đầu ra | Nền tảng dự kiến |
|---|---|---|---|
| 270M | Gemma 3 (core) | Văn bản ➔ Văn bản | Thiết bị di động và máy tính bảng đơn |
| 1B | Gemma 3 (core) | Văn bản ➔ Văn bản | Thiết bị di động và máy tính bảng đơn |
| E2B | Gemma 3n | Văn bản, hình ảnh, âm thanh ➔ Văn bản | Thiết bị di động |
| 4B | Gemma 3 (core) | Văn bản, hình ảnh ➔ Văn bản | Máy tính để bàn và máy chủ nhỏ |
| E4B | Gemma 3n | Văn bản, hình ảnh, âm thanh ➔ Văn bản | Thiết bị di động và máy tính xách tay |
| 12B | Gemma 3 (core) | Văn bản, hình ảnh ➔ Văn bản | Máy tính để bàn và máy chủ cao cấp hơn |
| 27B | Gemma 3 (core) | Văn bản, hình ảnh ➔ Văn bản | Máy chủ lớn hoặc cụm máy chủ |
Nhóm Gemma 2
Bao gồm các mô hình văn bản tiêu chuẩn và các biến thể ngôn ngữ-thị giác đa phương thức PaliGemma 2.
| Kích thước | Biến thể | Thông tin đầu vào ➔ Thông tin đầu ra | Nền tảng dự kiến |
|---|---|---|---|
| 2B | Gemma 2 (core) | Văn bản ➔ Văn bản | Thiết bị di động và máy tính xách tay |
| 3B | PaliGemma 2 | Văn bản, hình ảnh ➔ Văn bản | Máy tính để bàn và máy chủ nhỏ |
| 9B | Gemma 2 (core) | Văn bản ➔ Văn bản | Máy tính để bàn và máy chủ cao cấp hơn |
| 10B | PaliGemma 2 | Văn bản, hình ảnh ➔ Văn bản | Máy tính để bàn và máy chủ cao cấp hơn |
| 27B | Gemma 2 (core) | Văn bản ➔ Văn bản | Máy chủ lớn hoặc cụm máy chủ |
| 28B | PaliGemma 2 | Văn bản, hình ảnh ➔ Văn bản | Máy chủ lớn hoặc cụm máy chủ |
Nhóm Gemma 1
Thế hệ ban đầu, bao gồm các biến thể dành riêng cho việc viết mã.
| Kích thước | Biến thể | Thông tin đầu vào ➔ Thông tin đầu ra | Nền tảng dự kiến |
|---|---|---|---|
| 2B | Gemma (core) CodeGemma |
Văn bản ➔ Văn bản | Thiết bị di động và máy tính xách tay |
| 7B | Gemma (core) CodeGemma |
Văn bản ➔ Văn bản | Máy tính để bàn và máy chủ nhỏ |
Nhóm mô hình Gemma cũng bao gồm các mô hình nghiên cứu và mô hình có mục đích đặc biệt, bao gồm ShieldGemma, DataGemma, Gemma Scope, và Gemma-APS.
Kiểm thử mô hình
Bạn có thể kiểm thử các mô hình Gemma bằng cách thiết lập một môi trường phát triển với một mô hình đã tải xuống và phần mềm hỗ trợ. Sau đó, bạn có thể đưa ra câu lệnh cho mô hình và đánh giá các câu trả lời của mô hình đó. Sử dụng một trong các sổ tay Python sau đây với khung học máy ưu tiên để thiết lập môi trường kiểm thử và đưa ra câu lệnh cho mô hình Gemma:
Điều chỉnh mô hình
Bạn có thể thay đổi hành vi của các mô hình Gemma bằng cách điều chỉnh các mô hình đó. Việc điều chỉnh một mô hình đòi hỏi một tập dữ liệu gồm các thông tin đầu vào và câu trả lời dự kiến có đủ kích thước và biến thể để hướng dẫn hành vi của mô hình. Bạn cũng cần nhiều tài nguyên điện toán và bộ nhớ hơn đáng kể để hoàn tất một lần chạy điều chỉnh so với việc chạy một mô hình Gemma để tạo văn bản. Sử dụng một trong các sổ tay Python sau đây để thiết lập môi trường phát triển điều chỉnh và điều chỉnh một mô hình Gemma:
- Điều chỉnh Gemma bằng Keras và điều chỉnh LoRA
- Điều chỉnh các mô hình Gemma lớn hơn bằng tính năng huấn luyện phân tán
Các bước tiếp theo
Hãy xem các hướng dẫn sau đây để xây dựng thêm các giải pháp bằng Gemma: