Tổng quan về các mô hình Gemma

Gemma là một dòng mô hình mở, hiện đại và gọn nhẹ, được xây dựng từ cùng một nghiên cứu và công nghệ dùng để tạo các mô hình Gemini. Gemma được phát triển bởi Google DeepMind và các nhóm khác trên khắp Google, đặt tên theo gemma trong tiếng Latinh, có nghĩa là "đá quý". Các trọng số của mô hình Gemma được các công cụ dành cho nhà phát triển hỗ trợ nhằm thúc đẩy sự đổi mới, cộng tác và sử dụng trí tuệ nhân tạo (AI) một cách có trách nhiệm.

Các mô hình Gemma có thể chạy trong ứng dụng và trên phần cứng, thiết bị di động hoặc dịch vụ được lưu trữ của bạn. Bạn cũng có thể tuỳ chỉnh các mô hình này bằng các kỹ thuật điều chỉnh để chúng thực hiện xuất sắc các tác vụ quan trọng đối với bạn và người dùng của bạn. Các mô hình Gemma lấy cảm hứng và tiếp nối công nghệ từ dòng mô hình Gemini, đồng thời được tạo ra để cộng đồng phát triển AI có thể mở rộng và phát triển hơn nữa.

Bạn có thể sử dụng mô hình Gemma để tạo văn bản. Tuy nhiên, bạn cũng có thể điều chỉnh các mô hình này để chuyên thực hiện các tác vụ cụ thể. Các mô hình Gemma được điều chỉnh có thể cung cấp cho bạn và người dùng của bạn các giải pháp AI tạo sinh được nhắm mục tiêu và hiệu quả hơn. Hãy xem hướng dẫn của chúng tôi về cách điều chỉnh với LoRA và dùng thử! Chúng tôi rất vui được chứng kiến những sản phẩm mà bạn xây dựng cùng Gemma!

Tài liệu dành cho nhà phát triển này cung cấp thông tin tổng quan về các mô hình Gemma hiện có và hướng dẫn phát triển để biết cách áp dụng cũng như điều chỉnh các mô hình đó cho các ứng dụng cụ thể.

Kích thước và chức năng của mô hình

Các mô hình Gemma được cung cấp ở nhiều kích thước để bạn có thể xây dựng các giải pháp AI tạo sinh dựa trên tài nguyên điện toán hiện có, khả năng bạn cần và vị trí bạn muốn chạy các giải pháp đó. Nếu bạn không chắc nên bắt đầu từ đâu, hãy thử kích thước tham số 2B để có yêu cầu thấp hơn về tài nguyên và tăng tính linh hoạt cho nơi triển khai mô hình.

Kích thước thông số Input Đầu ra Phiên bản đã điều chỉnh Nền tảng bạn muốn sử dụng
2 TỶ Văn bản Văn bản
  • Huấn luyện trước
  • Đã điều chỉnh hướng dẫn
Thiết bị di động và máy tính xách tay
7 TỶ Văn bản Văn bản
  • Huấn luyện trước
  • Đã điều chỉnh hướng dẫn
Máy tính để bàn và máy chủ nhỏ

Bằng cách sử dụng tính năng đa hỗ trợ Keras 3.0, bạn có thể chạy các mô hình này trên TensorFlow, JAX và PyTorch, hay thậm chí là sử dụng các phương thức triển khai gốc của JAX (dựa trên khung FLAX) và PyTorch.

Bạn có thể tải các mô hình Gemma xuống từ Mô hình Kaggle.

Mẫu xe đã được điều chỉnh

Bạn có thể sửa đổi hành vi của các mô hình Gemma thông qua quy trình huấn luyện bổ sung để mô hình này thực hiện tốt hơn các tác vụ cụ thể. Quá trình này được gọi là điều chỉnh mô hình. Tuy kỹ thuật này giúp cải thiện khả năng của một mô hình trong việc thực hiện các nhiệm vụ được nhắm mục tiêu, nhưng cũng có thể khiến mô hình trở nên kém hiệu quả hơn ở các tác vụ khác. Vì lý do này, các mô hình Gemma có cả phiên bản được điều chỉnh hướng dẫn và phiên bản được huấn luyện trước:

  • Được huấn luyện trước – Các phiên bản của mô hình này không được huấn luyện về bất kỳ tác vụ hoặc hướng dẫn cụ thể nào ngoài tập huấn luyện dữ liệu cốt lõi Gemma. Bạn không nên triển khai các mô hình này khi chưa điều chỉnh.
  • Đã điều chỉnh hướng dẫn – Các phiên bản của mô hình này được huấn luyện bằng các hoạt động tương tác bằng ngôn ngữ của con người và có thể phản hồi thông tin đầu vào là cuộc trò chuyện, tương tự như bot trò chuyện.

Bắt đầu

Hãy xem những hướng dẫn sau để bắt đầu xây dựng giải pháp bằng Gemma: