Google Kubernetes Engine (GKE) cùng với Gemma

Google Kubernetes Engine (GKE) là một dịch vụ Kubernetes được quản lý của Google Cloud. Bạn có thể dùng dịch vụ này để triển khai và vận hành các ứng dụng trong vùng chứa trên quy mô lớn bằng cơ sở hạ tầng của Google. Bạn có thể phân phát Gemma bằng các đơn vị xử lý Cloud Tensor (TPU) và đơn vị xử lý đồ hoạ (GPU) trên GKE bằng các khung phân phát LLM sau:

Bằng cách phân phát Gemma trên GKE, bạn có thể triển khai một giải pháp phân phát dự đoán mạnh mẽ, sẵn sàng cho việc sản xuất với tất cả lợi ích của Kubernetes được quản lý, bao gồm cả khả năng mở rộng hiệu quả và khả năng đáp ứng cao hơn.

Để tìm hiểu thêm, hãy tham khảo các trang sau: