Google Kubernetes Engine (GKE) cùng với Gemma

Google Kubernetes Engine (GKE) là dịch vụ Kubernetes được quản lý của Google Cloud mà bạn có thể dùng để triển khai và vận hành các ứng dụng trong vùng chứa trên quy mô lớn bằng cách sử dụng Cơ sở hạ tầng của Google. Bạn có thể phân phát Gemma bằng các đơn vị xử lý Cloud Tensor (TPU) và đơn vị xử lý đồ hoạ (GPU) trên GKE có thể phân phát các mô hình ngôn ngữ lớn (LLM) này khung:

Bằng cách phân phát Gemma trên GKE, bạn có thể triển khai một hệ thống suy luận hiệu quả và sẵn sàng cho việc phát hành công khai giải pháp phân phối quảng cáo với tất cả lợi ích của giải pháp Kubernetes được quản lý, bao gồm khả năng mở rộng hiệu quả và khả năng đáp ứng cao hơn.

Để tìm hiểu thêm, hãy tham khảo các trang sau: