Hướng dẫn này cung cấp thông tin tổng quan về các phương thức thanh toán bằng Gemini API, giải thích cách bật tính năng thanh toán và giám sát việc sử dụng, đồng thời đưa ra câu trả lời cho câu hỏi thường gặp (FAQ) về việc thanh toán.
Giới thiệu về thanh toán
Việc thanh toán cho Gemini API được tính dựa trên 2 mức giá: miễn phí (hoặc miễn phí) và trả tiền theo mức dùng (hoặc trả phí). Mức giá và hạn mức giá khác nhau giữa các cấp này và cũng thay đổi theo mô hình. Đối với giới hạn mức giá và mức giá hiện tại, xem Định giá. Để có bảng chi tiết về chức năng theo từng mô hình, hãy xem Trang các mô hình Gemini.
Giới hạn số lượng yêu cầu
Giới hạn số lượng yêu cầu là hạn mức giới hạn số lượng yêu cầu hoặc mã thông báo mà bạn có thể gửi tới API Gemini trong một khoảng thời gian nhất định. Giới hạn số lượng yêu cầu có thể áp dụng cho từng yêu cầu hoặc từng mã thông báo. Sau đây là một ví dụ giả định về hạn mức có thể áp dụng cho một mô hình cụ thể ở một bậc nhất định:
- 10 vòng/phút (yêu cầu mỗi phút)
- 10.000 TPM (mã thông báo mỗi phút)
- 1.000 RPD (yêu cầu mỗi ngày)
Trong ví dụ này, nếu bạn vượt quá 10 RPM (hoặc 10.000 TPM hay 1.000 RPD), thì
Dịch vụ API Gemini sẽ gửi một lỗi 429: RESOURCE_EXHAUSTED
cho biết
rằng bạn đã vượt quá giới hạn tốc độ.
Tại sao bạn nên sử dụng cấp có tính phí?
Khi bạn bật tính năng thanh toán và sử dụng bậc có tính phí, bạn sẽ được hưởng mức giá cao hơn đồng thời các câu lệnh và câu trả lời của bạn sẽ không được dùng để cải thiện các sản phẩm của Google. Để biết thêm thông tin về việc sử dụng dữ liệu cho các dịch vụ có tính phí, hãy xem điều khoản dịch vụ của chúng tôi.
Cloud Billing
Gemini API sử dụng Thanh toán qua dịch vụ đám mây cho các dịch vụ thanh toán. Để sử dụng bậc có tính phí, bạn phải thiết lập Thanh toán đám mây trên dự án trên đám mây của mình. Sau khi bật Cloud Billing, bạn có thể sử dụng Cloud Các công cụ thanh toán để theo dõi chi tiêu, nắm bắt chi phí, thanh toán và truy cập Hỗ trợ thanh toán Cloud.
Bật tính năng thanh toán
Bạn có thể bật tính năng Thanh toán đám mây kể từ Google AI Studio theo cách sau:
Mở Google AI Studio.
Ở phía dưới cùng của thanh bên trái, hãy chọn Cài đặt > Thông tin về gói.
Nhấp vào Thiết lập thanh toán cho dự án bạn đã chọn để bật tính năng Thanh toán đám mây.
Giám sát mức sử dụng
Sau khi bật tính năng Thanh toán trên đám mây, bạn có thể theo dõi việc sử dụng Gemini API trong
thời gian
Bảng điều khiển Google Cloud.
Tên dịch vụ cho API là generativelanguage.googleapis.com
và trong
trên bảng điều khiển, Gemini API còn được gọi là Generative Language API.
Để tìm hiểu thêm, hãy xem tài liệu của Google Cloud về giám sát việc sử dụng API.
Câu hỏi thường gặp
Phần này cung cấp câu trả lời cho các câu hỏi thường gặp.
Tôi bị tính phí gì?
Giá của Gemini API được tính dựa trên những yếu tố sau:
- Số lượng mã thông báo đầu vào
- Số lượng mã thông báo đầu ra
- Số lượng mã thông báo được lưu vào bộ nhớ đệm
- Thời gian lưu trữ mã thông báo được lưu vào bộ nhớ đệm
Để biết thông tin về giá, hãy xem trang giá.
Tôi có thể xem hạn mức của mình ở đâu?
Bạn có thể xem hạn mức và giới hạn của hệ thống trong Bảng điều khiển Google Cloud.
Tôi có thể sử dụng miễn phí Gemini API ở Khu vực kinh tế Châu Âu (EEA), Vương quốc Anh và Thuỵ Sĩ không?
Có hai bộ mô hình được cung cấp thông qua API:
- Các mô hình có tính phí bao gồm Gemini 1.5 Flash, Gemini 1.5 Pro và Gemini 1.0 Chuyên nghiệp Các mô hình này sẽ không có bậc miễn phí ở Khu vực kinh tế Châu Âu (EEA) (bao gồm Liên minh Châu Âu), Vương quốc Anh và Thuỵ Sĩ. Nhà phát triển sẽ phải thực hiện các bước cần thiết để thiết lập tài khoản thanh toán và thanh toán cho việc sử dụng.
- Một số mô hình có thể được sử dụng miễn phí trong API Gemini. (Xem ai.google.dev/pricing để biết thông tin chi tiết về các kiểu máy mà chúng tôi tính phí; các mô hình khác đều miễn phí). Tuy nhiên, bạn vẫn cần thiết lập thông tin thanh toán để sử dụng các mô hình này.
Nếu thiết lập thông tin thanh toán bằng Gemini API, tôi có bị tính phí sử dụng Google AI Studio không?
Không, bạn vẫn có thể sử dụng Google AI Studio miễn phí bất kể bạn có thiết lập hay không tại tất cả các khu vực được hỗ trợ, bao gồm cả Khu vực kinh tế Châu Âu (EEA), Liên minh Châu Âu, Vương quốc Anh và Thuỵ Sĩ.
Tôi có thể sử dụng 1 triệu mã thông báo ở cấp miễn phí không?
Bậc miễn phí cho Gemini API còn tuỳ theo mô hình được chọn. Hiện tại, bạn có thể dùng thử cửa sổ ngữ cảnh 1 triệu token theo các cách sau:
- Trong Google AI Studio
- Với gói trả tiền theo mức dùng
- Đi kèm các gói miễn phí dành cho một số người mẫu
Xem giới hạn mới nhất về mức giá miễn phí cho mỗi mô hình trên trang giá.
Làm cách nào để tính số lượng mã thông báo mà tôi đang sử dụng?
Sử dụng GenerativeModel.count_tokens
để đếm số lượng mã thông báo. Tham khảo
Hướng dẫn về mã thông báo để tìm hiểu thêm về mã thông báo.
Việc thanh toán được xử lý như thế nào?
Hoạt động thanh toán cho Gemini API do Thanh toán trên đám mây.
Tôi có bị tính phí cho các yêu cầu không thực hiện được không?
Nếu yêu cầu của bạn không thành công do lỗi 400 hoặc 500, bạn sẽ không bị tính phí cho mã thông báo được sử dụng. Tuy nhiên, yêu cầu đó vẫn sẽ được tính vào hạn mức của bạn.
Bạn có tính phí khi tinh chỉnh mô hình không?
Điều chỉnh mô hình là miễn phí, nhưng suy luận về việc điều chỉnh mô hình sẽ được tính phí ở mức giá tương tự như mô hình cơ sở.
GetTokens có được tính phí không?
Các yêu cầu đối với API GetTokens sẽ không được tính phí và không được tính vào hạn mức suy luận.
Tôi có thể yêu cầu trợ giúp về việc thanh toán ở đâu?
Để được trợ giúp về việc thanh toán, hãy xem Nhận hỗ trợ về thanh toán Cloud.