Hướng dẫn này cung cấp thông tin tổng quan về các lựa chọn thanh toán khác nhau của Gemini API, giải thích cách bật tính năng thanh toán và theo dõi mức sử dụng, đồng thời cung cấp câu trả lời cho các câu hỏi thường gặp (FAQ) về tính năng thanh toán.
Giới thiệu về thông tin thanh toán
Hệ thống tính phí cho Gemini API dựa trên hai bậc giá: miễn phí (hoặc miễn phí) và trả phí theo mức dùng (hoặc có tính phí). Mức giá và giới hạn tốc độ khác nhau giữa các cấp này và cũng khác nhau tuỳ theo mẫu. Để biết giá hiện tại và giới hạn tốc độ, hãy xem phần Định giá. Để biết thông tin chi tiết về từng mẫu, hãy xem trang về các mẫu Gemini.
Giới hạn số lượng yêu cầu
Giới hạn tốc độ là hạn mức điều chỉnh số lượng yêu cầu mà bạn có thể gửi tới API Gemini trong một khung thời gian nhất định. Những giới hạn này giúp đảm bảo việc sử dụng công bằng, ngăn chặn hành vi sai trái và duy trì hiệu suất tối ưu cho tất cả người dùng.
Giới hạn tốc độ có một số chức năng thiết yếu:
- Ngăn chặn hành vi sai trái: Các biện pháp này bảo vệ API khỏi các tác nhân độc hại cố gắng làm gián đoạn hoặc làm quá tải hệ thống.
- Đảm bảo quyền truy cập công bằng: Hạn mức tốc độ ngăn người dùng nào đó độc quyền tài nguyên API, đảm bảo mọi người đều có trải nghiệm mượt mà.
- Quản lý tải cơ sở hạ tầng: Bằng cách kiểm soát số lượng yêu cầu, giới hạn tốc độ giúp duy trì hiệu suất API nhất quán và ngăn chặn tình trạng máy chủ quá tải.
Dưới đây là ví dụ giả định về hạn mức có thể áp dụng cho một mô hình nhất định trong một cấp nhất định:
- 10 RPM (yêu cầu mỗi phút)
- 10.000 TPM (mã thông báo mỗi phút)
- 1.000 RPD (yêu cầu mỗi ngày)
Trong ví dụ này, nếu bạn vượt quá 10 RPM (hoặc 10.000 TPM hoặc 1.000 RPD), dịch vụ API Gemini sẽ gửi lỗi 429: RESOURCE_EXHAUSTED
cho biết rằng bạn đã vượt quá giới hạn tốc độ.
Cách hoạt động của giới hạn tốc độ
Giới hạn tốc độ được đo lường theo 4 phương diện:
- Số yêu cầu mỗi phút (RPM)
- Số yêu cầu mỗi ngày (RPD)
- Số mã thông báo mỗi phút (TPM)
- Số hình ảnh mỗi phút (IPM)
Mức sử dụng của bạn được đánh giá theo từng giới hạn và việc vượt quá bất kỳ giới hạn nào sẽ kích hoạt lỗi giới hạn tốc độ. Ví dụ: nếu giới hạn RPM là 20, thì việc tạo 21 yêu cầu trong một phút sẽ dẫn đến lỗi, ngay cả khi bạn chưa vượt quá TPM hoặc các giới hạn khác.
Hạn mức tốc độ được áp dụng cho mỗi dự án, chứ không phải cho mỗi khoá API.
Các giới hạn khác nhau tuỳ thuộc vào mô hình cụ thể đang được sử dụng và một số giới hạn chỉ áp dụng cho các mô hình cụ thể. Ví dụ: IPM chỉ được tính cho các mô hình có khả năng tạo hình ảnh.
Tăng hạn mức tốc độ và cấp sử dụng
Giới hạn tốc độ được liên kết với cấp sử dụng dự án. Khi mức sử dụng và mức chi tiêu API tăng lên, bạn có thể nâng cấp lên cấp cao hơn với các giới hạn tốc độ cao hơn.
Bậc | Điều kiện |
---|---|
Miễn phí | Người dùng ở các quốc gia đủ điều kiện |
Cấp 1 | Tài khoản thanh toán đã liên kết |
Cấp 2 | Tổng mức chi tiêu: 250 đô la; tổng mức chi tiêu bắt buộc đã tồn tại ít nhất 30 ngày |
Khi bạn yêu cầu nâng cấp, hệ thống bảo vệ chống hành vi sai trái tự động của chúng tôi sẽ thực hiện các bước kiểm tra bổ sung. Mặc dù việc đáp ứng các tiêu chí về điều kiện nêu trên thường là đủ để được phê duyệt, nhưng trong một số ít trường hợp, yêu cầu nâng cấp có thể bị từ chối dựa trên các yếu tố khác được xác định trong quá trình xem xét.
Hệ thống này giúp đảm bảo tính bảo mật và tính toàn vẹn của nền tảng API Gemini cho tất cả người dùng.
Cách yêu cầu nâng cấp
Gemini API sử dụng Cloud Billing cho tất cả dịch vụ thanh toán. Để chuyển từ bậc Miễn phí sang bậc trả phí, trước tiên, bạn phải bật tính năng Thanh toán trên đám mây cho dự án Google Cloud của mình.
Khi dự án của bạn đáp ứng các tiêu chí đã chỉ định, dự án đó sẽ đủ điều kiện để nâng cấp lên cấp tiếp theo. Để yêu cầu nâng cấp, hãy làm theo các bước sau:
- Chuyển đến trang Khoá API AI Studio.
- Tìm dự án bạn muốn nâng cấp rồi nhấp vào Nâng cấp.
- Hệ thống sẽ tự động xác minh xem dự án của bạn có đủ điều kiện hay không. Quá trình này mất vài giây.
- Nếu đáp ứng tất cả các yêu cầu, dự án của bạn sẽ được nâng cấp ngay lên cấp tiếp theo.
Tại sao nên sử dụng cấp trả phí?
Khi bật tính năng thanh toán và sử dụng cấp có tính phí, bạn sẽ được hưởng các giới hạn giá cao hơn, đồng thời câu lệnh và câu trả lời của bạn sẽ không được dùng để cải thiện các sản phẩm của Google. Để biết thêm thông tin về việc sử dụng dữ liệu cho các dịch vụ có tính phí, hãy xem điều khoản dịch vụ.
Cloud Billing
Gemini API sử dụng Cloud Billing cho các dịch vụ thanh toán. Để sử dụng cấp trả phí, bạn phải thiết lập Cloud Billing trên dự án trên đám mây. Sau khi bật tính năng Thanh toán trên đám mây, bạn có thể sử dụng các công cụ Thanh toán trên đám mây để theo dõi mức chi tiêu, tìm hiểu chi phí, thanh toán và truy cập vào dịch vụ hỗ trợ Thanh toán trên đám mây.
Bật tính năng thanh toán
Bạn có thể bật tính năng Thanh toán trên Google Cloud ngay từ Google AI Studio:
Mở Google AI Studio.
Ở cuối thanh bên trái, hãy chọn Cài đặt > Thông tin về kế hoạch.
Nhấp vào Thiết lập thông tin thanh toán cho dự án mà bạn đã chọn để bật Cloud Billing.
Giám sát mức sử dụng
Sau khi bật tính năng Thanh toán trên đám mây, bạn có thể theo dõi mức sử dụng API Gemini trong Google Cloud Console.
Tên dịch vụ cho API là generativelanguage.googleapis.com
và trong bảng điều khiển, Gemini API cũng được gọi là API Ngôn ngữ tạo sinh.
Để tìm hiểu thêm, hãy xem tài liệu của Google Cloud về cách theo dõi mức sử dụng API.
Câu hỏi thường gặp
Phần này cung cấp câu trả lời cho các câu hỏi thường gặp.
Tôi bị tính phí những khoản gì?
Mức giá của Gemini API dựa trên những yếu tố sau:
- Số lượng mã thông báo đầu vào
- Số lượng mã thông báo đầu ra
- Số lượng mã thông báo đã lưu vào bộ nhớ đệm
- Thời gian lưu trữ mã thông báo trong bộ nhớ đệm
Để biết thông tin về giá, hãy xem trang giá.
Tôi có thể xem hạn mức của mình ở đâu?
Bạn có thể xem hạn mức và giới hạn hệ thống trong bảng điều khiển Google Cloud.
Làm cách nào để yêu cầu tăng hạn mức?
Để yêu cầu tăng hạn mức, hãy làm theo hướng dẫn tại bài viết Cách yêu cầu nâng cấp.
Tôi có thể sử dụng miễn phí Gemini API ở Khu vực kinh tế Châu Âu (bao gồm cả Liên minh Châu Âu), Vương quốc Anh và Thuỵ Sĩ không?
Có, chúng tôi cung cấp cả gói miễn phí và gói có tính phí ở nhiều khu vực.
Nếu thiết lập thông tin thanh toán bằng Gemini API, tôi có bị tính phí cho việc sử dụng Google AI Studio không?
Không, việc sử dụng Google AI Studio vẫn miễn phí bất kể bạn có thiết lập tính năng thanh toán trên tất cả các khu vực được hỗ trợ hay không.
Tôi có thể sử dụng 1 triệu mã thông báo trong gói miễn phí không?
Cấp miễn phí cho Gemini API sẽ khác nhau tuỳ theo mô hình được chọn. Hiện tại, bạn có thể thử cửa sổ ngữ cảnh 1 triệu token theo các cách sau:
- Trong Google AI Studio
- Với gói trả tiền theo mức dùng
- Có các gói miễn phí cho một số mẫu
Xem giới hạn tốc độ miễn phí mới nhất cho mỗi mẫu trên trang giá.
Làm cách nào để tính số lượng mã thông báo mà tôi đang sử dụng?
Sử dụng phương thức GenerativeModel.count_tokens
để đếm số lượng mã thông báo. Tham khảo Hướng dẫn về mã thông báo để tìm hiểu thêm về mã thông báo.
Tôi có thể sử dụng tín dụng Google Cloud bằng API Gemini không?
Có, bạn có thể dùng khoản tín dụng Google Cloud để sử dụng API Gemini.
Việc thanh toán được xử lý như thế nào?
Hệ thống Thanh toán trên Google Cloud sẽ xử lý việc thanh toán cho Gemini API.
Tôi có bị tính phí cho các yêu cầu không thành công không?
Nếu yêu cầu của bạn không thành công do lỗi 400 hoặc 500, bạn sẽ không bị tính phí cho các mã thông báo đã sử dụng. Tuy nhiên, yêu cầu này vẫn sẽ được tính vào hạn mức của bạn.
Có tính phí để điều chỉnh các mô hình không?
Điều chỉnh mô hình là miễn phí, nhưng hoạt động suy luận trên các mô hình đã điều chỉnh sẽ được tính phí theo mức tương tự như các mô hình cơ sở.
Liệu GetTokens có bị tính phí không?
Các yêu cầu gửi đến API GetTokens sẽ không bị tính phí và không được tính vào hạn mức suy luận.
Dữ liệu của tôi trên Google AI Studio được xử lý như thế nào nếu tôi có tài khoản API trả phí?
Hãy tham khảo điều khoản để biết thông tin chi tiết về cách xử lý dữ liệu khi bạn bật tính năng thanh toán trên Google Cloud (xem phần "Cách Google sử dụng dữ liệu của bạn" trong mục "Dịch vụ có tính phí"). Xin lưu ý rằng các lời nhắc của bạn trên Google AI Studio được xử lý theo cùng một điều khoản "Dịch vụ có tính phí", miễn là ít nhất 1 dự án API đã bật tính năng thanh toán. Bạn có thể xác thực điều này trên trang Khoá API Gemini nếu thấy bất kỳ dự án nào được đánh dấu là "Có tính phí" trong mục "Kế hoạch".
Tôi có thể yêu cầu trợ giúp về việc thanh toán ở đâu?
Để được trợ giúp về việc thanh toán, hãy xem bài viết Yêu cầu hỗ trợ về Cloud Billing.