Giới hạn số lượng yêu cầu

Giới hạn tốc độ điều chỉnh số lượng yêu cầu mà bạn có thể gửi đến Gemini API trong một khoảng thời gian nhất định. Các giới hạn này giúp duy trì việc sử dụng công bằng, ngăn chặn hành vi lạm dụng và giúp duy trì hiệu suất hệ thống cho tất cả người dùng.

Xem giới hạn tốc độ đang hoạt động trong AI Studio

Cách hoạt động của giới hạn tốc độ

Giới hạn tốc độ thường được đo lường theo 3 phương diện:

  • Số yêu cầu mỗi phút (RPM)
  • Số mã thông báo mỗi phút (đầu vào) (TPM)
  • Số yêu cầu mỗi ngày (RPD)

Mức sử dụng của bạn được đánh giá dựa trên từng giới hạn và việc vượt quá bất kỳ giới hạn nào trong số đó sẽ kích hoạt lỗi giới hạn tốc độ. Ví dụ: nếu giới hạn RPM của bạn là 20, thì việc gửi 21 yêu cầu trong vòng một phút sẽ dẫn đến lỗi, ngay cả khi bạn chưa vượt quá TPM hoặc các giới hạn khác.

Giới hạn tốc độ được áp dụng cho mỗi dự án, không phải cho mỗi khoá API. Hạn mức số yêu cầu mỗi ngày (RPD) sẽ được đặt lại vào lúc nửa đêm theo giờ Thái Bình Dương.

Giới hạn sẽ khác nhau tuỳ thuộc vào mô hình cụ thể đang được sử dụng và một số giới hạn chỉ áp dụng cho các mô hình cụ thể. Ví dụ: Số hình ảnh mỗi phút (IPM) chỉ được tính cho các mô hình có khả năng tạo hình ảnh (Nano Banana), nhưng về mặt khái niệm thì tương tự như TPM. Các mô hình khác có thể có giới hạn số mã thông báo mỗi ngày (TPD).

Giới hạn tốc độ bị hạn chế hơn đối với các mô hình thử nghiệm và mô hình bản dùng thử.

Cấp sử dụng

Giới hạn tốc độ được liên kết với cấp sử dụng của dự án. Khi mức sử dụng và chi tiêu API của bạn tăng lên, bạn sẽ tự động được nâng cấp lên cấp cao hơn với giới hạn tốc độ tăng lên.

Điều kiện để đạt được Cấp 2 và Cấp 3 dựa trên tổng chi tiêu tích luỹ cho các dịch vụ của Google Cloud (bao gồm nhưng không giới hạn ở Gemini API) đối với tài khoản thanh toán được liên kết với dự án của bạn.

Cấp sử dụng Điều kiện Mức chi tiêu tối đa của cấp thanh toán
Miễn phí Dự án đang hoạt động hoặc gói dùng thử miễn phí Không áp dụng
Cấp 1 Thiết lập và liên kết một tài khoản thanh toán đang hoạt động 250 đô la
Cấp 2 Đã thanh toán 100 đô la + 3 ngày kể từ lần thanh toán thành công đầu tiên 2.000 đô la
Cấp 3 Đã thanh toán 1.000 đô la + 30 ngày kể từ lần thanh toán thành công đầu tiên 20.000 đô la – 100.000 đô la trở lên

Mặc dù việc đáp ứng các tiêu chí về điều kiện đã nêu thường là đủ để được phê duyệt, nhưng trong một số trường hợp hiếm gặp, yêu cầu nâng cấp có thể bị từ chối dựa trên các yếu tố khác được xác định trong quá trình xem xét.

Hệ thống này giúp duy trì tính bảo mật và tính toàn vẹn của nền tảng Gemini API cho tất cả người dùng.

Giới hạn tốc độ của Gemini API

Giới hạn tốc độ phụ thuộc vào nhiều yếu tố (chẳng hạn như cấp sử dụng của bạn) và có thể xem trong Google AI Studio. Khi cấp và trạng thái tài khoản của bạn thay đổi theo thời gian, giới hạn tốc độ sẽ tự động cập nhật.

Xem giới hạn tốc độ đang hoạt động trong AI Studio

Giới hạn tốc độ được chỉ định không được đảm bảo và dung lượng thực tế có thể khác nhau.

Giới hạn tốc độ suy luận ưu tiên

Mức tiêu thụ ưu tiên có giới hạn tốc độ riêng, mặc dù mức tiêu thụ được tính vào giới hạn tốc độ lưu lượng truy cập tương tác tổng thể. Giới hạn tốc độ mặc định là: 0,3 lần giới hạn tốc độ tiêu chuẩn cho mỗi mô hình và cấp

Giới hạn tốc độ của Batch API

Các yêu cầu Batch API phải tuân theo giới hạn tốc độ riêng, tách biệt với các lệnh gọi API không theo lô.

  • Yêu cầu theo lô đồng thời: 100
  • Giới hạn kích thước tệp đầu vào: 2 GB
  • Giới hạn bộ nhớ lưu trữ tệp: 20 GB
  • Số mã thông báo được xếp hàng đợi cho mỗi mô hình: Bảng Số mã thông báo được xếp hàng đợi theo lô liệt kê số lượng mã thông báo tối đa có thể được xếp hàng đợi để xử lý hàng loạt trên tất cả các công việc theo lô đang hoạt động của bạn cho một mô hình nhất định.

Cấp 1

Mô hình Số mã thông báo được xếp hàng đợi theo lô
Mô hình văn bản đầu ra
Bản dùng thử Gemini 3.1 Pro 5.000.000
Bản dùng thử Gemini 3.1 Flash-Lite 10.000.000
Bản dùng thử Gemini 3 Flash 3.000.000
Gemini 2.5 Pro 5.000.000
Gemini 2.5 Pro TTS 25.000
Gemini 2.5 Flash 3.000.000
Bản dùng thử Gemini 2.5 Flash 3.000.000
Bản dùng thử hình ảnh Gemini 2.5 Flash 3.000.000
Gemini 2.5 Flash TTS 100.000
Gemini 2.5 Flash-Lite 10.000.000
Bản dùng thử Gemini 2.5 Flash-Lite 10.000.000
Gemini 2.0 Flash 10.000.000
Hình ảnh Gemini 2.0 Flash 3.000.000
Gemini 2.0 Flash-Lite 10.000.000
Mô hình tạo nhiều phương thức
Bản dùng thử hình ảnh Gemini 3.1 Flash 🍌 1.000.000
Bản dùng thử hình ảnh Gemini 3 Pro 🍌 2.000.000
Mô hình nhúng
Nhúng Gemini 500.000

Cấp 2

Mô hình Số mã thông báo được xếp hàng đợi theo lô
Mô hình văn bản đầu ra
Bản dùng thử Gemini 3.1 Pro 500.000.000
Bản dùng thử Gemini 3.1 Flash-Lite 500.000.000
Bản dùng thử Gemini 3.1 Flash 400.000.000
Gemini 2.5 Pro 500.000.000
Gemini 2.5 Pro TTS 100.000
Gemini 2.5 Flash 400.000.000
Bản dùng thử Gemini 2.5 Flash 400.000.000
Bản dùng thử hình ảnh Gemini 2.5 Flash 400.000.000
Gemini 2.5 Flash TTS 100.000
Gemini 2.5 Flash-Lite 500.000.000
Bản dùng thử Gemini 2.5 Flash-Lite 500.000.000
Gemini 2.0 Flash 1.000.000.000
Hình ảnh Gemini 2.0 Flash 400.000.000
Gemini 2.0 Flash-Lite 1.000.000.000
Mô hình tạo nhiều phương thức
Bản dùng thử hình ảnh Gemini 3.1 Flash 🍌 250.000.000
Bản dùng thử hình ảnh Gemini 3 Pro 🍌 270.000.000
Mô hình nhúng
Nhúng Gemini 5.000.000

Cấp 3

Mô hình Số mã thông báo được xếp hàng đợi theo lô
Mô hình văn bản đầu ra
Bản dùng thử Gemini 3.1 Pro 1.000.000.000
Bản dùng thử Gemini 3.1 Flash-Lite 1.000.000.000
Bản dùng thử Gemini 3.1 Flash 1.000.000.000
Gemini 2.5 Pro 1.000.000.000
Gemini 2.5 Pro TTS 1.000.000
Gemini 2.5 Flash 1.000.000.000
Bản dùng thử Gemini 2.5 Flash 1.000.000.000
Bản dùng thử hình ảnh Gemini 2.5 Flash 1.000.000.000
Gemini 2.5 Flash TTS 4.000.000
Gemini 2.5 Flash-Lite 1.000.000.000
Bản dùng thử Gemini 2.5 Flash-Lite 1.000.000.000
Gemini 2.0 Flash 5.000.000.000
Hình ảnh Gemini 2.0 Flash 1.000.000.000
Gemini 2.0 Flash-Lite 5.000.000.000
Mô hình tạo nhiều phương thức
Bản dùng thử hình ảnh Gemini 3.1 Flash 🍌 750.000.000
Bản dùng thử hình ảnh Gemini 3 Pro 🍌 1.000.000.000
Mô hình nhúng
Nhúng Gemini 10.000.000

Cách nâng cấp lên cấp tiếp theo

Để chuyển từ cấp Miễn phí sang cấp trả phí, trước tiên, bạn phải thiết lập thông tin thanh toán trong AI Studio.

Sau khi dự án của bạn đáp ứng các tiêu chí được chỉ định, dự án đó sẽ tự động được nâng cấp lên cấp tiếp theo. Việc nâng cấp từ cấp Miễn phí lên Cấp 1 thường có hiệu lực ngay lập tức và các lần nâng cấp cấp tiếp theo sẽ có hiệu lực trong vòng 10 phút. Chuyển đến trang Dự án trong AI Studio để kiểm tra cấp của bạn.

Yêu cầu tăng giới hạn tốc độ

Mỗi biến thể mô hình có một giới hạn tốc độ được liên kết (số yêu cầu mỗi phút, RPM). Để biết thông tin chi tiết về các giới hạn tốc độ đó, hãy xem trang Giới hạn tốc độ của AI Studio.

Yêu cầu tăng giới hạn tốc độ của cấp trả phí

Chúng tôi không đảm bảo sẽ tăng giới hạn tốc độ cho bạn, nhưng chúng tôi sẽ cố gắng hết sức để xem xét yêu cầu của bạn.