การจำกัดอัตราจะควบคุมจำนวนคำขอที่คุณส่งไปยัง Gemini API ได้ ภายในกรอบเวลาที่กำหนด ขีดจำกัดเหล่านี้ช่วยรักษาการใช้งานที่เป็นธรรม ป้องกันการละเมิด และช่วยรักษาประสิทธิภาพของระบบสำหรับผู้ใช้ทุกคน
ดูขีดจำกัดอัตราการใช้งานที่ใช้งานอยู่ใน AI Studio
วิธีการทำงานของขีดจำกัดอัตรา
โดยปกติแล้ว ระบบจะวัดขีดจำกัดอัตราใน 3 มิติ ดังนี้
- คำขอต่อนาที (RPM)
- โทเค็นต่อนาที (อินพุต) (TPM)
- คำขอต่อวัน (RPD)
ระบบจะประเมินการใช้งานของคุณเทียบกับขีดจำกัดแต่ละรายการ และการใช้งานเกินขีดจำกัดใดก็ตามจะ ทําให้เกิดข้อผิดพลาดเกี่ยวกับอัตราการจำกัด เช่น หากขีดจำกัด RPM คือ 20 การส่งคำขอ 21 รายการภายใน 1 นาทีจะทำให้เกิดข้อผิดพลาด แม้ว่าคุณจะยังไม่เกินขีดจำกัด TPM หรือขีดจำกัดอื่นๆ ก็ตาม
ระบบจะใช้การจำกัดอัตราต่อโปรเจ็กต์ ไม่ใช่ต่อคีย์ API โควต้าคำขอต่อวัน (RPD) จะรีเซ็ตตอนเที่ยงคืนตามเวลาแปซิฟิก
ขีดจำกัดจะแตกต่างกันไปตามโมเดลที่ใช้ และขีดจำกัดบางอย่างจะใช้ได้กับโมเดลบางรุ่นเท่านั้น ตัวอย่างเช่น ระบบจะคำนวณรูปภาพต่อนาที (IPM) สำหรับโมเดลที่สร้างรูปภาพได้ (Imagen 3) เท่านั้น แต่ในเชิงแนวคิดแล้วจะคล้ายกับ TPM โมเดลอื่นๆ อาจมีขีดจำกัดโทเค็นต่อวัน (TPD)
โมเดลทดลองและโมเดลเวอร์ชันตัวอย่างจะมีขีดจำกัดอัตราที่เข้มงวดกว่า
ระดับการใช้งาน
ขีดจำกัดอัตราจะเชื่อมโยงกับระดับการใช้งานของโปรเจ็กต์ เมื่อการใช้งาน API และการใช้จ่ายเพิ่มขึ้น คุณจะมีตัวเลือกในการอัปเกรดเป็นระดับที่สูงขึ้นพร้อมการจำกัดอัตราคำขอที่เพิ่มขึ้น
การมีสิทธิ์สำหรับระดับที่ 2 และ 3 จะพิจารณาจากค่าใช้จ่ายสะสมทั้งหมด ในบริการของ Google Cloud (รวมถึงแต่ไม่จำกัดเพียง Gemini API) สำหรับ บัญชีการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์ของคุณ
| ระดับ | คุณสมบัติ |
|---|---|
| ฟรี | ผู้ใช้ในประเทศที่มีสิทธิ์ |
| ระดับ 1 | บัญชีสำหรับการเรียกเก็บเงินที่ชำระเงินเต็มจำนวนที่ลิงก์กับโปรเจ็กต์ |
| ระดับ 2 | การใช้จ่ายทั้งหมด: มากกว่า $250 และอย่างน้อย 30 วันนับตั้งแต่ชำระเงินสำเร็จ |
| ระดับ 3 | ค่าใช้จ่ายทั้งหมด: มากกว่า $1,000 และอย่างน้อย 30 วันนับตั้งแต่ชำระเงินสำเร็จ |
เมื่อคุณขออัปเกรด ระบบป้องกันการละเมิดอัตโนมัติของเราจะทำการตรวจสอบเพิ่มเติม แม้ว่าการมีคุณสมบัติตรงตามเกณฑ์การมีสิทธิ์ที่ระบุไว้โดยทั่วไปจะเพียงพอต่อการอนุมัติ แต่ในบางกรณีที่พบได้ไม่บ่อยนัก คำขออัปเกรดอาจถูกปฏิเสธโดยอิงตามปัจจัยอื่นๆ ที่พบในกระบวนการตรวจสอบ
ระบบนี้ช่วยรักษาความปลอดภัยและความสมบูรณ์ของแพลตฟอร์ม Gemini API สำหรับผู้ใช้ทุกคน
ขีดจำกัดอัตราการใช้งาน Gemini API
ขีดจำกัดอัตราขึ้นอยู่กับปัจจัยต่างๆ (เช่น ระดับโควต้า) และดูได้ใน Google AI Studio เมื่อระดับและสถานะบัญชีเปลี่ยนแปลงไปตามกาลเวลา ระบบจะอัปเดต ขีดจำกัดอัตราโดยอัตโนมัติ
ดูขีดจำกัดอัตราการใช้งานที่ใช้งานอยู่ใน AI Studio
ระบบไม่รับประกันขีดจำกัดอัตราที่ระบุ และความจุจริงอาจแตกต่างกันไป
ขีดจำกัดอัตราของ Batch API
คำขอ Batch API จะขึ้นอยู่กับขีดจำกัดอัตราของตัวเอง ซึ่งแยกจากการเรียก API แบบไม่เป็นกลุ่ม
- คำขอแบบกลุ่มพร้อมกัน: 100
- ขีดจำกัดขนาดไฟล์อินพุต: 2 GB
- ขีดจำกัดพื้นที่เก็บข้อมูลไฟล์: 20 GB
- โทเค็นที่จัดคิวต่อโมเดล: ตารางโทเค็นที่จัดคิวแบบกลุ่มจะแสดง จำนวนโทเค็นสูงสุดที่จัดคิวสำหรับการประมวลผลแบบกลุ่มได้ ในงานแบบกลุ่มที่ใช้งานอยู่ทั้งหมดสำหรับโมเดลที่กำหนด
ระดับ 1
| รุ่น | โทเค็นที่จัดคิวเป็นกลุ่ม | |||
|---|---|---|---|---|
| โมเดลข้อความออก | ||||
| Gemini 3 Pro เวอร์ชันตัวอย่าง | 50,000,000 | |||
| Gemini 2.5 Pro | 5,000,000 | |||
| Gemini 2.5 Flash | 3,000,000 | |||
| Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 3,000,000 | |||
| Gemini 2.5 Flash-Lite | 10,000,000 | |||
| Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง) | 10,000,000 | |||
| Gemini 2.0 Flash | 10,000,000 | |||
| Gemini 2.0 Flash-Lite | 10,000,000 | |||
| โมเดลการสร้างแบบหลายโมดัล | ||||
| ตัวอย่างรูปภาพ Gemini 3 Pro 🍌 | 2,000,000 | |||
ระดับ 2
| รุ่น | โทเค็นที่จัดคิวเป็นกลุ่ม | |||
|---|---|---|---|---|
| โมเดลข้อความออก | ||||
| Gemini 3 Pro เวอร์ชันตัวอย่าง | 500,000,000 | |||
| Gemini 2.5 Pro | 500,000,000 | |||
| Gemini 2.5 Flash | 400,000,000 | |||
| Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 400,000,000 | |||
| Gemini 2.5 Flash-Lite | 500,000,000 | |||
| Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง) | 500,000,000 | |||
| Gemini 2.0 Flash | 1,000,000,000 | |||
| Gemini 2.0 Flash-Lite | 1,000,000,000 | |||
| โมเดลการสร้างแบบหลายโมดัล | ||||
| ตัวอย่างรูปภาพ Gemini 3 Pro 🍌 | 270,000,000 | |||
ระดับ 3
| รุ่น | โทเค็นที่จัดคิวเป็นกลุ่ม | |||
|---|---|---|---|---|
| โมเดลข้อความออก | ||||
| Gemini 3 Pro เวอร์ชันตัวอย่าง | 1,000,000,000 | |||
| Gemini 2.5 Pro | 1,000,000,000 | |||
| Gemini 2.5 Flash | 1,000,000,000 | |||
| Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 1,000,000,000 | |||
| Gemini 2.5 Flash-Lite | 1,000,000,000 | |||
| Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง) | 1,000,000,000 | |||
| Gemini 2.0 Flash | 5,000,000,000 | |||
| Gemini 2.0 Flash-Lite | 5,000,000,000 | |||
| โมเดลการสร้างแบบหลายโมดัล | ||||
| ตัวอย่างรูปภาพ Gemini 3 Pro 🍌 | 1,000,000,000 | |||
วิธีอัปเกรดเป็นระดับถัดไป
Gemini API ใช้การเรียกเก็บเงินใน Cloud สำหรับบริการเรียกเก็บเงินทั้งหมด หากต้องการเปลี่ยนจาก ระดับฟรีเป็นระดับแบบชำระเงิน คุณต้องเปิดใช้การเรียกเก็บเงินในระบบคลาวด์สำหรับโปรเจ็กต์ Google Cloud ก่อน
เมื่อโปรเจ็กต์ของคุณเป็นไปตามเกณฑ์ที่ระบุแล้ว โปรเจ็กต์จะมีสิทธิ์ อัปเกรดเป็นระดับถัดไป หากต้องการขออัปเกรด ให้ทำตามขั้นตอนต่อไปนี้
- ไปที่หน้าคีย์ API ใน AI Studio
- ค้นหาโปรเจ็กต์ที่ต้องการอัปเกรด แล้วคลิก "อัปเกรด" ตัวเลือก "อัปเกรด" จะแสดงเฉพาะในโปรเจ็กต์ที่มีคุณสมบัติตรงตามการมีสิทธิ์สำหรับระดับถัดไป
หลังจากตรวจสอบอย่างรวดเร็วแล้ว ระบบจะอัปเกรดโปรเจ็กต์เป็นระดับถัดไป
ขอเพิ่มขีดจำกัดอัตรา
โมเดลแต่ละรูปแบบจะมีขีดจำกัดอัตรา (คำขอต่อนาที หรือ RPM) ที่เชื่อมโยงกัน ดูรายละเอียดเกี่ยวกับขีดจำกัดอัตราดังกล่าวได้ที่โมเดล Gemini
ขอเพิ่มขีดจำกัดอัตราของระดับแบบชำระเงิน
เราไม่รับประกันว่าจะเพิ่มขีดจำกัดอัตราได้ แต่จะพยายามอย่างเต็มที่ เพื่อตรวจสอบคำขอของคุณ