การจำกัดอัตราจะควบคุมจำนวนคำขอที่คุณส่งไปยัง Gemini API ได้ ภายในกรอบเวลาที่กำหนด ขีดจำกัดเหล่านี้ช่วยรักษาการใช้งานที่เป็นธรรม ป้องกันการละเมิด และช่วยรักษาประสิทธิภาพของระบบสำหรับผู้ใช้ทุกคน
ดูขีดจำกัดอัตราที่ใช้งานอยู่ใน AI Studio
วิธีการทำงานของขีดจำกัดอัตรา
โดยปกติแล้ว ระบบจะวัดขีดจำกัดอัตราใน 3 มิติ ดังนี้
- คำขอต่อนาที (RPM)
- โทเค็นต่อนาที (อินพุต) (TPM)
- คำขอต่อวัน (RPD)
ระบบจะประเมินการใช้งานของคุณเทียบกับขีดจำกัดแต่ละรายการ และการใช้งานเกินขีดจำกัดใดก็ตามจะ ทําให้เกิดข้อผิดพลาดเกี่ยวกับอัตราการจำกัด เช่น หากขีดจำกัด RPM คือ 20 การส่งคำขอ 21 รายการภายใน 1 นาทีจะทำให้เกิดข้อผิดพลาด แม้ว่าคุณจะยังไม่เกินขีดจำกัด TPM หรือขีดจำกัดอื่นๆ ก็ตาม
ระบบจะใช้การจำกัดอัตราต่อโปรเจ็กต์ ไม่ใช่ต่อคีย์ API โควต้าคำขอต่อวัน (RPD) จะรีเซ็ตตอนเที่ยงคืนตามเวลาแปซิฟิก
ขีดจำกัดจะแตกต่างกันไปตามโมเดลที่ใช้ และขีดจำกัดบางอย่างจะใช้ได้กับโมเดลบางรุ่นเท่านั้น เช่น ระบบจะคำนวณรูปภาพต่อนาที (IPM) สำหรับโมเดลที่สร้างรูปภาพได้ (Nano Banana) เท่านั้น แต่ในเชิงแนวคิดแล้วจะคล้ายกับ TPM โมเดลอื่นๆ อาจมีขีดจำกัดโทเค็นต่อวัน (TPD)
โมเดลทดลองและโมเดลเวอร์ชันตัวอย่างจะมีขีดจำกัดอัตราที่เข้มงวดกว่า
ขีดจำกัดอัตราตามการใช้จ่าย
นอกเหนือจากขีดจำกัดคำขอต่อนาที (RPM) และโทเค็นต่อนาที (TPM) แล้ว Gemini API ยังบังคับใช้ขีดจำกัดอัตราตามการใช้จ่ายเพื่อป้องกันค่าใช้จ่ายที่ไม่คาดคิด การที่ขีดจำกัดเหล่านี้จะมีผลกับบัญชีของคุณหรือไม่นั้นขึ้นอยู่กับประวัติการเรียกเก็บเงินและระดับการใช้งาน
ตารางต่อไปนี้แสดงขีดจํากัดอัตราตามการใช้จ่ายสําหรับแต่ละระดับการใช้งาน ระบบจะประเมินขีดจำกัดเหล่านี้ในกรอบเวลา 10 นาที แบบต่อเนื่อง การใช้ขีดจำกัดเหล่านี้กับบัญชีของคุณจะขึ้นอยู่กับประวัติการเรียกเก็บเงินและสถานะบัญชี
| ระดับการใช้งาน | ขีดจำกัดอัตราการใช้จ่าย (ต่อ 10 นาที) |
|---|---|
| ฟรี | ไม่มี |
| ระดับที่ 1 | $10 |
| ระดับ 2 | $200 |
| ระดับ 3 | $200 |
หากถึงขีดจำกัดอัตราตามการใช้จ่าย API จะแสดง429 RESOURCE_EXHAUSTED
ข้อผิดพลาด วิธีแก้ไขปัญหามีดังนี้
- รอแล้วลองอีกครั้งหลังจากผ่านไปสักครู่
- ลดอัตราคำขอที่มีค่าใช้จ่ายสูง เช่น โดยใช้หน้าต่างบริบทที่เล็กลงหรือเอาต์พุตที่สั้นลง
- หากคุณพบว่ามีการใช้งานเกินขีดจำกัดนี้อย่างสม่ำเสมอในระหว่างการใช้งานปกติ ขอเพิ่มขีดจำกัดอัตรา
ระดับการใช้งาน
ขีดจำกัดอัตราจะเชื่อมโยงกับระดับการใช้งานของโปรเจ็กต์ เมื่อการใช้งาน API และการใช้จ่ายเพิ่มขึ้น ระบบจะอัปเกรดคุณเป็นระดับที่สูงขึ้นโดยอัตโนมัติพร้อมกับการเพิ่มขีดจำกัดอัตราคำขอ
การมีสิทธิ์สำหรับระดับที่ 2 และ 3 จะพิจารณาจากค่าใช้จ่ายสะสมทั้งหมดในบริการของ Google Cloud (ซึ่งรวมถึงแต่ไม่จำกัดเพียง Gemini API) สำหรับบัญชีสำหรับการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์ของคุณ
| ระดับการใช้งาน | รอบคัดเลือก | การจำกัดระดับการเรียกเก็บเงิน |
|---|---|---|
| ฟรี | โปรเจ็กต์ที่ใช้งานอยู่หรือช่วงทดลองใช้ฟรี | ไม่มี |
| ระดับที่ 1 | ตั้งค่าและลิงก์บัญชีสำหรับการเรียกเก็บเงินที่ใช้งานอยู่ | $250 |
| ระดับ 2 | ชำระเงิน $100 + 3 วันนับจากการชำระเงินครั้งแรกสำเร็จ | $2,000 |
| ระดับ 3 | ชำระเงิน $1,000 + 30 วันนับจากการชำระเงินครั้งแรกสำเร็จ | $20,000 - $100,000 ขึ้นไป |
แม้ว่าการมีคุณสมบัติตรงตามเกณฑ์ที่ระบุโดยทั่วไปจะเพียงพอต่อการอนุมัติ แต่ในบางกรณีที่พบได้ไม่บ่อยนัก คำขออัปเกรดอาจถูกปฏิเสธโดยอิงตามปัจจัยอื่นๆ ที่พบในกระบวนการตรวจสอบ
ระบบนี้ช่วยรักษาความปลอดภัยและความสมบูรณ์ของแพลตฟอร์ม Gemini API สำหรับผู้ใช้ทุกคน
ขีดจำกัดอัตราของ Gemini API
ขีดจำกัดอัตราการใช้งานขึ้นอยู่กับปัจจัยหลายประการ (เช่น ระดับการใช้งานของคุณ) และดูได้ใน Google AI Studio เมื่อระดับและสถานะบัญชีของคุณเปลี่ยนแปลงไปเมื่อเวลาผ่านไป ระบบจะอัปเดตขีดจำกัดอัตราโดยอัตโนมัติ
ดูขีดจำกัดอัตราที่ใช้งานอยู่ใน AI Studio
ระบบไม่รับประกันขีดจำกัดอัตราที่ระบุ และความจุจริงอาจแตกต่างกันไป
ขีดจำกัดอัตราคำขอการอนุมานที่มีลำดับความสำคัญ
การใช้ลำดับความสำคัญจะมีการจำกัดอัตราของตัวเอง แม้ว่าระบบจะนับการใช้รวมในการจำกัดอัตราการเข้าชมแบบอินเทอร์แอกทีฟโดยรวม ก็ตาม ขีดจำกัดอัตราเริ่มต้นคือ 0.3 เท่าของขีดจำกัดอัตรามาตรฐานสำหรับแต่ละโมเดลและแต่ละระดับ
ขีดจำกัดอัตราของ Batch API
คำขอ Batch API จะขึ้นอยู่กับขีดจำกัดอัตราของตัวเอง ซึ่งแยกจากการเรียก API แบบไม่เป็นกลุ่ม
- คำขอแบบกลุ่มพร้อมกัน: 100
- ขีดจำกัดขนาดไฟล์อินพุต: 2 GB
- ขีดจำกัดพื้นที่เก็บข้อมูลไฟล์: 20 GB
- โทเค็นที่เข้าคิวต่อโมเดล: ตารางโทเค็นที่เข้าคิวแบบกลุ่มแสดง จำนวนโทเค็นสูงสุดที่เข้าคิวสำหรับการประมวลผลแบบกลุ่มได้ ในงานแบบกลุ่มที่ใช้งานอยู่ทั้งหมดสำหรับโมเดลที่กำหนด
ระดับ 1
| รุ่น | โทเค็นที่จัดคิวเป็นกลุ่ม | |||
|---|---|---|---|---|
| โมเดลข้อความออก | ||||
| เวอร์ชันตัวอย่างของ Gemini 3.1 Pro | 5,000,000 | |||
| Gemini 3.1 Flash-Lite | 10,000,000 | |||
| Gemini 3.1 Flash-Lite (เวอร์ชันตัวอย่าง) | 10,000,000 | |||
| Gemini 3.5 Flash | 3,000,000 | |||
| Gemini 3.5 Flash | 3,000,000 | |||
| Gemini 2.5 Pro | 5,000,000 | |||
| TTS ของ Gemini 2.5 Pro | 25,000 | |||
| Gemini 2.5 Flash | 3,000,000 | |||
| Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 3,000,000 | |||
| เวอร์ชันตัวอย่างของรูปภาพ Gemini 2.5 Flash | 3,000,000 | |||
| TTS ของ Gemini 2.5 Flash | 100,000 | |||
| Gemini 2.5 Flash-Lite | 10,000,000 | |||
| Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง) | 10,000,000 | |||
| Gemini 2.0 Flash | 10,000,000 | |||
| รูปภาพ Gemini 2.0 Flash | 3,000,000 | |||
| Gemini 2.0 Flash-Lite | 10,000,000 | |||
| โมเดลการสร้างแบบหลายโมดัล | ||||
| ตัวอย่างรูปภาพ Gemini 3.1 Flash 🍌 | 1,000,000 | |||
| ตัวอย่างรูปภาพ Gemini 3 Pro 🍌 | 2,000,000 | |||
| โมเดลการฝัง | ||||
| การฝัง Gemini | 500,000 | |||
ระดับ 2
| รุ่น | โทเค็นที่จัดคิวเป็นกลุ่ม | |||
|---|---|---|---|---|
| โมเดลข้อความออก | ||||
| เวอร์ชันตัวอย่างของ Gemini 3.1 Pro | 500,000,000 | |||
| Gemini 3.1 Flash-Lite | 500,000,000 | |||
| Gemini 3.1 Flash-Lite (เวอร์ชันตัวอย่าง) | 500,000,000 | |||
| Gemini 3.5 Flash | 400,000,000 | |||
| Gemini 3.5 Flash | 400,000,000 | |||
| Gemini 2.5 Pro | 500,000,000 | |||
| TTS ของ Gemini 2.5 Pro | 100,000 | |||
| Gemini 2.5 Flash | 400,000,000 | |||
| Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 400,000,000 | |||
| เวอร์ชันตัวอย่างของรูปภาพ Gemini 2.5 Flash | 400,000,000 | |||
| TTS ของ Gemini 2.5 Flash | 100,000 | |||
| Gemini 2.5 Flash-Lite | 500,000,000 | |||
| Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง) | 500,000,000 | |||
| Gemini 2.0 Flash | 1,000,000,000 | |||
| รูปภาพ Gemini 2.0 Flash | 400,000,000 | |||
| Gemini 2.0 Flash-Lite | 1,000,000,000 | |||
| โมเดลการสร้างแบบหลายโมดัล | ||||
| ตัวอย่างรูปภาพ Gemini 3.1 Flash 🍌 | 250,000,000 | |||
| ตัวอย่างรูปภาพ Gemini 3 Pro 🍌 | 270,000,000 | |||
| โมเดลการฝัง | ||||
| การฝัง Gemini | 5,000,000 | |||
ระดับ 3
| รุ่น | โทเค็นที่จัดคิวเป็นกลุ่ม | |||
|---|---|---|---|---|
| โมเดลข้อความออก | ||||
| เวอร์ชันตัวอย่างของ Gemini 3.1 Pro | 1,000,000,000 | |||
| Gemini 3.1 Flash-Lite | 1,000,000,000 | |||
| Gemini 3.1 Flash-Lite (เวอร์ชันตัวอย่าง) | 1,000,000,000 | |||
| Gemini 3.5 Flash | 1,000,000,000 | |||
| Gemini 3.5 Flash | 1,000,000,000 | |||
| Gemini 2.5 Pro | 1,000,000,000 | |||
| TTS ของ Gemini 2.5 Pro | 1,000,000 | |||
| Gemini 2.5 Flash | 1,000,000,000 | |||
| Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 1,000,000,000 | |||
| เวอร์ชันตัวอย่างของรูปภาพ Gemini 2.5 Flash | 1,000,000,000 | |||
| TTS ของ Gemini 2.5 Flash | 4,000,000 | |||
| Gemini 2.5 Flash-Lite | 1,000,000,000 | |||
| Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง) | 1,000,000,000 | |||
| Gemini 2.0 Flash | 5,000,000,000 | |||
| รูปภาพ Gemini 2.0 Flash | 1,000,000,000 | |||
| Gemini 2.0 Flash-Lite | 5,000,000,000 | |||
| โมเดลการสร้างแบบหลายโมดัล | ||||
| ตัวอย่างรูปภาพ Gemini 3.1 Flash 🍌 | 750,000,000 | |||
| ตัวอย่างรูปภาพ Gemini 3 Pro 🍌 | 1,000,000,000 | |||
| โมเดลการฝัง | ||||
| การฝัง Gemini | 10,000,000 | |||
วิธีอัปเกรดเป็นระดับถัดไป
หากต้องการเปลี่ยนจากระดับฟรีเป็นระดับแบบชำระเงิน คุณต้องตั้งค่าการเรียกเก็บเงินใน AI Studio ก่อน
เมื่อโปรเจ็กต์เป็นไปตามเกณฑ์ที่ระบุแล้ว ระบบจะอัปเกรดโปรเจ็กต์เป็นระดับถัดไปโดยอัตโนมัติ โดยปกติการอัปเกรดระดับจากฟรีเป็นระดับ 1 จะมีผลทันที และการอัปเกรดระดับต่อๆ ไปจะมีผลภายใน 10 นาที ไปที่หน้าโปรเจ็กต์ใน AI Studio เพื่อตรวจสอบระดับของคุณ
ขอเพิ่มอัตราการจำกัด
โมเดลแต่ละรูปแบบจะมีขีดจำกัดอัตรา (คำขอต่อนาที หรือ RPM) ที่เชื่อมโยงกัน ดูรายละเอียดเกี่ยวกับขีดจำกัดอัตราดังกล่าวได้ที่หน้าขีดจำกัดอัตราของ AI Studio
ขอเพิ่มขีดจำกัดอัตราของระดับแบบชำระเงิน
เราไม่รับประกันว่าจะเพิ่มขีดจำกัดอัตราได้ แต่จะพยายามอย่างเต็มที่ เพื่อตรวจสอบคำขอของคุณ