การจำกัดอัตราจะควบคุมจำนวนคำขอที่คุณส่งไปยัง Gemini API ได้ ภายในกรอบเวลาที่กำหนด ขีดจำกัดเหล่านี้ช่วยรักษาการใช้งานที่เป็นธรรม ป้องกันการละเมิด และช่วยรักษาประสิทธิภาพของระบบสำหรับผู้ใช้ทุกคน
ดูขีดจำกัดอัตราที่ใช้งานอยู่ใน AI Studio
วิธีการทำงานของขีดจำกัดอัตรา
โดยปกติแล้ว ระบบจะวัดขีดจำกัดอัตราใน 3 มิติ ดังนี้
- คำขอต่อนาที (RPM)
- โทเค็นต่อนาที (อินพุต) (TPM)
- คำขอต่อวัน (RPD)
ระบบจะประเมินการใช้งานของคุณเทียบกับขีดจำกัดแต่ละรายการ และการใช้งานเกินขีดจำกัดใดก็ตามจะ ทําให้เกิดข้อผิดพลาดเกี่ยวกับอัตราการจำกัด เช่น หากขีดจำกัด RPM คือ 20 การส่งคำขอ 21 รายการภายใน 1 นาทีจะทำให้เกิดข้อผิดพลาด แม้ว่าคุณจะยังไม่เกินขีดจำกัด TPM หรือขีดจำกัดอื่นๆ ก็ตาม
ระบบจะใช้การจำกัดอัตราต่อโปรเจ็กต์ ไม่ใช่ต่อคีย์ API คำขอต่อวัน (RPD) โควต้าจะรีเซ็ตตอนเที่ยงคืนตามเวลาแปซิฟิก
ขีดจำกัดจะแตกต่างกันไปตามโมเดลที่ใช้ และขีดจำกัดบางอย่างจะใช้ได้กับโมเดลบางรุ่นเท่านั้น ตัวอย่างเช่น ระบบจะคำนวณรูปภาพต่อนาที (IPM) สำหรับโมเดลที่สร้างรูปภาพได้ (Nano Banana) เท่านั้น แต่ในเชิงแนวคิดแล้วจะคล้ายกับ TPM โมเดลอื่นๆ อาจมีขีดจำกัดโทเค็นต่อวัน (TPD)
โมเดลทดลองและโมเดลเวอร์ชันตัวอย่างจะมีขีดจำกัดอัตราที่เข้มงวดกว่า
ระดับการใช้งาน
ขีดจำกัดอัตราจะเชื่อมโยงกับระดับการใช้งานของโปรเจ็กต์ เมื่อการใช้งาน API และการใช้จ่ายเพิ่มขึ้น ระบบจะอัปเกรดคุณเป็นระดับที่สูงขึ้นโดยอัตโนมัติพร้อมกับการเพิ่มขีดจำกัดอัตราคำขอ
การมีสิทธิ์สำหรับระดับที่ 2 และ 3 จะพิจารณาจากค่าใช้จ่ายสะสมทั้งหมด ในบริการของ Google Cloud (รวมถึงแต่ไม่จำกัดเพียง Gemini API) สำหรับ บัญชีการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์ของคุณ
| ระดับการใช้งาน | คุณสมบัติ |
|---|---|
| ฟรี | ลงชื่อสมัครใช้ (บัญชี Google) |
| ระดับ 1 | เปิดใช้งานบัญชีสำหรับการเรียกเก็บเงิน |
| ระดับ 2 | ชำระเงิน $100 ไปยังบัญชีสำหรับการเรียกเก็บเงิน และอย่างน้อย 3 วันนับตั้งแต่การชำระเงินครั้งแรกสำเร็จ |
| ระดับ 3 | ชำระเงิน $1,000 สำหรับบัญชีสำหรับการเรียกเก็บเงิน และอย่างน้อย 30 วันนับตั้งแต่การชำระเงินครั้งแรกสำเร็จ |
แม้ว่าโดยทั่วไปการมีคุณสมบัติตรงตามเกณฑ์การมีสิทธิ์ที่ระบุไว้จะเพียงพอต่อการอนุมัติ แต่ในบางกรณีที่พบได้ไม่บ่อยนัก คำขออัปเกรดอาจถูกปฏิเสธโดยอิงตามปัจจัยอื่นๆ ที่พบในกระบวนการตรวจสอบ
ระบบนี้ช่วยรักษาความปลอดภัยและความสมบูรณ์ของแพลตฟอร์ม Gemini API สำหรับผู้ใช้ทุกคน
ขีดจำกัดอัตราของ Gemini API
ขีดจำกัดอัตราขึ้นอยู่กับปัจจัยต่างๆ (เช่น ระดับโควต้า) และดูได้ใน Google AI Studio เมื่อระดับและสถานะบัญชีของคุณเปลี่ยนแปลงไป ระบบจะอัปเดตขีดจำกัดอัตราโดยอัตโนมัติ
ดูขีดจำกัดอัตราที่ใช้งานอยู่ใน AI Studio
ระบบไม่รับประกันขีดจำกัดอัตราที่ระบุ และความจุจริงอาจแตกต่างกันไป
ขีดจำกัดอัตราของ Batch API
คำขอ Batch API จะขึ้นอยู่กับขีดจำกัดอัตราของตัวเอง ซึ่งแยกจากการเรียก API แบบไม่เป็นกลุ่ม
- คำขอแบบกลุ่มพร้อมกัน: 100
- ขีดจำกัดขนาดไฟล์อินพุต: 2 GB
- ขีดจำกัดพื้นที่เก็บข้อมูลไฟล์: 20 GB
- โทเค็นที่จัดคิวต่อโมเดล: ตารางโทเค็นที่จัดคิวแบบกลุ่มจะแสดง จำนวนโทเค็นสูงสุดที่จัดคิวสำหรับการประมวลผลแบบกลุ่มได้ ในงานแบบกลุ่มที่ใช้งานอยู่ทั้งหมดสำหรับโมเดลที่กำหนด
ระดับ 1
| รุ่น | โทเค็นที่จัดคิวเป็นกลุ่ม | |||
|---|---|---|---|---|
| โมเดลข้อความออก | ||||
| Gemini 3.1 Pro (เวอร์ชันตัวอย่าง) | 5,000,000 | |||
| Gemini 3.1 Flash-Lite (เวอร์ชันตัวอย่าง) | 10,000,000 | |||
| Gemini 3 Flash (เวอร์ชันตัวอย่าง) | 3,000,000 | |||
| Gemini 2.5 Pro | 5,000,000 | |||
| TTS ของ Gemini 2.5 Pro | 25,000 | |||
| Gemini 2.5 Flash | 3,000,000 | |||
| Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 3,000,000 | |||
| เวอร์ชันตัวอย่างของรูปภาพ Gemini 2.5 Flash | 3,000,000 | |||
| TTS ของ Gemini 2.5 Flash | 100,000 | |||
| Gemini 2.5 Flash-Lite | 10,000,000 | |||
| Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง) | 10,000,000 | |||
| Gemini 2.0 Flash | 10,000,000 | |||
| รูปภาพ Gemini 2.0 Flash | 3,000,000 | |||
| Gemini 2.0 Flash-Lite | 10,000,000 | |||
| โมเดลการสร้างแบบหลายโมดัล | ||||
| ตัวอย่างรูปภาพ Gemini 3.1 Flash 🍌 | 1,000,000 | |||
| ตัวอย่างรูปภาพ Gemini 3 Pro 🍌 | 2,000,000 | |||
| โมเดลการฝัง | ||||
| การฝัง Gemini | 500,000 | |||
ระดับ 2
| รุ่น | โทเค็นที่จัดคิวเป็นกลุ่ม | |||
|---|---|---|---|---|
| โมเดลข้อความออก | ||||
| Gemini 3.1 Pro (เวอร์ชันตัวอย่าง) | 500,000,000 | |||
| Gemini 3.1 Flash-Lite (เวอร์ชันตัวอย่าง) | 500,000,000 | |||
| Gemini 3.1 Flash (เวอร์ชันตัวอย่าง) | 400,000,000 | |||
| Gemini 2.5 Pro | 500,000,000 | |||
| TTS ของ Gemini 2.5 Pro | 100,000 | |||
| Gemini 2.5 Flash | 400,000,000 | |||
| Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 400,000,000 | |||
| เวอร์ชันตัวอย่างของรูปภาพ Gemini 2.5 Flash | 400,000,000 | |||
| TTS ของ Gemini 2.5 Flash | 100,000 | |||
| Gemini 2.5 Flash-Lite | 500,000,000 | |||
| Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง) | 500,000,000 | |||
| Gemini 2.0 Flash | 1,000,000,000 | |||
| รูปภาพ Gemini 2.0 Flash | 400,000,000 | |||
| Gemini 2.0 Flash-Lite | 1,000,000,000 | |||
| โมเดลการสร้างแบบหลายโมดัล | ||||
| ตัวอย่างรูปภาพ Gemini 3.1 Flash 🍌 | 250,000,000 | |||
| ตัวอย่างรูปภาพ Gemini 3 Pro 🍌 | 270,000,000 | |||
| โมเดลการฝัง | ||||
| การฝัง Gemini | 5,000,000 | |||
ระดับ 3
| รุ่น | โทเค็นที่จัดคิวเป็นกลุ่ม | |||
|---|---|---|---|---|
| โมเดลข้อความออก | ||||
| Gemini 3.1 Pro (เวอร์ชันตัวอย่าง) | 1,000,000,000 | |||
| Gemini 3.1 Flash-Lite (เวอร์ชันตัวอย่าง) | 1,000,000,000 | |||
| Gemini 3.1 Flash (เวอร์ชันตัวอย่าง) | 1,000,000,000 | |||
| Gemini 2.5 Pro | 1,000,000,000 | |||
| TTS ของ Gemini 2.5 Pro | 1,000,000 | |||
| Gemini 2.5 Flash | 1,000,000,000 | |||
| Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 1,000,000,000 | |||
| เวอร์ชันตัวอย่างของรูปภาพ Gemini 2.5 Flash | 1,000,000,000 | |||
| TTS ของ Gemini 2.5 Flash | 4,000,000 | |||
| Gemini 2.5 Flash-Lite | 1,000,000,000 | |||
| Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง) | 1,000,000,000 | |||
| Gemini 2.0 Flash | 5,000,000,000 | |||
| รูปภาพ Gemini 2.0 Flash | 1,000,000,000 | |||
| Gemini 2.0 Flash-Lite | 5,000,000,000 | |||
| โมเดลการสร้างแบบหลายโมดัล | ||||
| ตัวอย่างรูปภาพ Gemini 3.1 Flash 🍌 | 750,000,000 | |||
| ตัวอย่างรูปภาพ Gemini 3 Pro 🍌 | 1,000,000,000 | |||
| โมเดลการฝัง | ||||
| การฝัง Gemini | 10,000,000 | |||
วิธีอัปเกรดเป็นระดับถัดไป
หากต้องการเปลี่ยนจากระดับฟรีเป็นระดับแบบชำระเงิน คุณต้องตั้งค่าการเรียกเก็บเงินใน AI Studio ก่อน
เมื่อโปรเจ็กต์เป็นไปตามเกณฑ์ที่ระบุแล้ว ระบบจะอัปเกรดโปรเจ็กต์เป็นระดับถัดไปโดยอัตโนมัติ โดยปกติการอัปเกรดระดับจากฟรีเป็นระดับที่ 1 จะมีผลทันที และการอัปเกรดระดับต่อๆ ไปจะมีผลภายใน 10 นาที ไปที่หน้าโปรเจ็กต์ใน AI Studio เพื่อตรวจสอบระดับของคุณ
ขอเพิ่มขีดจำกัดอัตรา
โมเดลแต่ละรูปแบบจะมีขีดจำกัดอัตรา (คำขอต่อนาที หรือ RPM) ที่เชื่อมโยงกัน ดูรายละเอียดเกี่ยวกับขีดจำกัดอัตราดังกล่าวได้ที่หน้าขีดจำกัดอัตราของ AI Studio
ขอเพิ่มขีดจำกัดอัตราของระดับแบบชำระเงิน
เราไม่รับประกันว่าจะเพิ่มขีดจำกัดอัตราได้ แต่จะพยายามอย่างเต็มที่ เพื่อตรวจสอบคำขอของคุณ