การจำกัดอัตราจะควบคุมจำนวนคำขอที่คุณส่งไปยัง Gemini API ได้ ภายในกรอบเวลาที่กำหนด ขีดจำกัดเหล่านี้ช่วยรักษาการใช้งานที่เป็นธรรม ป้องกันการละเมิด และช่วยรักษาประสิทธิภาพของระบบสำหรับผู้ใช้ทุกคน
ดูขีดจำกัดอัตราที่ใช้งานอยู่ใน AI Studio
วิธีการทำงานของขีดจำกัดอัตรา
โดยปกติแล้ว ระบบจะวัดขีดจำกัดอัตราใน 3 มิติ ดังนี้
- คำขอต่อนาที (RPM)
- โทเค็นต่อนาที (อินพุต) (TPM)
- คำขอต่อวัน (RPD)
ระบบจะประเมินการใช้งานของคุณเทียบกับขีดจำกัดแต่ละรายการ และการใช้งานเกินขีดจำกัดใดก็ตามจะ ทําให้เกิดข้อผิดพลาดเกี่ยวกับอัตราการจำกัด เช่น หากขีดจำกัด RPM คือ 20 การส่งคำขอ 21 รายการภายใน 1 นาทีจะทำให้เกิดข้อผิดพลาด แม้ว่าคุณจะยังไม่เกินขีดจำกัด TPM หรือขีดจำกัดอื่นๆ ก็ตาม
ระบบจะใช้การจำกัดอัตราต่อโปรเจ็กต์ ไม่ใช่ต่อคีย์ API โควต้าคำขอต่อวัน (RPD) จะรีเซ็ตตอนเที่ยงคืนตามเวลาแปซิฟิก
ขีดจำกัดจะแตกต่างกันไปตามโมเดลที่ใช้ และขีดจำกัดบางอย่างจะใช้ได้กับโมเดลบางรุ่นเท่านั้น ตัวอย่างเช่น ระบบจะคำนวณรูปภาพต่อนาที (IPM) สำหรับโมเดลที่สร้างรูปภาพได้ (Nano Banana) เท่านั้น แต่ในเชิงแนวคิดแล้วจะคล้ายกับ TPM โมเดลอื่นๆ อาจมีขีดจำกัดโทเค็นต่อวัน (TPD)
โมเดลทดลองและโมเดลเวอร์ชันตัวอย่างจะมีขีดจำกัดอัตราที่เข้มงวดกว่า
ระดับการใช้งาน
ขีดจำกัดอัตราจะเชื่อมโยงกับระดับการใช้งานของโปรเจ็กต์ เมื่อการใช้งาน API และการใช้จ่ายเพิ่มขึ้น ระบบจะอัปเกรดคุณเป็นระดับที่สูงขึ้นโดยอัตโนมัติพร้อมกับการเพิ่มขีดจำกัดอัตราคำขอ
การมีสิทธิ์สำหรับระดับที่ 2 และ 3 จะพิจารณาจากค่าใช้จ่ายสะสมทั้งหมดในบริการของ Google Cloud (ซึ่งรวมถึงแต่ไม่จำกัดเพียง Gemini API) สำหรับบัญชีสำหรับการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์ของคุณ
| ระดับการใช้งาน | รอบคัดเลือก | ขีดจำกัดระดับการเรียกเก็บเงิน |
|---|---|---|
| ฟรี | โปรเจ็กต์ที่ใช้งานอยู่หรือช่วงทดลองใช้ฟรี | ไม่มี |
| ระดับที่ 1 | ตั้งค่าและลิงก์บัญชีสำหรับการเรียกเก็บเงินที่ใช้งานอยู่ | $250 |
| ระดับ 2 | ชำระเงิน $100 + 3 วันนับจากการชำระเงินครั้งแรกสำเร็จ | $2,000 |
| ระดับ 3 | ชำระเงิน $1,000 + 30 วันนับจากการชำระเงินครั้งแรกสำเร็จ | $20,000 - $100,000 ขึ้นไป |
แม้ว่าโดยทั่วไปการมีคุณสมบัติตรงตามเกณฑ์การมีสิทธิ์ที่ระบุไว้จะเพียงพอต่อการอนุมัติ แต่ในบางกรณีที่พบได้ไม่บ่อยนัก คำขออัปเกรดอาจถูกปฏิเสธโดยอิงตามปัจจัยอื่นๆ ที่พบในกระบวนการตรวจสอบ
ระบบนี้ช่วยรักษาความปลอดภัยและความสมบูรณ์ของแพลตฟอร์ม Gemini API สำหรับผู้ใช้ทุกคน
ขีดจำกัดอัตราของ Gemini API
ขีดจำกัดอัตราขึ้นอยู่กับปัจจัยหลายประการ (เช่น ระดับการใช้งาน) และดูได้ใน Google AI Studio เมื่อระดับและสถานะบัญชีของคุณเปลี่ยนแปลงไป ระบบจะอัปเดตโควต้าโดยอัตโนมัติ
ดูขีดจำกัดอัตราที่ใช้งานอยู่ใน AI Studio
ระบบไม่รับประกันขีดจำกัดอัตราที่ระบุ และความจุจริงอาจแตกต่างกันไป
ขีดจำกัดอัตราคำขอการอนุมานที่มีลำดับความสำคัญ
การใช้งานลำดับความสำคัญจะมีขีดจำกัดอัตราของตัวเอง แม้ว่าระบบจะนับการใช้งานรวมกับขีดจำกัดอัตราการเข้าชมแบบอินเทอร์แอกทีฟโดยรวมก็ตาม ขีดจำกัดอัตราเริ่มต้นคือ 0.3 เท่าของขีดจำกัดอัตรามาตรฐานสำหรับแต่ละโมเดลและแต่ละระดับ
ขีดจำกัดอัตราของ Batch API
คำขอ Batch API จะขึ้นอยู่กับขีดจำกัดอัตราของตัวเอง ซึ่งแยกจากการเรียก API แบบไม่เป็นกลุ่ม
- คำขอแบบกลุ่มพร้อมกัน: 100
- ขีดจำกัดขนาดไฟล์อินพุต: 2 GB
- ขีดจำกัดพื้นที่เก็บข้อมูลไฟล์: 20 GB
- โทเค็นที่จัดคิวต่อโมเดล: ตารางโทเค็นที่จัดคิวแบบกลุ่มจะแสดง จำนวนโทเค็นสูงสุดที่จัดคิวสำหรับการประมวลผลแบบกลุ่มได้ ในงานแบบกลุ่มที่ใช้งานอยู่ทั้งหมดสำหรับโมเดลที่กำหนด
ระดับ 1
| รุ่น | โทเค็นที่จัดคิวเป็นกลุ่ม | |||
|---|---|---|---|---|
| โมเดลข้อความออก | ||||
| Gemini 3.1 Pro (เวอร์ชันตัวอย่าง) | 5,000,000 | |||
| Gemini 3.1 Flash-Lite (เวอร์ชันตัวอย่าง) | 10,000,000 | |||
| Gemini 3 Flash (เวอร์ชันตัวอย่าง) | 3,000,000 | |||
| Gemini 2.5 Pro | 5,000,000 | |||
| TTS ของ Gemini 2.5 Pro | 25,000 | |||
| Gemini 2.5 Flash | 3,000,000 | |||
| Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 3,000,000 | |||
| เวอร์ชันตัวอย่างของรูปภาพ Gemini 2.5 Flash | 3,000,000 | |||
| TTS ของ Gemini 2.5 Flash | 100,000 | |||
| Gemini 2.5 Flash-Lite | 10,000,000 | |||
| Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง) | 10,000,000 | |||
| Gemini 2.0 Flash | 10,000,000 | |||
| รูปภาพ Gemini 2.0 Flash | 3,000,000 | |||
| Gemini 2.0 Flash-Lite | 10,000,000 | |||
| โมเดลการสร้างแบบหลายโมดัล | ||||
| ตัวอย่างรูปภาพ Gemini 3.1 Flash 🍌 | 1,000,000 | |||
| ตัวอย่างรูปภาพ Gemini 3 Pro 🍌 | 2,000,000 | |||
| โมเดลการฝัง | ||||
| การฝัง Gemini | 500,000 | |||
ระดับ 2
| รุ่น | โทเค็นที่จัดคิวเป็นกลุ่ม | |||
|---|---|---|---|---|
| โมเดลข้อความออก | ||||
| Gemini 3.1 Pro (เวอร์ชันตัวอย่าง) | 500,000,000 | |||
| Gemini 3.1 Flash-Lite (เวอร์ชันตัวอย่าง) | 500,000,000 | |||
| Gemini 3.1 Flash (เวอร์ชันตัวอย่าง) | 400,000,000 | |||
| Gemini 2.5 Pro | 500,000,000 | |||
| TTS ของ Gemini 2.5 Pro | 100,000 | |||
| Gemini 2.5 Flash | 400,000,000 | |||
| Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 400,000,000 | |||
| เวอร์ชันตัวอย่างของรูปภาพ Gemini 2.5 Flash | 400,000,000 | |||
| TTS ของ Gemini 2.5 Flash | 100,000 | |||
| Gemini 2.5 Flash-Lite | 500,000,000 | |||
| Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง) | 500,000,000 | |||
| Gemini 2.0 Flash | 1,000,000,000 | |||
| รูปภาพ Gemini 2.0 Flash | 400,000,000 | |||
| Gemini 2.0 Flash-Lite | 1,000,000,000 | |||
| โมเดลการสร้างแบบหลายโมดัล | ||||
| ตัวอย่างรูปภาพ Gemini 3.1 Flash 🍌 | 250,000,000 | |||
| ตัวอย่างรูปภาพ Gemini 3 Pro 🍌 | 270,000,000 | |||
| โมเดลการฝัง | ||||
| การฝัง Gemini | 5,000,000 | |||
ระดับ 3
| รุ่น | โทเค็นที่จัดคิวเป็นกลุ่ม | |||
|---|---|---|---|---|
| โมเดลข้อความออก | ||||
| Gemini 3.1 Pro (เวอร์ชันตัวอย่าง) | 1,000,000,000 | |||
| Gemini 3.1 Flash-Lite (เวอร์ชันตัวอย่าง) | 1,000,000,000 | |||
| Gemini 3.1 Flash (เวอร์ชันตัวอย่าง) | 1,000,000,000 | |||
| Gemini 2.5 Pro | 1,000,000,000 | |||
| TTS ของ Gemini 2.5 Pro | 1,000,000 | |||
| Gemini 2.5 Flash | 1,000,000,000 | |||
| Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) | 1,000,000,000 | |||
| เวอร์ชันตัวอย่างของรูปภาพ Gemini 2.5 Flash | 1,000,000,000 | |||
| TTS ของ Gemini 2.5 Flash | 4,000,000 | |||
| Gemini 2.5 Flash-Lite | 1,000,000,000 | |||
| Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง) | 1,000,000,000 | |||
| Gemini 2.0 Flash | 5,000,000,000 | |||
| รูปภาพ Gemini 2.0 Flash | 1,000,000,000 | |||
| Gemini 2.0 Flash-Lite | 5,000,000,000 | |||
| โมเดลการสร้างแบบหลายโมดัล | ||||
| ตัวอย่างรูปภาพ Gemini 3.1 Flash 🍌 | 750,000,000 | |||
| ตัวอย่างรูปภาพ Gemini 3 Pro 🍌 | 1,000,000,000 | |||
| โมเดลการฝัง | ||||
| การฝัง Gemini | 10,000,000 | |||
วิธีอัปเกรดเป็นระดับถัดไป
หากต้องการเปลี่ยนจากระดับฟรีเป็นระดับแบบชำระเงิน คุณต้องตั้งค่าการเรียกเก็บเงินใน AI Studio ก่อน
เมื่อโปรเจ็กต์เป็นไปตามเกณฑ์ที่ระบุแล้ว ระบบจะอัปเกรดโปรเจ็กต์เป็นระดับถัดไปโดยอัตโนมัติ โดยปกติการอัปเกรดระดับจากฟรีเป็นระดับ 1 จะมีผลทันที และการอัปเกรดระดับต่อๆ ไปจะมีผลภายใน 10 นาที ไปที่หน้าโปรเจ็กต์ใน AI Studio เพื่อตรวจสอบระดับของคุณ
ขอเพิ่มขีดจำกัดอัตรา
โมเดลแต่ละรูปแบบจะมีขีดจำกัดอัตรา (คำขอต่อนาที หรือ RPM) ที่เชื่อมโยงกัน ดูรายละเอียดเกี่ยวกับขีดจำกัดอัตราดังกล่าวได้ที่หน้าขีดจำกัดอัตราของ AI Studio
ขอเพิ่มขีดจำกัดอัตราของระดับแบบชำระเงิน
เราไม่รับประกันว่าจะเพิ่มขีดจำกัดอัตราได้ แต่จะพยายามอย่างเต็มที่ เพื่อตรวจสอบคำขอของคุณ