ขีดจำกัดอัตราจะควบคุมจำนวนคำขอที่คุณส่งไปยัง Gemini API ได้ภายในกรอบเวลาที่กำหนด ขีดจำกัดเหล่านี้ช่วยรักษาการใช้งานอย่างยุติธรรม ป้องกันการละเมิด และช่วยรักษาประสิทธิภาพของระบบสำหรับผู้ใช้ทุกคน
ดูขีดจำกัดอัตราที่ใช้งานอยู่ใน AI Studio
หลักการทำงานของขีดจำกัดอัตรา
โดยปกติแล้วขีดจำกัดอัตราจะวัดจาก 3 มิติ ได้แก่
- คำขอต่อนาที (RPM)
- โทเค็นต่อนาที (อินพุต) (TPM)
- คำขอต่อวัน (RPD)
ระบบจะประเมินการใช้งานของคุณเทียบกับขีดจำกัดแต่ละรายการ และการใช้งานเกินขีดจำกัดใดก็ตามจะทำให้เกิดข้อผิดพลาดเกี่ยวกับขีดจำกัดอัตรา เช่น หากขีดจำกัด RPM ของคุณคือ 20 การส่งคำขอ 21 รายการภายใน 1 นาทีจะทำให้เกิดข้อผิดพลาด แม้ว่าคุณจะยังไม่ได้ใช้งานเกินขีดจำกัด TPM หรือขีดจำกัดอื่นๆ
ระบบจะใช้ขีดจำกัดอัตรากับแต่ละโปรเจ็กต์ ไม่ใช่กับคีย์ API โควต้าคำขอต่อวัน (RPD) จะรีเซ็ตตอนเที่ยงคืนตามเวลาเขตแปซิฟิก
ขีดจำกัดจะแตกต่างกันไปตามโมเดลที่ใช้ และขีดจำกัดบางรายการใช้ได้กับโมเดลบางรายการเท่านั้น เช่น ระบบจะคำนวณรูปภาพต่อนาที หรือ IPM สำหรับโมเดลที่สร้างรูปภาพได้ (Nano Banana) เท่านั้น แต่แนวคิดจะคล้ายกับ TPM โมเดลอื่นๆ อาจมีขีดจำกัดโทเค็นต่อวัน (TPD)
ขีดจำกัดอัตราจะเข้มงวดกว่าสำหรับโมเดลทดลองและโมเดลเวอร์ชันพรีวิว
ระดับการใช้งาน
ขีดจำกัดอัตราจะเชื่อมโยงกับระดับการใช้งานของโปรเจ็กต์ เมื่อการใช้งานและการใช้จ่าย API เพิ่มขึ้น ระบบจะอัปเกรดคุณเป็นระดับที่สูงขึ้นโดยอัตโนมัติพร้อมขีดจำกัดอัตราที่เพิ่มขึ้น
คุณสมบัติสำหรับระดับ 2 และ 3 จะอิงตามการใช้จ่ายสะสมทั้งหมดในบริการของ Google Cloud (ซึ่งรวมถึงแต่ไม่จำกัดเพียง Gemini API) สำหรับบัญชีสำหรับการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์
| ระดับการใช้งาน | คุณสมบัติ | ขีดจำกัดระดับการเรียกเก็บเงิน |
|---|---|---|
| ฟรี | โปรเจ็กต์ที่ใช้งานอยู่ หรือช่วงทดลองใช้ฟรี | ไม่มี |
| ระดับ 1 | ตั้งค่าและลิงก์บัญชีสำหรับการเรียกเก็บเงินที่ใช้งานอยู่ | $250 |
| ระดับ 2 | ชำระเงิน $100 ขึ้นไปและผ่านไป 3 วันนับจากการชำระเงินครั้งแรกสำเร็จ | $2,000 |
| ระดับ 3 | ชำระเงิน $1,000 ขึ้นไปและผ่านไป 30 วันนับจากการชำระเงินครั้งแรกสำเร็จ | $20,000 - $100,000+ |
แม้ว่าการมีคุณสมบัติตรงตามเกณฑ์ที่ระบุไว้โดยทั่วไปจะเพียงพอสำหรับการอนุมัติ แต่ในบางกรณีที่พบได้ยาก ระบบอาจปฏิเสธคำขออัปเกรดโดยอิงตามปัจจัยอื่นๆ ที่ระบุไว้ในระหว่างกระบวนการตรวจสอบ
ระบบนี้ช่วยรักษาความปลอดภัยและความสมบูรณ์ของแพลตฟอร์ม Gemini API สำหรับผู้ใช้ทุกคน
ขีดจำกัดอัตรา Gemini API
ขีดจำกัดอัตราขึ้นอยู่กับปัจจัยหลายอย่าง (เช่น ระดับการใช้งาน) และดูได้ใน Google AI Studio เมื่อระดับและสถานะบัญชีของคุณเปลี่ยนแปลงไปตามกาลเวลา ขีดจำกัดอัตราจะอัปเดตโดยอัตโนมัติ
ดูขีดจำกัดอัตราที่ใช้งานอยู่ใน AI Studio
ระบบไม่รับประกันขีดจำกัดอัตราที่ระบุไว้ และความจุจริงอาจแตกต่างกันไป
ขีดจำกัดอัตรา Batch API
คำขอ Batch API จะอยู่ภายใต้ขีดจำกัดอัตราของตัวเอง ซึ่งแยกจากการเรียก API ที่ไม่ใช่แบบกลุ่ม
- คำขอแบบกลุ่มพร้อมกัน: 100 รายการ
- ขีดจำกัดขนาดไฟล์อินพุต: 2 GB
- ขีดจำกัดพื้นที่เก็บข้อมูลไฟล์: 20 GB
- โทเค็นที่เข้าคิวต่อโมเดล: ตารางโทเค็นที่เข้าคิวแบบกลุ่ม จะแสดงจำนวนโทเค็นสูงสุดที่เข้าคิวสำหรับการประมวลผลแบบกลุ่มในงานแบบกลุ่มที่ใช้งานอยู่ทั้งหมดสำหรับโมเดลที่กำหนด
ระดับ 1
| โมเดล | โทเค็นที่เข้าคิวแบบกลุ่ม | |||
|---|---|---|---|---|
| โมเดลเอาต์พุตข้อความ | ||||
| Gemini 3.1 Pro เวอร์ชันพรีวิว | 5,000,000 | |||
| Gemini 3.1 Flash-Lite เวอร์ชันพรีวิว | 10,000,000 | |||
| Gemini 3 Flash เวอร์ชันพรีวิว | 3,000,000 | |||
| Gemini 2.5 Pro | 5,000,000 | |||
| Gemini 2.5 Pro TTS | 25,000 | |||
| Gemini 2.5 Flash | 3,000,000 | |||
| Gemini 2.5 Flash เวอร์ชันพรีวิว | 3,000,000 | |||
| Gemini 2.5 Flash Image เวอร์ชันพรีวิว | 3,000,000 | |||
| Gemini 2.5 Flash TTS | 100,000 | |||
| Gemini 2.5 Flash-Lite | 10,000,000 | |||
| Gemini 2.5 Flash-Lite เวอร์ชันพรีวิว | 10,000,000 | |||
| Gemini 2.0 Flash | 10,000,000 | |||
| Gemini 2.0 Flash Image | 3,000,000 | |||
| Gemini 2.0 Flash-Lite | 10,000,000 | |||
| โมเดลการสร้างหลายโมดัล | ||||
| Gemini 3.1 Flash Image เวอร์ชันพรีวิว 🍌 | 1,000,000 | |||
| Gemini 3 Pro Image เวอร์ชันพรีวิว 🍌 | 2,000,000 | |||
| โมเดลการฝัง | ||||
| Gemini Embedding | 500,000 | |||
ระดับ 2
| โมเดล | โทเค็นที่เข้าคิวแบบกลุ่ม | |||
|---|---|---|---|---|
| โมเดลเอาต์พุตข้อความ | ||||
| Gemini 3.1 Pro เวอร์ชันพรีวิว | 500,000,000 | |||
| Gemini 3.1 Flash-Lite เวอร์ชันพรีวิว | 500,000,000 | |||
| Gemini 3.1 Flash เวอร์ชันพรีวิว | 400,000,000 | |||
| Gemini 2.5 Pro | 500,000,000 | |||
| Gemini 2.5 Pro TTS | 100,000 | |||
| Gemini 2.5 Flash | 400,000,000 | |||
| Gemini 2.5 Flash เวอร์ชันพรีวิว | 400,000,000 | |||
| Gemini 2.5 Flash Image เวอร์ชันพรีวิว | 400,000,000 | |||
| Gemini 2.5 Flash TTS | 100,000 | |||
| Gemini 2.5 Flash-Lite | 500,000,000 | |||
| Gemini 2.5 Flash-Lite เวอร์ชันพรีวิว | 500,000,000 | |||
| Gemini 2.0 Flash | 1,000,000,000 | |||
| Gemini 2.0 Flash Image | 400,000,000 | |||
| Gemini 2.0 Flash-Lite | 1,000,000,000 | |||
| โมเดลการสร้างหลายโมดัล | ||||
| Gemini 3.1 Flash Image เวอร์ชันพรีวิว 🍌 | 250,000,000 | |||
| Gemini 3 Pro Image เวอร์ชันพรีวิว 🍌 | 270,000,000 | |||
| โมเดลการฝัง | ||||
| Gemini Embedding | 5,000,000 | |||
ระดับ 3
| โมเดล | โทเค็นที่เข้าคิวแบบกลุ่ม | |||
|---|---|---|---|---|
| โมเดลเอาต์พุตข้อความ | ||||
| Gemini 3.1 Pro เวอร์ชันพรีวิว | 1,000,000,000 | |||
| Gemini 3.1 Flash-Lite เวอร์ชันพรีวิว | 1,000,000,000 | |||
| Gemini 3.1 Flash เวอร์ชันพรีวิว | 1,000,000,000 | |||
| Gemini 2.5 Pro | 1,000,000,000 | |||
| Gemini 2.5 Pro TTS | 1,000,000 | |||
| Gemini 2.5 Flash | 1,000,000,000 | |||
| Gemini 2.5 Flash เวอร์ชันพรีวิว | 1,000,000,000 | |||
| Gemini 2.5 Flash Image เวอร์ชันพรีวิว | 1,000,000,000 | |||
| Gemini 2.5 Flash TTS | 4,000,000 | |||
| Gemini 2.5 Flash-Lite | 1,000,000,000 | |||
| Gemini 2.5 Flash-Lite เวอร์ชันพรีวิว | 1,000,000,000 | |||
| Gemini 2.0 Flash | 5,000,000,000 | |||
| Gemini 2.0 Flash Image | 1,000,000,000 | |||
| Gemini 2.0 Flash-Lite | 5,000,000,000 | |||
| โมเดลการสร้างหลายโมดัล | ||||
| Gemini 3.1 Flash Image เวอร์ชันพรีวิว 🍌 | 750,000,000 | |||
| Gemini 3 Pro Image เวอร์ชันพรีวิว 🍌 | 1,000,000,000 | |||
| โมเดลการฝัง | ||||
| Gemini Embedding | 10,000,000 | |||
วิธีอัปเกรดเป็นระดับถัดไป
หากต้องการเปลี่ยนจากระดับฟรีเป็นระดับที่ต้องชำระเงิน คุณต้อง ตั้งค่าการเรียกเก็บเงินใน AI Studio ก่อน
เมื่อโปรเจ็กต์มีคุณสมบัติตรงตามเกณฑ์ที่ระบุไว้ ระบบจะ อัปเกรดโปรเจ็กต์เป็นระดับถัดไปโดยอัตโนมัติ โดยปกติการอัปเกรดระดับจากระดับฟรีเป็นระดับ 1 จะมีผลทันที และการอัปเกรดระดับต่อๆ ไปจะมีผลภายใน 10 นาที ไปที่หน้าโปรเจ็กต์ใน AI Studio เพื่อตรวจสอบระดับของคุณ
ขอเพิ่มขีดจำกัดอัตรา
โมเดลแต่ละรูปแบบจะมีขีดจำกัดอัตรา (คำขอต่อนาที, RPM) ที่เกี่ยวข้อง ดูรายละเอียดเกี่ยวกับขีดจำกัดอัตราเหล่านั้นได้ที่หน้า ขีดจำกัดอัตรา AI Studio
ขอเพิ่มขีดจำกัดอัตราของระดับที่ต้องชำระเงิน
เราไม่รับประกันว่าจะเพิ่มขีดจำกัดอัตราให้ได้ แต่จะพยายามตรวจสอบคำขอของคุณอย่างเต็มที่