ขีดจำกัดอัตราจะควบคุมจำนวนคำขอที่คุณส่งไปยัง Gemini API ได้ภายในกรอบเวลาที่กำหนด ขีดจำกัดเหล่านี้ช่วยรักษาการใช้งานอย่างยุติธรรม ป้องกันการละเมิด และช่วยรักษาประสิทธิภาพของระบบสำหรับผู้ใช้ทุกคน
ดูขีดจำกัดอัตราที่ใช้งานอยู่ใน AI Studio
หลักการทำงานของขีดจำกัดอัตรา
โดยปกติแล้วขีดจำกัดอัตราจะวัดจาก 3 มิติ ได้แก่
- คำขอต่อนาที (RPM)
- โทเค็นต่อนาที (อินพุต) (TPM)
- คำขอต่อวัน (RPD)
ระบบจะประเมินการใช้งานของคุณเทียบกับขีดจำกัดแต่ละรายการ และหากเกินขีดจำกัดใดรายการหนึ่ง ระบบจะแสดงข้อผิดพลาดเกี่ยวกับขีดจำกัดอัตรา ตัวอย่างเช่น หากขีดจำกัด RPM ของคุณคือ 20 การส่งคำขอ 21 รายการภายใน 1 นาทีจะทำให้เกิดข้อผิดพลาด แม้ว่าคุณจะยังไม่เกินขีดจำกัด TPM หรือขีดจำกัดอื่นๆ ก็ตาม
ระบบจะใช้ขีดจำกัดอัตราต่อโปรเจ็กต์ ไม่ใช่ต่อคีย์ API ระบบจะรีเซ็ตโควต้าคำขอต่อวัน (RPD) ตอนเที่ยงคืนตามเวลาเขตแปซิฟิก
ขีดจำกัดจะแตกต่างกันไปตามโมเดลที่ใช้ และขีดจำกัดบางรายการใช้ได้กับโมเดลบางรายการเท่านั้น ตัวอย่างเช่น ระบบจะคำนวณรูปภาพต่อนาที หรือ IPM สำหรับโมเดลที่สร้างรูปภาพได้ (Nano Banana) เท่านั้น แต่แนวคิดจะคล้ายกับ TPM โมเดลอื่นๆ อาจมีขีดจำกัดโทเค็นต่อวัน (TPD)
ขีดจำกัดอัตราสำหรับโมเดลทดลองและโมเดลเวอร์ชันพรีวิวจะเข้มงวดกว่า
ระดับการใช้งาน
ขีดจำกัดอัตราจะเชื่อมโยงกับระดับการใช้งานของโปรเจ็กต์ เมื่อการใช้งาน API และค่าใช้จ่ายเพิ่มขึ้น ระบบจะอัปเกรดคุณเป็นระดับที่สูงขึ้นโดยอัตโนมัติพร้อมขีดจำกัดอัตราที่เพิ่มขึ้น
คุณสมบัติสำหรับระดับ 2 และ 3 จะอิงตามค่าใช้จ่ายสะสมทั้งหมดสำหรับบริการของ Google Cloud (ซึ่งรวมถึงแต่ไม่จำกัดเพียง Gemini API) สำหรับบัญชีสำหรับการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์
| ระดับการใช้งาน | คุณสมบัติ | ขีดจำกัดระดับการเรียกเก็บเงิน |
|---|---|---|
| ฟรี | โปรเจ็กต์ที่ใช้งานอยู่ หรือช่วงทดลองใช้ฟรี | ไม่มี |
| ระดับ 1 | ตั้งค่าและลิงก์บัญชีสำหรับการเรียกเก็บเงินที่ใช้งานอยู่ | $250 |
| ระดับ 2 | ชำระเงิน $100 ขึ้นไปและผ่านไป 3 วันนับจากวันที่ชำระเงินสำเร็จครั้งแรก | $2,000 |
| ระดับ 3 | ชำระเงิน $1,000 ขึ้นไปและผ่านไป 30 วันนับจากวันที่ชำระเงินสำเร็จครั้งแรก | $20,000 - $100,000+ |
แม้ว่าการเป็นไปตามเกณฑ์คุณสมบัติที่ระบุไว้จะเพียงพอต่อการอนุมัติโดยทั่วไป แต่ในบางกรณีที่พบได้ยาก ระบบอาจปฏิเสธคำขออัปเกรดโดยอิงตามปัจจัยอื่นๆ ที่ระบุไว้ในระหว่างกระบวนการตรวจสอบ
ระบบนี้ช่วยรักษาความปลอดภัยและความสมบูรณ์ของแพลตฟอร์ม Gemini API สำหรับผู้ใช้ทุกคน
ขีดจำกัดอัตรา Gemini API
ขีดจำกัดอัตราขึ้นอยู่กับปัจจัยหลายอย่าง (เช่น ระดับการใช้งาน) และดูได้ใน Google AI Studio เมื่อระดับและสถานะบัญชีของคุณเปลี่ยนแปลงไปตามกาลเวลา ขีดจำกัดอัตราจะอัปเดตโดยอัตโนมัติ
ดูขีดจำกัดอัตราที่ใช้งานอยู่ใน AI Studio
ระบบไม่รับประกันขีดจำกัดอัตราที่ระบุไว้ และความจุจริงอาจแตกต่างกันไป
ขีดจำกัดอัตราการอนุมานลำดับความสำคัญ
การใช้งานลำดับความสำคัญมีขีดจำกัดอัตราของตัวเอง แม้ว่าระบบจะนับการใช้งานรวมกับขีดจำกัดอัตราการรับส่งข้อมูลแบบโต้ตอบโดยรวมก็ตาม ขีดจำกัดอัตราเริ่มต้นคือ 0.3 เท่าของ ขีดจำกัดอัตรามาตรฐาน สำหรับโมเดลและระดับแต่ละรายการ
ขีดจำกัดอัตรา Batch API
คำขอ Batch API มีขีดจำกัดอัตราของตัวเอง ซึ่งแยกจากการเรียกใช้ API ที่ไม่ใช่แบบกลุ่ม
- คำขอแบบกลุ่มพร้อมกัน: 100 รายการ
- ขีดจำกัดขนาดไฟล์อินพุต: 2 GB
- ขีดจำกัดพื้นที่เก็บข้อมูลไฟล์: 20 GB
- โทเค็นที่เข้าคิวต่อโมเดล: ตารางโทเค็นที่เข้าคิวแบบกลุ่ม จะแสดงจำนวนโทเค็นสูงสุดที่เข้าคิวสำหรับการประมวลผลแบบกลุ่มในงานแบบกลุ่มที่ใช้งานอยู่ทั้งหมดสำหรับโมเดลที่กำหนด
ระดับ 1
| โมเดล | โทเค็นที่เข้าคิวแบบกลุ่ม | |||
|---|---|---|---|---|
| โมเดลข้อความออก | ||||
| Gemini 3.1 Pro เวอร์ชันพรีวิว | 5,000,000 | |||
| Gemini 3.1 Flash-Lite | 10,000,000 | |||
| Gemini 3.1 Flash-Lite เวอร์ชันพรีวิว | 10,000,000 | |||
| Gemini 3 Flash เวอร์ชันพรีวิว | 3,000,000 | |||
| Gemini 2.5 Pro | 5,000,000 | |||
| Gemini 2.5 Pro TTS | 25,000 | |||
| Gemini 2.5 Flash | 3,000,000 | |||
| Gemini 2.5 Flash เวอร์ชันพรีวิว | 3,000,000 | |||
| Gemini 2.5 Flash Image เวอร์ชันพรีวิว | 3,000,000 | |||
| Gemini 2.5 Flash TTS | 100,000 | |||
| Gemini 2.5 Flash-Lite | 10,000,000 | |||
| Gemini 2.5 Flash-Lite เวอร์ชันพรีวิว | 10,000,000 | |||
| Gemini 2.0 Flash | 10,000,000 | |||
| Gemini 2.0 Flash Image | 3,000,000 | |||
| Gemini 2.0 Flash-Lite | 10,000,000 | |||
| โมเดลการสร้างหลายโมดัล | ||||
| Gemini 3.1 Flash Image เวอร์ชันพรีวิว 🍌 | 1,000,000 | |||
| Gemini 3 Pro Image เวอร์ชันพรีวิว 🍌 | 2,000,000 | |||
| โมเดลการฝัง | ||||
| Gemini Embedding | 500,000 | |||
ระดับ 2
| โมเดล | โทเค็นที่เข้าคิวแบบกลุ่ม | |||
|---|---|---|---|---|
| โมเดลข้อความออก | ||||
| Gemini 3.1 Pro เวอร์ชันพรีวิว | 500,000,000 | |||
| Gemini 3.1 Flash-Lite | 500,000,000 | |||
| Gemini 3.1 Flash-Lite เวอร์ชันพรีวิว | 500,000,000 | |||
| Gemini 3.1 Flash เวอร์ชันพรีวิว | 400,000,000 | |||
| Gemini 2.5 Pro | 500,000,000 | |||
| Gemini 2.5 Pro TTS | 100,000 | |||
| Gemini 2.5 Flash | 400,000,000 | |||
| Gemini 2.5 Flash เวอร์ชันพรีวิว | 400,000,000 | |||
| Gemini 2.5 Flash Image เวอร์ชันพรีวิว | 400,000,000 | |||
| Gemini 2.5 Flash TTS | 100,000 | |||
| Gemini 2.5 Flash-Lite | 500,000,000 | |||
| Gemini 2.5 Flash-Lite เวอร์ชันพรีวิว | 500,000,000 | |||
| Gemini 2.0 Flash | 1,000,000,000 | |||
| Gemini 2.0 Flash Image | 400,000,000 | |||
| Gemini 2.0 Flash-Lite | 1,000,000,000 | |||
| โมเดลการสร้างหลายโมดัล | ||||
| Gemini 3.1 Flash Image เวอร์ชันพรีวิว 🍌 | 250,000,000 | |||
| Gemini 3 Pro Image เวอร์ชันพรีวิว 🍌 | 270,000,000 | |||
| โมเดลการฝัง | ||||
| Gemini Embedding | 5,000,000 | |||
ระดับ 3
| โมเดล | โทเค็นที่เข้าคิวแบบกลุ่ม | |||
|---|---|---|---|---|
| โมเดลข้อความออก | ||||
| Gemini 3.1 Pro เวอร์ชันพรีวิว | 1,000,000,000 | |||
| Gemini 3.1 Flash-Lite | 1,000,000,000 | |||
| Gemini 3.1 Flash-Lite เวอร์ชันพรีวิว | 1,000,000,000 | |||
| Gemini 3.1 Flash เวอร์ชันพรีวิว | 1,000,000,000 | |||
| Gemini 2.5 Pro | 1,000,000,000 | |||
| Gemini 2.5 Pro TTS | 1,000,000 | |||
| Gemini 2.5 Flash | 1,000,000,000 | |||
| Gemini 2.5 Flash เวอร์ชันพรีวิว | 1,000,000,000 | |||
| Gemini 2.5 Flash Image เวอร์ชันพรีวิว | 1,000,000,000 | |||
| Gemini 2.5 Flash TTS | 4,000,000 | |||
| Gemini 2.5 Flash-Lite | 1,000,000,000 | |||
| Gemini 2.5 Flash-Lite เวอร์ชันพรีวิว | 1,000,000,000 | |||
| Gemini 2.0 Flash | 5,000,000,000 | |||
| Gemini 2.0 Flash Image | 1,000,000,000 | |||
| Gemini 2.0 Flash-Lite | 5,000,000,000 | |||
| โมเดลการสร้างหลายโมดัล | ||||
| Gemini 3.1 Flash Image เวอร์ชันพรีวิว 🍌 | 750,000,000 | |||
| Gemini 3 Pro Image เวอร์ชันพรีวิว 🍌 | 1,000,000,000 | |||
| โมเดลการฝัง | ||||
| Gemini Embedding | 10,000,000 | |||
วิธีอัปเกรดเป็นระดับถัดไป
หากต้องการเปลี่ยนจากระดับฟรีเป็นระดับที่ต้องชำระเงิน คุณต้อง ตั้งค่าการเรียกเก็บเงินใน AI Studio ก่อน
เมื่อโปรเจ็กต์เป็นไปตามเกณฑ์ที่ระบุไว้ ระบบจะ อัปเกรดเป็นระดับถัดไปโดยอัตโนมัติ โดยปกติแล้วการอัปเกรดระดับจากระดับฟรีเป็นระดับ 1 จะมีผลทันที และการอัปเกรดระดับถัดไปจะมีผลภายใน 10 นาที ไปที่หน้าโปรเจ็กต์ใน AI Studio เพื่อตรวจสอบระดับของคุณ
ขอเพิ่มขีดจำกัดอัตรา
โมเดลแต่ละเวอร์ชันมีขีดจำกัดอัตรา (คำขอต่อนาที, RPM) ที่เกี่ยวข้อง ดูรายละเอียดเกี่ยวกับขีดจำกัดอัตราเหล่านั้นได้ที่หน้า ขีดจำกัดอัตรา AI Studio
ขอเพิ่มขีดจำกัดอัตราของระดับที่ต้องชำระเงิน
เราไม่รับประกันว่าจะเพิ่มขีดจำกัดอัตราให้ได้ แต่จะพยายามตรวจสอบคำขอของคุณอย่างเต็มที่