ขีดจำกัดอัตรา

ขีดจำกัดอัตราจะควบคุมจำนวนคำขอที่คุณส่งไปยัง Gemini API ได้ภายในกรอบเวลาที่กำหนด ขีดจำกัดเหล่านี้ช่วยรักษาการใช้งานอย่างยุติธรรม ป้องกันการละเมิด และช่วยรักษาประสิทธิภาพของระบบสำหรับผู้ใช้ทุกคน

ดูขีดจำกัดอัตราที่ใช้งานอยู่ใน AI Studio

หลักการทำงานของขีดจำกัดอัตรา

โดยปกติแล้วขีดจำกัดอัตราจะวัดจาก 3 มิติ ได้แก่

  • คำขอต่อนาที (RPM)
  • โทเค็นต่อนาที (อินพุต) (TPM)
  • คำขอต่อวัน (RPD)

ระบบจะประเมินการใช้งานของคุณเทียบกับขีดจำกัดแต่ละรายการ และการใช้งานที่เกินขีดจำกัดใดก็ตามจะทำให้เกิดข้อผิดพลาดเกี่ยวกับขีดจำกัดอัตรา ตัวอย่างเช่น หากขีดจำกัด RPM ของคุณคือ 20 การส่งคำขอ 21 รายการภายใน 1 นาทีจะทำให้เกิดข้อผิดพลาด แม้ว่าคุณจะยังไม่เกินขีดจำกัด TPM หรือขีดจำกัดอื่นๆ ก็ตาม

ระบบจะใช้ขีดจำกัดอัตรากับแต่ละโปรเจ็กต์ ไม่ใช่กับคีย์ API โควต้าคำขอต่อวัน (RPD) จะรีเซ็ตตอนเที่ยงคืนตามเวลาเขตแปซิฟิก

ขีดจำกัดจะแตกต่างกันไปตามโมเดลที่ใช้ และขีดจำกัดบางรายการใช้ได้กับโมเดลบางรายการเท่านั้น ตัวอย่างเช่น ระบบจะคำนวณรูปภาพต่อนาที หรือ IPM สำหรับโมเดลที่สร้างรูปภาพได้ (Nano Banana) เท่านั้น แต่แนวคิดจะคล้ายกับ TPM โมเดลอื่นๆ อาจมีขีดจำกัดโทเค็นต่อวัน (TPD)

ขีดจำกัดอัตราสำหรับโมเดลทดลองและโมเดลเวอร์ชันพรีวิวจะเข้มงวดกว่า

ระดับการใช้งาน

ขีดจำกัดอัตราจะเชื่อมโยงกับระดับการใช้งานของโปรเจ็กต์ เมื่อการใช้งาน API และค่าใช้จ่ายเพิ่มขึ้น ระบบจะอัปเกรดคุณเป็นระดับที่สูงขึ้นโดยอัตโนมัติพร้อมขีดจำกัดอัตราที่เพิ่มขึ้น

คุณสมบัติสำหรับระดับ 2 และ 3 จะอิงตามค่าใช้จ่ายสะสมทั้งหมดสำหรับบริการของ Google Cloud (ซึ่งรวมถึงแต่ไม่จำกัดเพียง Gemini API) สำหรับบัญชีสำหรับการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์

ระดับการใช้งาน คุณสมบัติ ขีดจำกัดระดับการเรียกเก็บเงิน
ฟรี โปรเจ็กต์ที่ใช้งานอยู่ หรือช่วงทดลองใช้ฟรี ไม่มี
ระดับ 1 ตั้งค่าและลิงก์บัญชีสำหรับการเรียกเก็บเงินที่ใช้งานอยู่ $250
ระดับ 2 ชำระเงิน $100 ขึ้นไปและผ่านไป 3 วันนับจากวันที่ชำระเงินสำเร็จครั้งแรก $2,000
ระดับ 3 ชำระเงิน $1,000 ขึ้นไปและผ่านไป 30 วันนับจากวันที่ชำระเงินสำเร็จครั้งแรก $20,000 - $100,000+

แม้ว่าโดยทั่วไปการมีคุณสมบัติตรงตามเกณฑ์ที่ระบุไว้จะเพียงพอสำหรับการอนุมัติ แต่ในบางกรณีที่พบได้ยาก ระบบอาจปฏิเสธคำขออัปเกรดโดยอิงตามปัจจัยอื่นๆ ที่ระบุไว้ในระหว่างกระบวนการตรวจสอบ

ระบบนี้ช่วยรักษาความปลอดภัยและความสมบูรณ์ของแพลตฟอร์ม Gemini API สำหรับผู้ใช้ทุกคน

ขีดจำกัดอัตราของ Gemini API

ขีดจำกัดอัตราขึ้นอยู่กับปัจจัยหลายอย่าง (เช่น ระดับการใช้งาน) และดูได้ใน Google AI Studio เมื่อระดับและสถานะบัญชีของคุณเปลี่ยนแปลงไปตามกาลเวลา ขีดจำกัดอัตราจะอัปเดตโดยอัตโนมัติ

ดูขีดจำกัดอัตราที่ใช้งานอยู่ใน AI Studio

ระบบไม่รับประกันขีดจำกัดอัตราที่ระบุไว้ และความจุจริงอาจแตกต่างกัน

ขีดจำกัดอัตราการอนุมานลำดับความสำคัญ

การใช้งานลำดับความสำคัญมีขีดจำกัดอัตราของตัวเอง แม้ว่าระบบจะนับการใช้งานรวมกับขีดจำกัดอัตราการรับส่งข้อมูลแบบโต้ตอบโดยรวมก็ตาม ขีดจำกัดอัตราเริ่มต้นคือ 0.3 เท่าของ ขีดจำกัดอัตรามาตรฐาน สำหรับแต่ละโมเดลและระดับ

ขีดจำกัดอัตราของ Batch API

คำขอ Batch API จะอยู่ภายใต้ขีดจำกัดอัตรา ของตัวเอง ซึ่งแยกจากการเรียกใช้ API ที่ไม่ใช่แบบกลุ่ม

  • คำขอแบบกลุ่มพร้อมกัน: 100 รายการ
  • ขีดจำกัดขนาดไฟล์อินพุต: 2 GB
  • ขีดจำกัดพื้นที่เก็บข้อมูลไฟล์: 20 GB
  • โทเค็นที่เข้าคิวต่อโมเดล: ตารางโทเค็นที่เข้าคิวแบบกลุ่ม จะแสดงจำนวนโทเค็นสูงสุดที่เข้าคิวสำหรับการประมวลผลแบบกลุ่มในงานแบบกลุ่มที่ใช้งานอยู่ทั้งหมดสำหรับโมเดลที่กำหนด

ระดับ 1

โมเดล โทเค็นที่เข้าคิวแบบกลุ่ม
โมเดลเอาต์พุตข้อความ
Gemini 3.1 Pro เวอร์ชันพรีวิว 5,000,000
Gemini 3.1 Flash-Lite เวอร์ชันพรีวิว 10,000,000
Gemini 3 Flash เวอร์ชันพรีวิว 3,000,000
Gemini 2.5 Pro 5,000,000
Gemini 2.5 Pro TTS 25,000
Gemini 2.5 Flash 3,000,000
Gemini 2.5 Flash เวอร์ชันพรีวิว 3,000,000
Gemini 2.5 Flash Image เวอร์ชันพรีวิว 3,000,000
Gemini 2.5 Flash TTS 100,000
Gemini 2.5 Flash-Lite 10,000,000
Gemini 2.5 Flash-Lite เวอร์ชันพรีวิว 10,000,000
Gemini 2.0 Flash 10,000,000
Gemini 2.0 Flash Image 3,000,000
Gemini 2.0 Flash-Lite 10,000,000
โมเดลการสร้างหลายโมดัล
Gemini 3.1 Flash Image เวอร์ชันพรีวิว 🍌 1,000,000
Gemini 3 Pro Image เวอร์ชันพรีวิว 🍌 2,000,000
โมเดลการฝัง
Gemini Embedding 500,000

ระดับ 2

โมเดล โทเค็นที่เข้าคิวแบบกลุ่ม
โมเดลเอาต์พุตข้อความ
Gemini 3.1 Pro เวอร์ชันพรีวิว 500,000,000
Gemini 3.1 Flash-Lite เวอร์ชันพรีวิว 500,000,000
Gemini 3.1 Flash เวอร์ชันพรีวิว 400,000,000
Gemini 2.5 Pro 500,000,000
Gemini 2.5 Pro TTS 100,000
Gemini 2.5 Flash 400,000,000
Gemini 2.5 Flash เวอร์ชันพรีวิว 400,000,000
Gemini 2.5 Flash Image เวอร์ชันพรีวิว 400,000,000
Gemini 2.5 Flash TTS 100,000
Gemini 2.5 Flash-Lite 500,000,000
Gemini 2.5 Flash-Lite เวอร์ชันพรีวิว 500,000,000
Gemini 2.0 Flash 1,000,000,000
Gemini 2.0 Flash Image 400,000,000
Gemini 2.0 Flash-Lite 1,000,000,000
โมเดลการสร้างหลายโมดัล
Gemini 3.1 Flash Image เวอร์ชันพรีวิว 🍌 250,000,000
Gemini 3 Pro Image เวอร์ชันพรีวิว 🍌 270,000,000
โมเดลการฝัง
Gemini Embedding 5,000,000

ระดับ 3

โมเดล โทเค็นที่เข้าคิวแบบกลุ่ม
โมเดลเอาต์พุตข้อความ
Gemini 3.1 Pro เวอร์ชันพรีวิว 1,000,000,000
Gemini 3.1 Flash-Lite เวอร์ชันพรีวิว 1,000,000,000
Gemini 3.1 Flash เวอร์ชันพรีวิว 1,000,000,000
Gemini 2.5 Pro 1,000,000,000
Gemini 2.5 Pro TTS 1,000,000
Gemini 2.5 Flash 1,000,000,000
Gemini 2.5 Flash เวอร์ชันพรีวิว 1,000,000,000
Gemini 2.5 Flash Image เวอร์ชันพรีวิว 1,000,000,000
Gemini 2.5 Flash TTS 4,000,000
Gemini 2.5 Flash-Lite 1,000,000,000
Gemini 2.5 Flash-Lite เวอร์ชันพรีวิว 1,000,000,000
Gemini 2.0 Flash 5,000,000,000
Gemini 2.0 Flash Image 1,000,000,000
Gemini 2.0 Flash-Lite 5,000,000,000
โมเดลการสร้างหลายโมดัล
Gemini 3.1 Flash Image เวอร์ชันพรีวิว 🍌 750,000,000
Gemini 3 Pro Image เวอร์ชันพรีวิว 🍌 1,000,000,000
โมเดลการฝัง
Gemini Embedding 10,000,000

วิธีอัปเกรดเป็นระดับถัดไป

หากต้องการเปลี่ยนจากระดับฟรีเป็นระดับที่ต้องชำระเงิน คุณต้อง ตั้งค่าการเรียกเก็บเงินใน AI Studio ก่อน

เมื่อโปรเจ็กต์มีคุณสมบัติตรงตามเกณฑ์ที่ระบุไว้ ระบบจะ อัปเกรดโปรเจ็กต์เป็นระดับถัดไปโดยอัตโนมัติ โดยปกติการอัปเกรดระดับจากระดับฟรีเป็นระดับ 1 จะมีผลทันที และการอัปเกรดระดับหลังจากนั้นจะมีผลภายใน 10 นาที ไปที่หน้าโปรเจ็กต์ใน AI Studio เพื่อตรวจสอบระดับของคุณ

ขอเพิ่มขีดจำกัดอัตรา

โมเดลแต่ละเวอร์ชันจะมีขีดจำกัดอัตรา (คำขอต่อนาที, RPM) ที่เชื่อมโยงอยู่ ดูรายละเอียดเกี่ยวกับขีดจำกัดอัตราเหล่านั้นได้ที่หน้า ขีดจำกัดอัตราของ AI Studio

ขอเพิ่มขีดจำกัดอัตราของระดับที่ต้องชำระเงิน

เราไม่รับประกันว่าจะเพิ่มขีดจำกัดอัตราให้ได้ แต่จะพยายามตรวจสอบคำขอของคุณอย่างเต็มที่