ขีดจำกัดอัตรา

ขีดจำกัดอัตราจะควบคุมจำนวนคำขอที่คุณส่งไปยัง Gemini API ได้ภายในกรอบเวลาที่กำหนด ขีดจำกัดเหล่านี้ช่วยรักษาการใช้งานอย่างยุติธรรม ป้องกันการละเมิด และช่วยรักษาประสิทธิภาพของระบบสำหรับผู้ใช้ทุกคน

ดูขีดจำกัดอัตราที่ใช้งานอยู่ใน AI Studio

หลักการทำงานของขีดจำกัดอัตรา

โดยปกติแล้วขีดจำกัดอัตราจะวัดจาก 3 มิติ ได้แก่

  • คำขอต่อนาที (RPM)
  • โทเค็นต่อนาที (อินพุต) (TPM)
  • คำขอต่อวัน (RPD)

ระบบจะประเมินการใช้งานของคุณเทียบกับขีดจำกัดแต่ละรายการ และการใช้งานเกินขีดจำกัดใดก็ตามจะทำให้เกิดข้อผิดพลาดเกี่ยวกับขีดจำกัดอัตรา เช่น หากขีดจำกัด RPM ของคุณคือ 20 การส่งคำขอ 21 รายการภายใน 1 นาทีจะทำให้เกิดข้อผิดพลาด แม้ว่าคุณจะยังไม่ได้ใช้งานเกินขีดจำกัด TPM หรือขีดจำกัดอื่นๆ

ระบบจะใช้ขีดจำกัดอัตรากับแต่ละโปรเจ็กต์ ไม่ใช่กับคีย์ API โควต้าคำขอต่อวัน (RPD) จะรีเซ็ตตอนเที่ยงคืนตามเวลาเขตแปซิฟิก

ขีดจำกัดจะแตกต่างกันไปตามโมเดลที่ใช้ และขีดจำกัดบางรายการใช้ได้กับโมเดลบางรายการเท่านั้น เช่น ระบบจะคำนวณรูปภาพต่อนาที หรือ IPM สำหรับโมเดลที่สร้างรูปภาพได้ (Nano Banana) เท่านั้น แต่แนวคิดจะคล้ายกับ TPM โมเดลอื่นๆ อาจมีขีดจำกัดโทเค็นต่อวัน (TPD)

ขีดจำกัดอัตราจะเข้มงวดกว่าสำหรับโมเดลทดลองและโมเดลเวอร์ชันพรีวิว

ระดับการใช้งาน

ขีดจำกัดอัตราจะเชื่อมโยงกับระดับการใช้งานของโปรเจ็กต์ เมื่อการใช้งานและการใช้จ่าย API เพิ่มขึ้น ระบบจะอัปเกรดคุณเป็นระดับที่สูงขึ้นโดยอัตโนมัติพร้อมขีดจำกัดอัตราที่เพิ่มขึ้น

คุณสมบัติสำหรับระดับ 2 และ 3 จะอิงตามการใช้จ่ายสะสมทั้งหมดในบริการของ Google Cloud (ซึ่งรวมถึงแต่ไม่จำกัดเพียง Gemini API) สำหรับบัญชีสำหรับการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์

ระดับการใช้งาน คุณสมบัติ ขีดจำกัดระดับการเรียกเก็บเงิน
ฟรี โปรเจ็กต์ที่ใช้งานอยู่ หรือช่วงทดลองใช้ฟรี ไม่มี
ระดับ 1 ตั้งค่าและลิงก์บัญชีสำหรับการเรียกเก็บเงินที่ใช้งานอยู่ $250
ระดับ 2 ชำระเงิน $100 ขึ้นไปและผ่านไป 3 วันนับจากการชำระเงินครั้งแรกสำเร็จ $2,000
ระดับ 3 ชำระเงิน $1,000 ขึ้นไปและผ่านไป 30 วันนับจากการชำระเงินครั้งแรกสำเร็จ $20,000 - $100,000+

แม้ว่าการมีคุณสมบัติตรงตามเกณฑ์ที่ระบุไว้โดยทั่วไปจะเพียงพอสำหรับการอนุมัติ แต่ในบางกรณีที่พบได้ยาก ระบบอาจปฏิเสธคำขออัปเกรดโดยอิงตามปัจจัยอื่นๆ ที่ระบุไว้ในระหว่างกระบวนการตรวจสอบ

ระบบนี้ช่วยรักษาความปลอดภัยและความสมบูรณ์ของแพลตฟอร์ม Gemini API สำหรับผู้ใช้ทุกคน

ขีดจำกัดอัตรา Gemini API

ขีดจำกัดอัตราขึ้นอยู่กับปัจจัยหลายอย่าง (เช่น ระดับการใช้งาน) และดูได้ใน Google AI Studio เมื่อระดับและสถานะบัญชีของคุณเปลี่ยนแปลงไปตามกาลเวลา ขีดจำกัดอัตราจะอัปเดตโดยอัตโนมัติ

ดูขีดจำกัดอัตราที่ใช้งานอยู่ใน AI Studio

ระบบไม่รับประกันขีดจำกัดอัตราที่ระบุไว้ และความจุจริงอาจแตกต่างกันไป

ขีดจำกัดอัตรา Batch API

คำขอ Batch API จะอยู่ภายใต้ขีดจำกัดอัตราของตัวเอง ซึ่งแยกจากการเรียก API ที่ไม่ใช่แบบกลุ่ม

  • คำขอแบบกลุ่มพร้อมกัน: 100 รายการ
  • ขีดจำกัดขนาดไฟล์อินพุต: 2 GB
  • ขีดจำกัดพื้นที่เก็บข้อมูลไฟล์: 20 GB
  • โทเค็นที่เข้าคิวต่อโมเดล: ตารางโทเค็นที่เข้าคิวแบบกลุ่ม จะแสดงจำนวนโทเค็นสูงสุดที่เข้าคิวสำหรับการประมวลผลแบบกลุ่มในงานแบบกลุ่มที่ใช้งานอยู่ทั้งหมดสำหรับโมเดลที่กำหนด

ระดับ 1

โมเดล โทเค็นที่เข้าคิวแบบกลุ่ม
โมเดลเอาต์พุตข้อความ
Gemini 3.1 Pro เวอร์ชันพรีวิว 5,000,000
Gemini 3.1 Flash-Lite เวอร์ชันพรีวิว 10,000,000
Gemini 3 Flash เวอร์ชันพรีวิว 3,000,000
Gemini 2.5 Pro 5,000,000
Gemini 2.5 Pro TTS 25,000
Gemini 2.5 Flash 3,000,000
Gemini 2.5 Flash เวอร์ชันพรีวิว 3,000,000
Gemini 2.5 Flash Image เวอร์ชันพรีวิว 3,000,000
Gemini 2.5 Flash TTS 100,000
Gemini 2.5 Flash-Lite 10,000,000
Gemini 2.5 Flash-Lite เวอร์ชันพรีวิว 10,000,000
Gemini 2.0 Flash 10,000,000
Gemini 2.0 Flash Image 3,000,000
Gemini 2.0 Flash-Lite 10,000,000
โมเดลการสร้างหลายโมดัล
Gemini 3.1 Flash Image เวอร์ชันพรีวิว 🍌 1,000,000
Gemini 3 Pro Image เวอร์ชันพรีวิว 🍌 2,000,000
โมเดลการฝัง
Gemini Embedding 500,000

ระดับ 2

โมเดล โทเค็นที่เข้าคิวแบบกลุ่ม
โมเดลเอาต์พุตข้อความ
Gemini 3.1 Pro เวอร์ชันพรีวิว 500,000,000
Gemini 3.1 Flash-Lite เวอร์ชันพรีวิว 500,000,000
Gemini 3.1 Flash เวอร์ชันพรีวิว 400,000,000
Gemini 2.5 Pro 500,000,000
Gemini 2.5 Pro TTS 100,000
Gemini 2.5 Flash 400,000,000
Gemini 2.5 Flash เวอร์ชันพรีวิว 400,000,000
Gemini 2.5 Flash Image เวอร์ชันพรีวิว 400,000,000
Gemini 2.5 Flash TTS 100,000
Gemini 2.5 Flash-Lite 500,000,000
Gemini 2.5 Flash-Lite เวอร์ชันพรีวิว 500,000,000
Gemini 2.0 Flash 1,000,000,000
Gemini 2.0 Flash Image 400,000,000
Gemini 2.0 Flash-Lite 1,000,000,000
โมเดลการสร้างหลายโมดัล
Gemini 3.1 Flash Image เวอร์ชันพรีวิว 🍌 250,000,000
Gemini 3 Pro Image เวอร์ชันพรีวิว 🍌 270,000,000
โมเดลการฝัง
Gemini Embedding 5,000,000

ระดับ 3

โมเดล โทเค็นที่เข้าคิวแบบกลุ่ม
โมเดลเอาต์พุตข้อความ
Gemini 3.1 Pro เวอร์ชันพรีวิว 1,000,000,000
Gemini 3.1 Flash-Lite เวอร์ชันพรีวิว 1,000,000,000
Gemini 3.1 Flash เวอร์ชันพรีวิว 1,000,000,000
Gemini 2.5 Pro 1,000,000,000
Gemini 2.5 Pro TTS 1,000,000
Gemini 2.5 Flash 1,000,000,000
Gemini 2.5 Flash เวอร์ชันพรีวิว 1,000,000,000
Gemini 2.5 Flash Image เวอร์ชันพรีวิว 1,000,000,000
Gemini 2.5 Flash TTS 4,000,000
Gemini 2.5 Flash-Lite 1,000,000,000
Gemini 2.5 Flash-Lite เวอร์ชันพรีวิว 1,000,000,000
Gemini 2.0 Flash 5,000,000,000
Gemini 2.0 Flash Image 1,000,000,000
Gemini 2.0 Flash-Lite 5,000,000,000
โมเดลการสร้างหลายโมดัล
Gemini 3.1 Flash Image เวอร์ชันพรีวิว 🍌 750,000,000
Gemini 3 Pro Image เวอร์ชันพรีวิว 🍌 1,000,000,000
โมเดลการฝัง
Gemini Embedding 10,000,000

วิธีอัปเกรดเป็นระดับถัดไป

หากต้องการเปลี่ยนจากระดับฟรีเป็นระดับที่ต้องชำระเงิน คุณต้อง ตั้งค่าการเรียกเก็บเงินใน AI Studio ก่อน

เมื่อโปรเจ็กต์มีคุณสมบัติตรงตามเกณฑ์ที่ระบุไว้ ระบบจะ อัปเกรดโปรเจ็กต์เป็นระดับถัดไปโดยอัตโนมัติ โดยปกติการอัปเกรดระดับจากระดับฟรีเป็นระดับ 1 จะมีผลทันที และการอัปเกรดระดับต่อๆ ไปจะมีผลภายใน 10 นาที ไปที่หน้าโปรเจ็กต์ใน AI Studio เพื่อตรวจสอบระดับของคุณ

ขอเพิ่มขีดจำกัดอัตรา

โมเดลแต่ละรูปแบบจะมีขีดจำกัดอัตรา (คำขอต่อนาที, RPM) ที่เกี่ยวข้อง ดูรายละเอียดเกี่ยวกับขีดจำกัดอัตราเหล่านั้นได้ที่หน้า ขีดจำกัดอัตรา AI Studio

ขอเพิ่มขีดจำกัดอัตราของระดับที่ต้องชำระเงิน

เราไม่รับประกันว่าจะเพิ่มขีดจำกัดอัตราให้ได้ แต่จะพยายามตรวจสอบคำขอของคุณอย่างเต็มที่