ขีดจำกัดอัตรา

ขีดจำกัดอัตราจะควบคุมจำนวนคำขอที่คุณส่งไปยัง Gemini API ได้ภายในกรอบเวลาที่กำหนด ขีดจำกัดเหล่านี้ช่วยรักษาการใช้งานอย่างยุติธรรม ป้องกันการละเมิด และช่วยรักษาประสิทธิภาพของระบบสำหรับผู้ใช้ทุกคน

ดูขีดจำกัดอัตราที่ใช้งานอยู่ใน AI Studio

วิธีการทำงานของขีดจำกัดอัตรา

โดยปกติแล้วขีดจำกัดอัตราจะวัดจาก 3 มิติ ได้แก่

  • คำขอต่อนาที (RPM)
  • โทเค็นต่อนาที (อินพุต) (TPM)
  • คำขอต่อวัน (RPD)

ระบบจะประเมินการใช้งานของคุณเทียบกับขีดจำกัดแต่ละรายการ และการใช้งานเกินขีดจำกัดใดก็ตามจะทำให้เกิดข้อผิดพลาดเกี่ยวกับขีดจำกัดอัตรา ตัวอย่างเช่น หากขีดจำกัด RPM ของคุณคือ 20 การส่งคำขอ 21 รายการภายใน 1 นาทีจะทำให้เกิดข้อผิดพลาด แม้ว่าคุณจะยังไม่ได้ใช้โทเค็นเกินขีดจำกัด TPM หรือขีดจำกัดอื่นๆ

ระบบจะใช้ขีดจำกัดอัตรากับแต่ละโปรเจ็กต์ ไม่ใช่กับคีย์ API โควต้าคำขอต่อวัน (RPD) จะรีเซ็ตตอนเที่ยงคืนตามเวลาแปซิฟิก

ขีดจำกัดจะแตกต่างกันไปตามโมเดลที่ใช้ และขีดจำกัดบางรายการใช้ได้กับโมเดลบางรายการเท่านั้น ตัวอย่างเช่น ระบบจะคำนวณรูปภาพต่อนาที หรือ IPM สำหรับโมเดลที่สร้างรูปภาพได้ (Nano Banana) เท่านั้น แต่แนวคิดจะคล้ายกับ TPM โมเดลอื่นๆ อาจมีขีดจำกัดโทเค็นต่อวัน (TPD)

ขีดจำกัดอัตราสำหรับโมเดลทดลองและโมเดลเวอร์ชันพรีวิวจะเข้มงวดกว่า

ระดับการใช้งาน

ขีดจำกัดอัตราจะเชื่อมโยงกับระดับการใช้งานของโปรเจ็กต์ เมื่อการใช้งาน API และค่าใช้จ่ายเพิ่มขึ้น ระบบจะอัปเกรดคุณเป็นระดับที่สูงขึ้นโดยอัตโนมัติพร้อมขีดจำกัดอัตราที่เพิ่มขึ้น

คุณสมบัติสำหรับระดับที่ 2 และ 3 จะอิงตามค่าใช้จ่ายสะสมทั้งหมดสำหรับบริการ Google Cloud (ซึ่งรวมถึงแต่ไม่จำกัดเพียง Gemini API) ของบัญชีสำหรับการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์

ระดับการใช้งาน คุณสมบัติ ขีดจำกัดระดับการเรียกเก็บเงิน
ฟรี โปรเจ็กต์ที่ใช้งานอยู่ หรือช่วงทดลองใช้ฟรี ไม่มี
ระดับที่ 1 ตั้งค่าและลิงก์บัญชีสำหรับการเรียกเก็บเงินที่ใช้งานอยู่ $250
ระดับที่ 2 ชำระเงิน $100 ขึ้นไปและผ่านไป 3 วันนับจากวันที่ชำระเงินครั้งแรกสำเร็จ $2,000
ระดับที่ 3 ชำระเงิน $1,000 ขึ้นไปและผ่านไป 30 วันนับจากวันที่ชำระเงินครั้งแรกสำเร็จ $20,000 - $100,000 ขึ้นไป

แม้ว่าโดยทั่วไปการมีคุณสมบัติตรงตามเกณฑ์ที่ระบุไว้จะเพียงพอสำหรับการอนุมัติ แต่ในบางกรณีที่พบได้ยาก ระบบอาจปฏิเสธคำขออัปเกรดโดยอิงตามปัจจัยอื่นๆ ที่พบในระหว่างกระบวนการตรวจสอบ

ระบบนี้ช่วยรักษาความปลอดภัยและความสมบูรณ์ของแพลตฟอร์ม Gemini API สำหรับผู้ใช้ทุกคน

ขีดจำกัดอัตรา Gemini API

ขีดจำกัดอัตราขึ้นอยู่กับปัจจัยหลายอย่าง (เช่น ระดับการใช้งาน) และดูได้ใน Google AI Studio เมื่อระดับและสถานะบัญชีของคุณเปลี่ยนแปลงไปตามกาลเวลา ขีดจำกัดอัตราจะอัปเดตโดยอัตโนมัติ

ดูขีดจำกัดอัตราที่ใช้งานอยู่ใน AI Studio

ระบบไม่รับประกันขีดจำกัดอัตราที่ระบุไว้ และความจุจริงอาจแตกต่างกันไป

ขีดจำกัดอัตราการอนุมานตามลำดับความสำคัญ

การใช้งานตามลำดับความสำคัญจะมีขีดจำกัดอัตราของตัวเอง แม้ว่าระบบจะนับการใช้งานรวมกับขีดจำกัดอัตราการรับส่งข้อมูลแบบโต้ตอบโดยรวม ขีดจำกัดอัตราเริ่มต้นคือ 0.3 เท่าของ ขีดจำกัดอัตรามาตรฐาน สำหรับแต่ละโมเดลและระดับ

ขีดจำกัดอัตรา Batch API

คำขอ Batch API จะอยู่ภายใต้ขีดจำกัดอัตรา ของตัวเอง ซึ่งแยกจากการเรียกใช้ API ที่ไม่ใช่แบบกลุ่ม

  • คำขอแบบกลุ่มพร้อมกัน: 100 รายการ
  • ขีดจำกัดขนาดไฟล์อินพุต: 2 GB
  • ขีดจำกัดพื้นที่เก็บข้อมูลไฟล์: 20 GB
  • โทเค็นที่เข้าคิวต่อโมเดล: ตารางโทเค็นที่เข้าคิวแบบกลุ่ม จะแสดงจำนวนโทเค็นสูงสุดที่เข้าคิวสำหรับการประมวลผลแบบกลุ่มในงานแบบกลุ่มที่ใช้งานอยู่ทั้งหมดสำหรับโมเดลที่กำหนด

ระดับที่ 1

โมเดล โทเค็นที่เข้าคิวแบบกลุ่ม
โมเดลข้อความออก
Gemini 3.1 Pro เวอร์ชันพรีวิว 5,000,000
Gemini 3.1 Flash-Lite 10,000,000
Gemini 3.1 Flash-Lite เวอร์ชันพรีวิว 10,000,000
Gemini 3.5 Flash 3,000,000
Gemini 3.5 Flash 3,000,000
Gemini 2.5 Pro 5,000,000
Gemini 2.5 Pro TTS 25,000
Gemini 2.5 Flash 3,000,000
Gemini 2.5 Flash เวอร์ชันพรีวิว 3,000,000
Gemini 2.5 Flash Image เวอร์ชันพรีวิว 3,000,000
Gemini 2.5 Flash TTS 100,000
Gemini 2.5 Flash-Lite 10,000,000
Gemini 2.5 Flash-Lite เวอร์ชันพรีวิว 10,000,000
Gemini 2.0 Flash 10,000,000
Gemini 2.0 Flash Image 3,000,000
Gemini 2.0 Flash-Lite 10,000,000
โมเดลการสร้างหลายโมดัล
Gemini 3.1 Flash Image เวอร์ชันพรีวิว 🍌 1,000,000
Gemini 3 Pro Image เวอร์ชันพรีวิว 🍌 2,000,000
โมเดลการฝัง
Gemini Embedding 500,000

ระดับที่ 2

โมเดล โทเค็นที่เข้าคิวแบบกลุ่ม
โมเดลข้อความออก
Gemini 3.1 Pro เวอร์ชันพรีวิว 500,000,000
Gemini 3.1 Flash-Lite 500,000,000
Gemini 3.1 Flash-Lite เวอร์ชันพรีวิว 500,000,000
Gemini 3.5 Flash 400,000,000
Gemini 3.5 Flash 400,000,000
Gemini 2.5 Pro 500,000,000
Gemini 2.5 Pro TTS 100,000
Gemini 2.5 Flash 400,000,000
Gemini 2.5 Flash เวอร์ชันพรีวิว 400,000,000
Gemini 2.5 Flash Image เวอร์ชันพรีวิว 400,000,000
Gemini 2.5 Flash TTS 100,000
Gemini 2.5 Flash-Lite 500,000,000
Gemini 2.5 Flash-Lite เวอร์ชันพรีวิว 500,000,000
Gemini 2.0 Flash 1,000,000,000
Gemini 2.0 Flash Image 400,000,000
Gemini 2.0 Flash-Lite 1,000,000,000
โมเดลการสร้างหลายโมดัล
Gemini 3.1 Flash Image เวอร์ชันพรีวิว 🍌 250,000,000
Gemini 3 Pro Image เวอร์ชันพรีวิว 🍌 270,000,000
โมเดลการฝัง
Gemini Embedding 5,000,000

ระดับที่ 3

โมเดล โทเค็นที่เข้าคิวแบบกลุ่ม
โมเดลข้อความออก
Gemini 3.1 Pro เวอร์ชันพรีวิว 1,000,000,000
Gemini 3.1 Flash-Lite 1,000,000,000
Gemini 3.1 Flash-Lite เวอร์ชันพรีวิว 1,000,000,000
Gemini 3.5 Flash 1,000,000,000
Gemini 3.5 Flash 1,000,000,000
Gemini 2.5 Pro 1,000,000,000
Gemini 2.5 Pro TTS 1,000,000
Gemini 2.5 Flash 1,000,000,000
Gemini 2.5 Flash เวอร์ชันพรีวิว 1,000,000,000
Gemini 2.5 Flash Image เวอร์ชันพรีวิว 1,000,000,000
Gemini 2.5 Flash TTS 4,000,000
Gemini 2.5 Flash-Lite 1,000,000,000
Gemini 2.5 Flash-Lite เวอร์ชันพรีวิว 1,000,000,000
Gemini 2.0 Flash 5,000,000,000
Gemini 2.0 Flash Image 1,000,000,000
Gemini 2.0 Flash-Lite 5,000,000,000
โมเดลการสร้างหลายโมดัล
Gemini 3.1 Flash Image เวอร์ชันพรีวิว 🍌 750,000,000
Gemini 3 Pro Image เวอร์ชันพรีวิว 🍌 1,000,000,000
โมเดลการฝัง
Gemini Embedding 10,000,000

วิธีอัปเกรดเป็นระดับถัดไป

หากต้องการเปลี่ยนจากระดับฟรีเป็นระดับที่ต้องชำระเงิน คุณต้อง ตั้งค่าการเรียกเก็บเงินใน AI Studio ก่อน

เมื่อโปรเจ็กต์มีคุณสมบัติตรงตามเกณฑ์ที่ระบุไว้ ระบบจะ อัปเกรดเป็นระดับถัดไปโดยอัตโนมัติ โดยปกติการอัปเกรดระดับจากระดับฟรีเป็นระดับที่ 1 จะมีผลทันที และการอัปเกรดระดับถัดไปจะมีผลภายใน 10 นาที ไปที่หน้าโปรเจ็กต์ใน AI Studio เพื่อตรวจสอบระดับของคุณ

ขอเพิ่มขีดจำกัดอัตรา

โมเดลแต่ละเวอร์ชันจะมีขีดจำกัดอัตรา (คำขอต่อนาที, RPM) ที่เชื่อมโยงอยู่ ดูรายละเอียดเกี่ยวกับขีดจำกัดอัตราเหล่านั้นได้ที่หน้า ขีดจำกัดอัตรา AI Studio

ขอเพิ่มขีดจำกัดอัตราของระดับที่ต้องชำระเงิน

เราไม่รับประกันว่าจะเพิ่มขีดจำกัดอัตราให้ได้ แต่จะพยายามตรวจสอบคำขอของคุณอย่างเต็มที่