ขีดจำกัดอัตรา

ขีดจำกัดอัตราจะควบคุมจำนวนคำขอที่คุณส่งไปยัง Gemini API ได้ภายในกรอบเวลาที่กำหนด ขีดจำกัดเหล่านี้ช่วยรักษาการใช้งานอย่างยุติธรรม ป้องกันการละเมิด และช่วยรักษาประสิทธิภาพของระบบสำหรับผู้ใช้ทุกคน

ดูขีดจำกัดอัตราที่ใช้งานอยู่ใน AI Studio

หลักการทำงานของขีดจำกัดอัตรา

โดยปกติแล้วขีดจำกัดอัตราจะวัดจาก 3 มิติ ได้แก่

  • คำขอต่อนาที (RPM)
  • โทเค็นต่อนาที (อินพุต) (TPM)
  • คำขอต่อวัน (RPD)

ระบบจะประเมินการใช้งานของคุณเทียบกับขีดจำกัดแต่ละรายการ และหากเกินขีดจำกัดใดรายการหนึ่ง ระบบจะแสดงข้อผิดพลาดเกี่ยวกับขีดจำกัดอัตรา ตัวอย่างเช่น หากขีดจำกัด RPM ของคุณคือ 20 การส่งคำขอ 21 รายการภายใน 1 นาทีจะทำให้เกิดข้อผิดพลาด แม้ว่าคุณจะยังไม่เกินขีดจำกัด TPM หรือขีดจำกัดอื่นๆ ก็ตาม

ระบบจะใช้ขีดจำกัดอัตราต่อโปรเจ็กต์ ไม่ใช่ต่อคีย์ API ระบบจะรีเซ็ตโควต้าคำขอต่อวัน (RPD) ตอนเที่ยงคืนตามเวลาเขตแปซิฟิก

ขีดจำกัดจะแตกต่างกันไปตามโมเดลที่ใช้ และขีดจำกัดบางรายการใช้ได้กับโมเดลบางรายการเท่านั้น ตัวอย่างเช่น ระบบจะคำนวณรูปภาพต่อนาที หรือ IPM สำหรับโมเดลที่สร้างรูปภาพได้ (Nano Banana) เท่านั้น แต่แนวคิดจะคล้ายกับ TPM โมเดลอื่นๆ อาจมีขีดจำกัดโทเค็นต่อวัน (TPD)

ขีดจำกัดอัตราสำหรับโมเดลทดลองและโมเดลเวอร์ชันพรีวิวจะเข้มงวดกว่า

ระดับการใช้งาน

ขีดจำกัดอัตราจะเชื่อมโยงกับระดับการใช้งานของโปรเจ็กต์ เมื่อการใช้งาน API และค่าใช้จ่ายเพิ่มขึ้น ระบบจะอัปเกรดคุณเป็นระดับที่สูงขึ้นโดยอัตโนมัติพร้อมขีดจำกัดอัตราที่เพิ่มขึ้น

คุณสมบัติสำหรับระดับ 2 และ 3 จะอิงตามค่าใช้จ่ายสะสมทั้งหมดสำหรับบริการของ Google Cloud (ซึ่งรวมถึงแต่ไม่จำกัดเพียง Gemini API) สำหรับบัญชีสำหรับการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์

ระดับการใช้งาน คุณสมบัติ ขีดจำกัดระดับการเรียกเก็บเงิน
ฟรี โปรเจ็กต์ที่ใช้งานอยู่ หรือช่วงทดลองใช้ฟรี ไม่มี
ระดับ 1 ตั้งค่าและลิงก์บัญชีสำหรับการเรียกเก็บเงินที่ใช้งานอยู่ $250
ระดับ 2 ชำระเงิน $100 ขึ้นไปและผ่านไป 3 วันนับจากวันที่ชำระเงินสำเร็จครั้งแรก $2,000
ระดับ 3 ชำระเงิน $1,000 ขึ้นไปและผ่านไป 30 วันนับจากวันที่ชำระเงินสำเร็จครั้งแรก $20,000 - $100,000+

แม้ว่าการเป็นไปตามเกณฑ์คุณสมบัติที่ระบุไว้จะเพียงพอต่อการอนุมัติโดยทั่วไป แต่ในบางกรณีที่พบได้ยาก ระบบอาจปฏิเสธคำขออัปเกรดโดยอิงตามปัจจัยอื่นๆ ที่ระบุไว้ในระหว่างกระบวนการตรวจสอบ

ระบบนี้ช่วยรักษาความปลอดภัยและความสมบูรณ์ของแพลตฟอร์ม Gemini API สำหรับผู้ใช้ทุกคน

ขีดจำกัดอัตรา Gemini API

ขีดจำกัดอัตราขึ้นอยู่กับปัจจัยหลายอย่าง (เช่น ระดับการใช้งาน) และดูได้ใน Google AI Studio เมื่อระดับและสถานะบัญชีของคุณเปลี่ยนแปลงไปตามกาลเวลา ขีดจำกัดอัตราจะอัปเดตโดยอัตโนมัติ

ดูขีดจำกัดอัตราที่ใช้งานอยู่ใน AI Studio

ระบบไม่รับประกันขีดจำกัดอัตราที่ระบุไว้ และความจุจริงอาจแตกต่างกันไป

ขีดจำกัดอัตราการอนุมานลำดับความสำคัญ

การใช้งานลำดับความสำคัญมีขีดจำกัดอัตราของตัวเอง แม้ว่าระบบจะนับการใช้งานรวมกับขีดจำกัดอัตราการรับส่งข้อมูลแบบโต้ตอบโดยรวมก็ตาม ขีดจำกัดอัตราเริ่มต้นคือ 0.3 เท่าของ ขีดจำกัดอัตรามาตรฐาน สำหรับโมเดลและระดับแต่ละรายการ

ขีดจำกัดอัตรา Batch API

คำขอ Batch API มีขีดจำกัดอัตราของตัวเอง ซึ่งแยกจากการเรียกใช้ API ที่ไม่ใช่แบบกลุ่ม

  • คำขอแบบกลุ่มพร้อมกัน: 100 รายการ
  • ขีดจำกัดขนาดไฟล์อินพุต: 2 GB
  • ขีดจำกัดพื้นที่เก็บข้อมูลไฟล์: 20 GB
  • โทเค็นที่เข้าคิวต่อโมเดล: ตารางโทเค็นที่เข้าคิวแบบกลุ่ม จะแสดงจำนวนโทเค็นสูงสุดที่เข้าคิวสำหรับการประมวลผลแบบกลุ่มในงานแบบกลุ่มที่ใช้งานอยู่ทั้งหมดสำหรับโมเดลที่กำหนด

ระดับ 1

โมเดล โทเค็นที่เข้าคิวแบบกลุ่ม
โมเดลข้อความออก
Gemini 3.1 Pro เวอร์ชันพรีวิว 5,000,000
Gemini 3.1 Flash-Lite 10,000,000
Gemini 3.1 Flash-Lite เวอร์ชันพรีวิว 10,000,000
Gemini 3 Flash เวอร์ชันพรีวิว 3,000,000
Gemini 2.5 Pro 5,000,000
Gemini 2.5 Pro TTS 25,000
Gemini 2.5 Flash 3,000,000
Gemini 2.5 Flash เวอร์ชันพรีวิว 3,000,000
Gemini 2.5 Flash Image เวอร์ชันพรีวิว 3,000,000
Gemini 2.5 Flash TTS 100,000
Gemini 2.5 Flash-Lite 10,000,000
Gemini 2.5 Flash-Lite เวอร์ชันพรีวิว 10,000,000
Gemini 2.0 Flash 10,000,000
Gemini 2.0 Flash Image 3,000,000
Gemini 2.0 Flash-Lite 10,000,000
โมเดลการสร้างหลายโมดัล
Gemini 3.1 Flash Image เวอร์ชันพรีวิว 🍌 1,000,000
Gemini 3 Pro Image เวอร์ชันพรีวิว 🍌 2,000,000
โมเดลการฝัง
Gemini Embedding 500,000

ระดับ 2

โมเดล โทเค็นที่เข้าคิวแบบกลุ่ม
โมเดลข้อความออก
Gemini 3.1 Pro เวอร์ชันพรีวิว 500,000,000
Gemini 3.1 Flash-Lite 500,000,000
Gemini 3.1 Flash-Lite เวอร์ชันพรีวิว 500,000,000
Gemini 3.1 Flash เวอร์ชันพรีวิว 400,000,000
Gemini 2.5 Pro 500,000,000
Gemini 2.5 Pro TTS 100,000
Gemini 2.5 Flash 400,000,000
Gemini 2.5 Flash เวอร์ชันพรีวิว 400,000,000
Gemini 2.5 Flash Image เวอร์ชันพรีวิว 400,000,000
Gemini 2.5 Flash TTS 100,000
Gemini 2.5 Flash-Lite 500,000,000
Gemini 2.5 Flash-Lite เวอร์ชันพรีวิว 500,000,000
Gemini 2.0 Flash 1,000,000,000
Gemini 2.0 Flash Image 400,000,000
Gemini 2.0 Flash-Lite 1,000,000,000
โมเดลการสร้างหลายโมดัล
Gemini 3.1 Flash Image เวอร์ชันพรีวิว 🍌 250,000,000
Gemini 3 Pro Image เวอร์ชันพรีวิว 🍌 270,000,000
โมเดลการฝัง
Gemini Embedding 5,000,000

ระดับ 3

โมเดล โทเค็นที่เข้าคิวแบบกลุ่ม
โมเดลข้อความออก
Gemini 3.1 Pro เวอร์ชันพรีวิว 1,000,000,000
Gemini 3.1 Flash-Lite 1,000,000,000
Gemini 3.1 Flash-Lite เวอร์ชันพรีวิว 1,000,000,000
Gemini 3.1 Flash เวอร์ชันพรีวิว 1,000,000,000
Gemini 2.5 Pro 1,000,000,000
Gemini 2.5 Pro TTS 1,000,000
Gemini 2.5 Flash 1,000,000,000
Gemini 2.5 Flash เวอร์ชันพรีวิว 1,000,000,000
Gemini 2.5 Flash Image เวอร์ชันพรีวิว 1,000,000,000
Gemini 2.5 Flash TTS 4,000,000
Gemini 2.5 Flash-Lite 1,000,000,000
Gemini 2.5 Flash-Lite เวอร์ชันพรีวิว 1,000,000,000
Gemini 2.0 Flash 5,000,000,000
Gemini 2.0 Flash Image 1,000,000,000
Gemini 2.0 Flash-Lite 5,000,000,000
โมเดลการสร้างหลายโมดัล
Gemini 3.1 Flash Image เวอร์ชันพรีวิว 🍌 750,000,000
Gemini 3 Pro Image เวอร์ชันพรีวิว 🍌 1,000,000,000
โมเดลการฝัง
Gemini Embedding 10,000,000

วิธีอัปเกรดเป็นระดับถัดไป

หากต้องการเปลี่ยนจากระดับฟรีเป็นระดับที่ต้องชำระเงิน คุณต้อง ตั้งค่าการเรียกเก็บเงินใน AI Studio ก่อน

เมื่อโปรเจ็กต์เป็นไปตามเกณฑ์ที่ระบุไว้ ระบบจะ อัปเกรดเป็นระดับถัดไปโดยอัตโนมัติ โดยปกติแล้วการอัปเกรดระดับจากระดับฟรีเป็นระดับ 1 จะมีผลทันที และการอัปเกรดระดับถัดไปจะมีผลภายใน 10 นาที ไปที่หน้าโปรเจ็กต์ใน AI Studio เพื่อตรวจสอบระดับของคุณ

ขอเพิ่มขีดจำกัดอัตรา

โมเดลแต่ละเวอร์ชันมีขีดจำกัดอัตรา (คำขอต่อนาที, RPM) ที่เกี่ยวข้อง ดูรายละเอียดเกี่ยวกับขีดจำกัดอัตราเหล่านั้นได้ที่หน้า ขีดจำกัดอัตรา AI Studio

ขอเพิ่มขีดจำกัดอัตราของระดับที่ต้องชำระเงิน

เราไม่รับประกันว่าจะเพิ่มขีดจำกัดอัตราให้ได้ แต่จะพยายามตรวจสอบคำขอของคุณอย่างเต็มที่