ขีดจำกัดอัตรา

การจำกัดอัตราจะควบคุมจำนวนคำขอที่คุณส่งไปยัง Gemini API ได้ ภายในกรอบเวลาที่กำหนด ขีดจำกัดเหล่านี้ช่วยรักษาการใช้งานที่เป็นธรรม ป้องกันการละเมิด และช่วยรักษาประสิทธิภาพของระบบสำหรับผู้ใช้ทุกคน

ดูขีดจำกัดอัตราที่ใช้งานอยู่ใน AI Studio

วิธีการทำงานของขีดจำกัดอัตรา

โดยปกติแล้ว ระบบจะวัดขีดจำกัดอัตราใน 3 มิติ ดังนี้

  • คำขอต่อนาที (RPM)
  • โทเค็นต่อนาที (อินพุต) (TPM)
  • คำขอต่อวัน (RPD)

ระบบจะประเมินการใช้งานของคุณเทียบกับขีดจำกัดแต่ละรายการ และการใช้งานเกินขีดจำกัดใดก็ตามจะ ทําให้เกิดข้อผิดพลาดเกี่ยวกับอัตราการจำกัด เช่น หากขีดจำกัด RPM คือ 20 การส่งคำขอ 21 รายการภายใน 1 นาทีจะทำให้เกิดข้อผิดพลาด แม้ว่าคุณจะยังไม่เกินขีดจำกัด TPM หรือขีดจำกัดอื่นๆ ก็ตาม

ระบบจะใช้การจำกัดอัตราต่อโปรเจ็กต์ ไม่ใช่ต่อคีย์ API คำขอต่อวัน (RPD) โควต้าจะรีเซ็ตตอนเที่ยงคืนตามเวลาแปซิฟิก

ขีดจำกัดจะแตกต่างกันไปตามโมเดลที่ใช้ และขีดจำกัดบางอย่างจะใช้ได้กับโมเดลบางรุ่นเท่านั้น ตัวอย่างเช่น ระบบจะคำนวณรูปภาพต่อนาที (IPM) สำหรับโมเดลที่สร้างรูปภาพได้ (Nano Banana) เท่านั้น แต่ในเชิงแนวคิดแล้วจะคล้ายกับ TPM โมเดลอื่นๆ อาจมีขีดจำกัดโทเค็นต่อวัน (TPD)

โมเดลทดลองและโมเดลเวอร์ชันตัวอย่างจะมีขีดจำกัดอัตราที่เข้มงวดกว่า

ระดับการใช้งาน

ขีดจำกัดอัตราจะเชื่อมโยงกับระดับการใช้งานของโปรเจ็กต์ เมื่อการใช้งาน API และการใช้จ่ายเพิ่มขึ้น ระบบจะอัปเกรดคุณเป็นระดับที่สูงขึ้นโดยอัตโนมัติพร้อมกับการเพิ่มขีดจำกัดอัตราคำขอ

การมีสิทธิ์สำหรับระดับที่ 2 และ 3 จะพิจารณาจากค่าใช้จ่ายสะสมทั้งหมด ในบริการของ Google Cloud (รวมถึงแต่ไม่จำกัดเพียง Gemini API) สำหรับ บัญชีการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์ของคุณ

ระดับการใช้งาน คุณสมบัติ
ฟรี ลงชื่อสมัครใช้ (บัญชี Google)
ระดับ 1 เปิดใช้งานบัญชีสำหรับการเรียกเก็บเงิน
ระดับ 2 ชำระเงิน $100 ไปยังบัญชีสำหรับการเรียกเก็บเงิน และอย่างน้อย 3 วันนับตั้งแต่การชำระเงินครั้งแรกสำเร็จ
ระดับ 3 ชำระเงิน $1,000 สำหรับบัญชีสำหรับการเรียกเก็บเงิน และอย่างน้อย 30 วันนับตั้งแต่การชำระเงินครั้งแรกสำเร็จ

แม้ว่าโดยทั่วไปการมีคุณสมบัติตรงตามเกณฑ์การมีสิทธิ์ที่ระบุไว้จะเพียงพอต่อการอนุมัติ แต่ในบางกรณีที่พบได้ไม่บ่อยนัก คำขออัปเกรดอาจถูกปฏิเสธโดยอิงตามปัจจัยอื่นๆ ที่พบในกระบวนการตรวจสอบ

ระบบนี้ช่วยรักษาความปลอดภัยและความสมบูรณ์ของแพลตฟอร์ม Gemini API สำหรับผู้ใช้ทุกคน

ขีดจำกัดอัตราของ Gemini API

ขีดจำกัดอัตราขึ้นอยู่กับปัจจัยต่างๆ (เช่น ระดับโควต้า) และดูได้ใน Google AI Studio เมื่อระดับและสถานะบัญชีของคุณเปลี่ยนแปลงไป ระบบจะอัปเดตขีดจำกัดอัตราโดยอัตโนมัติ

ดูขีดจำกัดอัตราที่ใช้งานอยู่ใน AI Studio

ระบบไม่รับประกันขีดจำกัดอัตราที่ระบุ และความจุจริงอาจแตกต่างกันไป

ขีดจำกัดอัตราของ Batch API

คำขอ Batch API จะขึ้นอยู่กับขีดจำกัดอัตราของตัวเอง ซึ่งแยกจากการเรียก API แบบไม่เป็นกลุ่ม

  • คำขอแบบกลุ่มพร้อมกัน: 100
  • ขีดจำกัดขนาดไฟล์อินพุต: 2 GB
  • ขีดจำกัดพื้นที่เก็บข้อมูลไฟล์: 20 GB
  • โทเค็นที่จัดคิวต่อโมเดล: ตารางโทเค็นที่จัดคิวแบบกลุ่มจะแสดง จำนวนโทเค็นสูงสุดที่จัดคิวสำหรับการประมวลผลแบบกลุ่มได้ ในงานแบบกลุ่มที่ใช้งานอยู่ทั้งหมดสำหรับโมเดลที่กำหนด

ระดับ 1

รุ่น โทเค็นที่จัดคิวเป็นกลุ่ม
โมเดลข้อความออก
Gemini 3.1 Pro (เวอร์ชันตัวอย่าง) 5,000,000
Gemini 3.1 Flash-Lite (เวอร์ชันตัวอย่าง) 10,000,000
Gemini 3 Flash (เวอร์ชันตัวอย่าง) 3,000,000
Gemini 2.5 Pro 5,000,000
TTS ของ Gemini 2.5 Pro 25,000
Gemini 2.5 Flash 3,000,000
Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 3,000,000
เวอร์ชันตัวอย่างของรูปภาพ Gemini 2.5 Flash 3,000,000
TTS ของ Gemini 2.5 Flash 100,000
Gemini 2.5 Flash-Lite 10,000,000
Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง) 10,000,000
Gemini 2.0 Flash 10,000,000
รูปภาพ Gemini 2.0 Flash 3,000,000
Gemini 2.0 Flash-Lite 10,000,000
โมเดลการสร้างแบบหลายโมดัล
ตัวอย่างรูปภาพ Gemini 3.1 Flash 🍌 1,000,000
ตัวอย่างรูปภาพ Gemini 3 Pro 🍌 2,000,000
โมเดลการฝัง
การฝัง Gemini 500,000

ระดับ 2

รุ่น โทเค็นที่จัดคิวเป็นกลุ่ม
โมเดลข้อความออก
Gemini 3.1 Pro (เวอร์ชันตัวอย่าง) 500,000,000
Gemini 3.1 Flash-Lite (เวอร์ชันตัวอย่าง) 500,000,000
Gemini 3.1 Flash (เวอร์ชันตัวอย่าง) 400,000,000
Gemini 2.5 Pro 500,000,000
TTS ของ Gemini 2.5 Pro 100,000
Gemini 2.5 Flash 400,000,000
Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 400,000,000
เวอร์ชันตัวอย่างของรูปภาพ Gemini 2.5 Flash 400,000,000
TTS ของ Gemini 2.5 Flash 100,000
Gemini 2.5 Flash-Lite 500,000,000
Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง) 500,000,000
Gemini 2.0 Flash 1,000,000,000
รูปภาพ Gemini 2.0 Flash 400,000,000
Gemini 2.0 Flash-Lite 1,000,000,000
โมเดลการสร้างแบบหลายโมดัล
ตัวอย่างรูปภาพ Gemini 3.1 Flash 🍌 250,000,000
ตัวอย่างรูปภาพ Gemini 3 Pro 🍌 270,000,000
โมเดลการฝัง
การฝัง Gemini 5,000,000

ระดับ 3

รุ่น โทเค็นที่จัดคิวเป็นกลุ่ม
โมเดลข้อความออก
Gemini 3.1 Pro (เวอร์ชันตัวอย่าง) 1,000,000,000
Gemini 3.1 Flash-Lite (เวอร์ชันตัวอย่าง) 1,000,000,000
Gemini 3.1 Flash (เวอร์ชันตัวอย่าง) 1,000,000,000
Gemini 2.5 Pro 1,000,000,000
TTS ของ Gemini 2.5 Pro 1,000,000
Gemini 2.5 Flash 1,000,000,000
Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 1,000,000,000
เวอร์ชันตัวอย่างของรูปภาพ Gemini 2.5 Flash 1,000,000,000
TTS ของ Gemini 2.5 Flash 4,000,000
Gemini 2.5 Flash-Lite 1,000,000,000
Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง) 1,000,000,000
Gemini 2.0 Flash 5,000,000,000
รูปภาพ Gemini 2.0 Flash 1,000,000,000
Gemini 2.0 Flash-Lite 5,000,000,000
โมเดลการสร้างแบบหลายโมดัล
ตัวอย่างรูปภาพ Gemini 3.1 Flash 🍌 750,000,000
ตัวอย่างรูปภาพ Gemini 3 Pro 🍌 1,000,000,000
โมเดลการฝัง
การฝัง Gemini 10,000,000

วิธีอัปเกรดเป็นระดับถัดไป

หากต้องการเปลี่ยนจากระดับฟรีเป็นระดับแบบชำระเงิน คุณต้องตั้งค่าการเรียกเก็บเงินใน AI Studio ก่อน

เมื่อโปรเจ็กต์เป็นไปตามเกณฑ์ที่ระบุแล้ว ระบบจะอัปเกรดโปรเจ็กต์เป็นระดับถัดไปโดยอัตโนมัติ โดยปกติการอัปเกรดระดับจากฟรีเป็นระดับที่ 1 จะมีผลทันที และการอัปเกรดระดับต่อๆ ไปจะมีผลภายใน 10 นาที ไปที่หน้าโปรเจ็กต์ใน AI Studio เพื่อตรวจสอบระดับของคุณ

ขอเพิ่มขีดจำกัดอัตรา

โมเดลแต่ละรูปแบบจะมีขีดจำกัดอัตรา (คำขอต่อนาที หรือ RPM) ที่เชื่อมโยงกัน ดูรายละเอียดเกี่ยวกับขีดจำกัดอัตราดังกล่าวได้ที่หน้าขีดจำกัดอัตราของ AI Studio

ขอเพิ่มขีดจำกัดอัตราของระดับแบบชำระเงิน

เราไม่รับประกันว่าจะเพิ่มขีดจำกัดอัตราได้ แต่จะพยายามอย่างเต็มที่ เพื่อตรวจสอบคำขอของคุณ