ขีดจำกัดอัตรา

การจำกัดอัตราจะควบคุมจำนวนคำขอที่คุณส่งไปยัง Gemini API ได้ ภายในกรอบเวลาที่กำหนด ขีดจำกัดเหล่านี้ช่วยรักษาการใช้งานที่เป็นธรรม ป้องกันการละเมิด และช่วยรักษาประสิทธิภาพของระบบสำหรับผู้ใช้ทุกคน

วิธีการทำงานของขีดจำกัดอัตรา

โดยปกติแล้ว ระบบจะวัดขีดจำกัดอัตราใน 3 มิติ ดังนี้

  • คำขอต่อนาที (RPM)
  • โทเค็นต่อนาที (อินพุต) (TPM)
  • คำขอต่อวัน (RPD)

ระบบจะประเมินการใช้งานของคุณเทียบกับขีดจำกัดแต่ละรายการ และการใช้งานเกินขีดจำกัดใดก็ตามจะ ทําให้เกิดข้อผิดพลาดเกี่ยวกับอัตราการจำกัด เช่น หากขีดจำกัด RPM คือ 20 การส่งคำขอ 21 รายการภายใน 1 นาทีจะทำให้เกิดข้อผิดพลาด แม้ว่าคุณจะยังไม่เกินขีดจำกัด TPM หรือขีดจำกัดอื่นๆ ก็ตาม

ระบบจะใช้การจำกัดอัตราต่อโปรเจ็กต์ ไม่ใช่ต่อคีย์ API

โควต้าคำขอต่อวัน (RPD) จะรีเซ็ตตอนเที่ยงคืนตามเวลาแปซิฟิก

ขีดจำกัดจะแตกต่างกันไปตามโมเดลที่ใช้ และขีดจำกัดบางอย่างใช้ได้กับบางโมเดลเท่านั้น ตัวอย่างเช่น ระบบจะคำนวณรูปภาพต่อนาที (IPM) สำหรับโมเดลที่สร้างรูปภาพได้ (Imagen 3) เท่านั้น แต่ในเชิงแนวคิดแล้วจะคล้ายกับ TPM โมเดลอื่นๆ อาจมีขีดจำกัดโทเค็นต่อวัน (TPD)

โมเดลทดลองและโมเดลเวอร์ชันตัวอย่างจะมีขีดจำกัดอัตราที่เข้มงวดกว่า

ระดับการใช้งาน

โควต้าจะเชื่อมโยงกับระดับการใช้งานของโปรเจ็กต์ เมื่อการใช้งาน API และค่าใช้จ่ายเพิ่มขึ้น คุณจะมีตัวเลือกในการอัปเกรดเป็นระดับที่สูงขึ้นพร้อมขีดจำกัดอัตราที่เพิ่มขึ้น

การมีสิทธิ์สำหรับระดับที่ 2 และ 3 จะพิจารณาจากค่าใช้จ่ายสะสมทั้งหมด ในบริการของ Google Cloud (รวมถึงแต่ไม่จำกัดเพียง Gemini API) สำหรับ บัญชีการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์ของคุณ

ระดับ คุณสมบัติ
ฟรี ผู้ใช้ในประเทศที่มีสิทธิ์
ระดับ 1 บัญชีสำหรับการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์
ระดับ 2 การใช้จ่ายทั้งหมด: มากกว่า $250 และอย่างน้อย 30 วันนับตั้งแต่การชำระเงินสำเร็จ
ระดับ 3 การใช้จ่ายทั้งหมด: มากกว่า $1,000 และอย่างน้อย 30 วันนับตั้งแต่ชำระเงินสำเร็จ

เมื่อคุณขออัปเกรด ระบบป้องกันการละเมิดอัตโนมัติของเราจะทำการตรวจสอบเพิ่มเติม แม้ว่าการมีคุณสมบัติตรงตามเกณฑ์การมีสิทธิ์ที่ระบุไว้โดยทั่วไปจะเพียงพอต่อการอนุมัติ แต่ในบางกรณีที่พบได้ไม่บ่อยนัก คำขออัปเกรดอาจถูกปฏิเสธโดยอิงตามปัจจัยอื่นๆ ที่พบในกระบวนการตรวจสอบ

ระบบนี้ช่วยรักษาความปลอดภัยและความสมบูรณ์ของแพลตฟอร์ม Gemini API สำหรับผู้ใช้ทุกคน

ขีดจำกัดอัตรา API มาตรฐาน

ตารางต่อไปนี้แสดงขีดจํากัดอัตราสําหรับการเรียก Gemini API มาตรฐานทั้งหมด

รุ่นฟรี

รุ่น RPM TPM RPD
โมเดลข้อความออก
Gemini 2.5 Pro 5 250,000 100
Gemini 2.5 Flash 10 250,000 250
Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 10 250,000 250
Gemini 2.5 Flash-Lite 15 250,000 1,000
Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง) 15 250,000 1,000
Gemini 2.0 Flash 15 1,000,000 200
Gemini 2.0 Flash-Lite 30 1,000,000 200
Live API
Gemini 2.5 Flash Live 3 เซสชัน 1,000,000 *
Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) เสียงต้นฉบับ 1 ครั้ง 25,000 5
Gemini 2.5 Flash Experimental Native Audio Thinking 1 ครั้ง 10,000 5
Gemini 2.0 Flash Live 3 เซสชัน 1,000,000 *
โมเดลการสร้างแบบหลายโมดัล
TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 3 10,000 15
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง) 10 200,000 100
รุ่นอื่นๆ
Gemma 3 และ 3n 30 15,000 14,400
การฝัง Gemini 100 30,000 1,000
Gemini Robotics-ER 1.5 (เวอร์ชันตัวอย่าง) 10 250,000 250
โมเดลที่เลิกใช้งาน
Gemini 1.5 Flash (เลิกใช้งานแล้ว) 15 250,000 50
Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว) 15 250,000 50

ระดับ 1

รุ่น RPM TPM RPD โทเค็นที่จัดคิวแบบกลุ่ม
โมเดลข้อความออก
Gemini 2.5 Pro 150 2,000,000 10,000 5,000,000
Gemini 2.5 Flash 1,000 1,000,000 10,000 3,000,000
Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 1,000 1,000,000 10,000 3,000,000
Gemini 2.5 Flash-Lite 4,000 4,000,000 * 10,000,000
Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง) 4,000 4,000,000 * 10,000,000
Gemini 2.0 Flash 2,000 4,000,000 * 10,000,000
Gemini 2.0 Flash-Lite 4,000 4,000,000 * 10,000,000
Live API
Gemini 2.5 Flash Live 50 เซสชัน 4,000,000 * *
Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) เสียงต้นฉบับ 3 เซสชัน 50,000 50 *
Gemini 2.5 Flash Experimental Native Audio Thinking 1 ครั้ง 25,000 50 *
Gemini 2.0 Flash Live 50 เซสชัน 4,000,000 * *
โมเดลการสร้างแบบหลายโมดัล
TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 10 10,000 100 *
TTS ของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง) 10 10,000 50 *
ตัวอย่างรูปภาพ Gemini 2.5 Flash 500 500,000 2,000 *
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง) 1,000 1,000,000 10,000 *
Imagen 4 Standard/Fast 10 * 70 *
Imagen 4 Ultra 5 * 30 *
Imagen 3 20 * * *
Veo 3 2 * 10 *
Veo 3 Fast 2 * 10 *
Veo 2 2 * 50 *
รุ่นอื่นๆ
Gemma 3 และ 3n 30 15,000 14,400 *
การฝัง Gemini 3,000 1,000,000 * *
Gemini Robotics-ER 1.5 (เวอร์ชันตัวอย่าง) 300 1,000,000 10,000 *
โมเดลที่เลิกใช้งาน
Gemini 1.5 Flash (เลิกใช้งานแล้ว) 2,000 4,000,000 * *
Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว) 4,000 4,000,000 * *
Gemini 1.5 Pro (เลิกใช้งานแล้ว) 1,000 4,000,000 * *

ระดับ 2

รุ่น RPM TPM RPD โทเค็นที่จัดคิวแบบกลุ่ม
โมเดลข้อความออก
Gemini 2.5 Pro 1,000 5,000,000 50,000 500,000,000
Gemini 2.5 Flash 2,000 3,000,000 100,000 400,000,000
Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 2,000 3,000,000 100,000 400,000,000
Gemini 2.5 Flash-Lite 10,000 10,000,000 * 500,000,000
Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง) 10,000 10,000,000 * 500,000,000
Gemini 2.0 Flash 10,000 10,000,000 * 1,000,000,000
Gemini 2.0 Flash-Lite 20,000 10,000,000 * 1,000,000,000
Live API
Gemini 2.5 Flash Live 1,000 เซสชัน 10,000,000 * *
Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) เสียงต้นฉบับ 100 เซสชัน 1,000,000 * *
Gemini 2.5 Flash Experimental Native Audio Thinking 1 ครั้ง 25,000 50 *
Gemini 2.0 Flash Live 1,000 เซสชัน 10,000,000 * *
โมเดลการสร้างแบบหลายโมดัล
TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 1,000 100,000 10,000 *
TTS ของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง) 100 25,000 1,000 *
ตัวอย่างรูปภาพ Gemini 2.5 Flash 2,000 1,500,000 50,000 *
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง) 2,000 3,000,000 100,000 *
Imagen 4 Standard/Fast 15 * 1000 *
Imagen 4 Ultra 10 * 400 *
Imagen 3 20 * * *
Veo 3 4 * 50 *
Veo 3 Fast 4 * 50 *
Veo 2 2 * 50 *
รุ่นอื่นๆ
Gemma 3 และ 3n 30 15,000 14,400 *
การฝัง Gemini 5,000 5,000,000 * *
Gemini Robotics-ER 1.5 (เวอร์ชันตัวอย่าง) 400 3,000,000 100,000 *
โมเดลที่เลิกใช้งาน
Gemini 1.5 Flash (เลิกใช้งานแล้ว) 2,000 4,000,000 * *
Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว) 4,000 4,000,000 * *
Gemini 1.5 Pro (เลิกใช้งานแล้ว) 1,000 4,000,000 * *

ระดับ 3

รุ่น RPM TPM RPD โทเค็นที่จัดคิวแบบกลุ่ม
โมเดลข้อความออก
Gemini 2.5 Pro 2,000 8,000,000 * 1,000,000,000
Gemini 2.5 Flash 10,000 8,000,000 * 1,000,000,000
Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 10,000 8,000,000 * 1,000,000,000
Gemini 2.5 Flash-Lite 30,000 30,000,000 * 1,000,000,000
Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง) 30,000 30,000,000 * 1,000,000,000
Gemini 2.0 Flash 30,000 30,000,000 * 5,000,000,000
Gemini 2.0 Flash-Lite 30,000 30,000,000 * 5,000,000,000
Live API
Gemini 2.5 Flash Live 1,000 เซสชัน 10,000,000 * *
Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) เสียงต้นฉบับ 100 เซสชัน 1,000,000 * *
Gemini 2.5 Flash Experimental Native Audio Thinking 1 ครั้ง 25,000 50 *
Gemini 2.0 Flash Live 1,000 เซสชัน 10,000,000 * *
โมเดลการสร้างแบบหลายโมดัล
TTS ของ Gemini 2.5 Flash (เวอร์ชันตัวอย่าง) 1,000 1,000,000 * *
TTS ของ Gemini 2.5 Pro (เวอร์ชันตัวอย่าง) 100 1,000,000 * *
ตัวอย่างรูปภาพ Gemini 2.5 Flash 5,000 5,000,000 * *
การสร้างรูปภาพด้วย Gemini 2.0 Flash (เวอร์ชันตัวอย่าง) 5,000 5,000,000 * *
Imagen 4 Standard/Fast 20 * 15,000 *
Imagen 4 Ultra 15 * 5,000 *
Imagen 3 20 * * *
Veo 3 10 * 500 *
Veo 3 Fast 10 * 500 *
Veo 2 2 * 50 *
รุ่นอื่นๆ
Gemma 3 และ 3n 30 15,000 14,400 *
การฝัง Gemini 10,000 10,000,000 * *
Gemini Robotics-ER 1.5 (เวอร์ชันตัวอย่าง) 600 8,000,000 * *1,000,000,000*
โมเดลที่เลิกใช้งาน
Gemini 1.5 Flash (เลิกใช้งานแล้ว) 2,000 4,000,000 * *
Gemini 1.5 Flash-8B (เลิกใช้งานแล้ว) 4,000 4,000,000 * *
Gemini 1.5 Pro (เลิกใช้งานแล้ว) 1,000 4,000,000 * *

ระบบไม่รับประกันขีดจำกัดอัตราที่ระบุ และความจุจริงอาจแตกต่างกันไป

ขีดจำกัดอัตราของ Batch API

คำขอ Batch API จะขึ้นอยู่กับขีดจำกัดอัตราของตัวเอง ซึ่งแยกจากการเรียก API แบบไม่เป็นกลุ่ม

  • คำขอแบบกลุ่มพร้อมกัน: 100
  • ขีดจำกัดขนาดไฟล์อินพุต: 2 GB
  • ขีดจำกัดพื้นที่เก็บไฟล์: 20 GB
  • โทเค็นที่จัดคิวต่อโมเดล: คอลัมน์โทเค็นที่จัดคิวแบบกลุ่มในตาราง ขีดจํากัดอัตราจะแสดงจํานวนโทเค็นสูงสุดที่จัดคิวได้ สําหรับการประมวลผลแบบกลุ่มในงานแบบกลุ่มที่ใช้งานอยู่ทั้งหมดสําหรับโมเดลที่กําหนด ดูได้ในตารางขีดจำกัดอัตรา API มาตรฐาน

วิธีอัปเกรดเป็นระดับถัดไป

Gemini API ใช้การเรียกเก็บเงินใน Cloud สำหรับบริการเรียกเก็บเงินทั้งหมด หากต้องการเปลี่ยนจาก ระดับฟรีเป็นระดับแบบชำระเงิน คุณต้องเปิดใช้การเรียกเก็บเงินในระบบคลาวด์สำหรับโปรเจ็กต์ Google Cloud ก่อน

เมื่อโปรเจ็กต์เป็นไปตามเกณฑ์ที่ระบุแล้ว โปรเจ็กต์จะมีสิทธิ์ อัปเกรดเป็นระดับถัดไป หากต้องการขออัปเกรด ให้ทำตามขั้นตอนต่อไปนี้

หลังจากตรวจสอบอย่างรวดเร็วแล้ว ระบบจะอัปเกรดโปรเจ็กต์เป็นระดับถัดไป

ขอเพิ่มขีดจำกัดอัตรา

โมเดลแต่ละรูปแบบจะมีขีดจำกัดอัตรา (คำขอต่อนาที หรือ RPM) ที่เชื่อมโยงกัน ดูรายละเอียดเกี่ยวกับขีดจำกัดของอัตราการใช้งานดังกล่าวได้ที่โมเดล Gemini

ขอเพิ่มขีดจำกัดอัตราของระดับแบบชำระเงิน

เราไม่รับประกันว่าจะเพิ่มขีดจำกัดอัตราได้ แต่จะพยายามอย่างเต็มที่ เพื่อตรวจสอบคำขอของคุณ