ตอนนี้ Interactions API พร้อมให้บริการแก่ผู้ใช้ทั่วไปแล้ว เราขอแนะนำให้ใช้ API นี้เพื่อเข้าถึงฟีเจอร์และโมเดลล่าสุดทั้งหมด

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

ขีดจำกัดอัตรา

การจำกัดอัตราจะควบคุมจำนวนคำขอที่คุณส่งไปยัง Gemini API ได้ ภายในกรอบเวลาที่กำหนด ขีดจำกัดเหล่านี้ช่วยรักษาการใช้งานที่เป็นธรรม ป้องกันการละเมิด และช่วยรักษาประสิทธิภาพของระบบสำหรับผู้ใช้ทุกคน

ดูขีดจำกัดอัตราที่ใช้งานอยู่ใน AI Studio

วิธีการทำงานของขีดจำกัดอัตรา

โดยปกติแล้ว ระบบจะวัดขีดจำกัดอัตราใน 3 มิติ ดังนี้

คำขอต่อนาที (RPM)
โทเค็นต่อนาที (อินพุต) (TPM)
คำขอต่อวัน (RPD)

ระบบจะประเมินการใช้งานของคุณเทียบกับขีดจำกัดแต่ละรายการ และการใช้งานเกินขีดจำกัดใดก็ตามจะ ทําให้เกิดข้อผิดพลาดเกี่ยวกับอัตราการจำกัด เช่น หากขีดจำกัด RPM คือ 20 การส่งคำขอ 21 รายการภายใน 1 นาทีจะทำให้เกิดข้อผิดพลาด แม้ว่าคุณจะยังไม่เกินขีดจำกัด TPM หรือขีดจำกัดอื่นๆ ก็ตาม

ระบบจะใช้การจำกัดอัตราต่อโปรเจ็กต์ ไม่ใช่ต่อคีย์ API โควต้าคำขอต่อวัน (RPD) จะรีเซ็ตตอนเที่ยงคืนตามเวลาแปซิฟิก

ขีดจำกัดจะแตกต่างกันไปตามโมเดลที่ใช้ และขีดจำกัดบางอย่างจะใช้ได้กับโมเดลบางรุ่นเท่านั้น เช่น ระบบจะคำนวณรูปภาพต่อนาที (IPM) สำหรับโมเดลที่สร้างรูปภาพได้ (Nano Banana) เท่านั้น แต่ในเชิงแนวคิดแล้วจะคล้ายกับ TPM โมเดลอื่นๆ อาจมีขีดจำกัดโทเค็นต่อวัน (TPD)

โมเดลทดลองและโมเดลเวอร์ชันตัวอย่างจะมีขีดจำกัดอัตราที่เข้มงวดกว่า

ขีดจำกัดอัตราตามการใช้จ่าย

นอกเหนือจากขีดจำกัดคำขอต่อนาที (RPM) และโทเค็นต่อนาที (TPM) แล้ว Gemini API ยังบังคับใช้ขีดจำกัดอัตราตามการใช้จ่ายเพื่อป้องกันค่าใช้จ่ายที่ไม่คาดคิด การที่ขีดจำกัดเหล่านี้จะมีผลกับบัญชีของคุณหรือไม่นั้นขึ้นอยู่กับประวัติการเรียกเก็บเงินและระดับการใช้งาน

ตารางต่อไปนี้แสดงขีดจํากัดอัตราตามการใช้จ่ายสําหรับแต่ละระดับการใช้งาน ระบบจะประเมินขีดจำกัดเหล่านี้ในกรอบเวลา 10 นาที แบบต่อเนื่อง การใช้ขีดจำกัดเหล่านี้กับบัญชีของคุณจะขึ้นอยู่กับประวัติการเรียกเก็บเงินและสถานะบัญชี

ระดับการใช้งาน	ขีดจำกัดอัตราการใช้จ่าย (ต่อ 10 นาที)
ฟรี	ไม่มี
ระดับที่ 1	$10
ระดับ 2	$200
ระดับ 3	$200

หากถึงขีดจำกัดอัตราตามการใช้จ่าย API จะแสดง429 RESOURCE_EXHAUSTED ข้อผิดพลาด วิธีแก้ไขปัญหามีดังนี้

รอแล้วลองอีกครั้งหลังจากผ่านไปสักครู่
ลดอัตราคำขอที่มีค่าใช้จ่ายสูง เช่น โดยใช้หน้าต่างบริบทที่เล็กลงหรือเอาต์พุตที่สั้นลง
หากคุณพบว่ามีการใช้งานเกินขีดจำกัดนี้อย่างสม่ำเสมอในระหว่างการใช้งานปกติ ขอเพิ่มขีดจำกัดอัตรา

ระดับการใช้งาน

ขีดจำกัดอัตราจะเชื่อมโยงกับระดับการใช้งานของโปรเจ็กต์ เมื่อการใช้งาน API และการใช้จ่ายเพิ่มขึ้น ระบบจะอัปเกรดคุณเป็นระดับที่สูงขึ้นโดยอัตโนมัติพร้อมกับการเพิ่มขีดจำกัดอัตราคำขอ

การมีสิทธิ์สำหรับระดับที่ 2 และ 3 จะพิจารณาจากค่าใช้จ่ายสะสมทั้งหมดในบริการของ Google Cloud (ซึ่งรวมถึงแต่ไม่จำกัดเพียง Gemini API) สำหรับบัญชีสำหรับการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์ของคุณ

ระดับการใช้งาน	รอบคัดเลือก	การจำกัดระดับการเรียกเก็บเงิน
ฟรี	โปรเจ็กต์ที่ใช้งานอยู่หรือช่วงทดลองใช้ฟรี	ไม่มี
ระดับที่ 1	ตั้งค่าและลิงก์บัญชีสำหรับการเรียกเก็บเงินที่ใช้งานอยู่	$250
ระดับ 2	ชำระเงิน $100 + 3 วันนับจากการชำระเงินครั้งแรกสำเร็จ	$2,000
ระดับ 3	ชำระเงิน $1,000 + 30 วันนับจากการชำระเงินครั้งแรกสำเร็จ	$20,000 - $100,000 ขึ้นไป

แม้ว่าการมีคุณสมบัติตรงตามเกณฑ์ที่ระบุโดยทั่วไปจะเพียงพอต่อการอนุมัติ แต่ในบางกรณีที่พบได้ไม่บ่อยนัก คำขออัปเกรดอาจถูกปฏิเสธโดยอิงตามปัจจัยอื่นๆ ที่พบในกระบวนการตรวจสอบ

ระบบนี้ช่วยรักษาความปลอดภัยและความสมบูรณ์ของแพลตฟอร์ม Gemini API สำหรับผู้ใช้ทุกคน

ขีดจำกัดอัตราของ Gemini API

ขีดจำกัดอัตราการใช้งานขึ้นอยู่กับปัจจัยหลายประการ (เช่น ระดับการใช้งานของคุณ) และดูได้ใน Google AI Studio เมื่อระดับและสถานะบัญชีของคุณเปลี่ยนแปลงไปเมื่อเวลาผ่านไป ระบบจะอัปเดตขีดจำกัดอัตราโดยอัตโนมัติ

ดูขีดจำกัดอัตราที่ใช้งานอยู่ใน AI Studio

ระบบไม่รับประกันขีดจำกัดอัตราที่ระบุ และความจุจริงอาจแตกต่างกันไป

ขีดจำกัดอัตราคำขอการอนุมานที่มีลำดับความสำคัญ

การใช้ลำดับความสำคัญจะมีการจำกัดอัตราของตัวเอง แม้ว่าระบบจะนับการใช้รวมในการจำกัดอัตราการเข้าชมแบบอินเทอร์แอกทีฟโดยรวม ก็ตาม ขีดจำกัดอัตราเริ่มต้นคือ 0.3 เท่าของขีดจำกัดอัตรามาตรฐานสำหรับแต่ละโมเดลและแต่ละระดับ

ขีดจำกัดอัตราของ Batch API

คำขอ Batch API จะขึ้นอยู่กับขีดจำกัดอัตราของตัวเอง ซึ่งแยกจากการเรียก API แบบไม่เป็นกลุ่ม

คำขอแบบกลุ่มพร้อมกัน: 100
ขีดจำกัดขนาดไฟล์อินพุต: 2 GB
ขีดจำกัดพื้นที่เก็บข้อมูลไฟล์: 20 GB
โทเค็นที่เข้าคิวต่อโมเดล: ตารางโทเค็นที่เข้าคิวแบบกลุ่มแสดง จำนวนโทเค็นสูงสุดที่เข้าคิวสำหรับการประมวลผลแบบกลุ่มได้ ในงานแบบกลุ่มที่ใช้งานอยู่ทั้งหมดสำหรับโมเดลที่กำหนด

ระดับ 1

รุ่น	โทเค็นที่จัดคิวเป็นกลุ่ม
โมเดลข้อความออก
เวอร์ชันตัวอย่างของ Gemini 3.1 Pro	5,000,000
Gemini 3.1 Flash-Lite	10,000,000
Gemini 3.1 Flash-Lite (เวอร์ชันตัวอย่าง)	10,000,000
Gemini 3.5 Flash	3,000,000
Gemini 3.5 Flash	3,000,000
Gemini 2.5 Pro	5,000,000
TTS ของ Gemini 2.5 Pro	25,000
Gemini 2.5 Flash	3,000,000
Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)	3,000,000
เวอร์ชันตัวอย่างของรูปภาพ Gemini 2.5 Flash	3,000,000
TTS ของ Gemini 2.5 Flash	100,000
Gemini 2.5 Flash-Lite	10,000,000
Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง)	10,000,000
Gemini 2.0 Flash	10,000,000
รูปภาพ Gemini 2.0 Flash	3,000,000
Gemini 2.0 Flash-Lite	10,000,000
โมเดลการสร้างแบบหลายโมดัล
ตัวอย่างรูปภาพ Gemini 3.1 Flash 🍌	1,000,000
ตัวอย่างรูปภาพ Gemini 3 Pro 🍌	2,000,000
โมเดลการฝัง
การฝัง Gemini	500,000

ระดับ 2

รุ่น	โทเค็นที่จัดคิวเป็นกลุ่ม
โมเดลข้อความออก
เวอร์ชันตัวอย่างของ Gemini 3.1 Pro	500,000,000
Gemini 3.1 Flash-Lite	500,000,000
Gemini 3.1 Flash-Lite (เวอร์ชันตัวอย่าง)	500,000,000
Gemini 3.5 Flash	400,000,000
Gemini 3.5 Flash	400,000,000
Gemini 2.5 Pro	500,000,000
TTS ของ Gemini 2.5 Pro	100,000
Gemini 2.5 Flash	400,000,000
Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)	400,000,000
เวอร์ชันตัวอย่างของรูปภาพ Gemini 2.5 Flash	400,000,000
TTS ของ Gemini 2.5 Flash	100,000
Gemini 2.5 Flash-Lite	500,000,000
Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง)	500,000,000
Gemini 2.0 Flash	1,000,000,000
รูปภาพ Gemini 2.0 Flash	400,000,000
Gemini 2.0 Flash-Lite	1,000,000,000
โมเดลการสร้างแบบหลายโมดัล
ตัวอย่างรูปภาพ Gemini 3.1 Flash 🍌	250,000,000
ตัวอย่างรูปภาพ Gemini 3 Pro 🍌	270,000,000
โมเดลการฝัง
การฝัง Gemini	5,000,000

ระดับ 3

รุ่น	โทเค็นที่จัดคิวเป็นกลุ่ม
โมเดลข้อความออก
เวอร์ชันตัวอย่างของ Gemini 3.1 Pro	1,000,000,000
Gemini 3.1 Flash-Lite	1,000,000,000
Gemini 3.1 Flash-Lite (เวอร์ชันตัวอย่าง)	1,000,000,000
Gemini 3.5 Flash	1,000,000,000
Gemini 3.5 Flash	1,000,000,000
Gemini 2.5 Pro	1,000,000,000
TTS ของ Gemini 2.5 Pro	1,000,000
Gemini 2.5 Flash	1,000,000,000
Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)	1,000,000,000
เวอร์ชันตัวอย่างของรูปภาพ Gemini 2.5 Flash	1,000,000,000
TTS ของ Gemini 2.5 Flash	4,000,000
Gemini 2.5 Flash-Lite	1,000,000,000
Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง)	1,000,000,000
Gemini 2.0 Flash	5,000,000,000
รูปภาพ Gemini 2.0 Flash	1,000,000,000
Gemini 2.0 Flash-Lite	5,000,000,000
โมเดลการสร้างแบบหลายโมดัล
ตัวอย่างรูปภาพ Gemini 3.1 Flash 🍌	750,000,000
ตัวอย่างรูปภาพ Gemini 3 Pro 🍌	1,000,000,000
โมเดลการฝัง
การฝัง Gemini	10,000,000

วิธีอัปเกรดเป็นระดับถัดไป

หากต้องการเปลี่ยนจากระดับฟรีเป็นระดับแบบชำระเงิน คุณต้องตั้งค่าการเรียกเก็บเงินใน AI Studio ก่อน

เมื่อโปรเจ็กต์เป็นไปตามเกณฑ์ที่ระบุแล้ว ระบบจะอัปเกรดโปรเจ็กต์เป็นระดับถัดไปโดยอัตโนมัติ โดยปกติการอัปเกรดระดับจากฟรีเป็นระดับ 1 จะมีผลทันที และการอัปเกรดระดับต่อๆ ไปจะมีผลภายใน 10 นาที ไปที่หน้าโปรเจ็กต์ใน AI Studio เพื่อตรวจสอบระดับของคุณ

ขอเพิ่มอัตราการจำกัด

โมเดลแต่ละรูปแบบจะมีขีดจำกัดอัตรา (คำขอต่อนาที หรือ RPM) ที่เชื่อมโยงกัน ดูรายละเอียดเกี่ยวกับขีดจำกัดอัตราดังกล่าวได้ที่หน้าขีดจำกัดอัตราของ AI Studio

ขอเพิ่มขีดจำกัดอัตราของระดับแบบชำระเงิน

เราไม่รับประกันว่าจะเพิ่มขีดจำกัดอัตราได้ แต่จะพยายามอย่างเต็มที่ เพื่อตรวจสอบคำขอของคุณ