ประกาศเปิดตัว Gemini 3.1 Pro เวอร์ชันตัวอย่าง ลองใช้ฟรีใน Google AI Studio

ขีดจำกัดอัตรา

การจำกัดอัตราจะควบคุมจำนวนคำขอที่คุณส่งไปยัง Gemini API ได้ ภายในกรอบเวลาที่กำหนด ขีดจำกัดเหล่านี้ช่วยรักษาการใช้งานที่เป็นธรรม ป้องกันการละเมิด และช่วยรักษาประสิทธิภาพของระบบสำหรับผู้ใช้ทุกคน

ดูขีดจำกัดอัตราที่ใช้งานอยู่ใน AI Studio

วิธีการทำงานของขีดจำกัดอัตรา

โดยปกติแล้ว ระบบจะวัดขีดจำกัดอัตราใน 3 มิติ ดังนี้

คำขอต่อนาที (RPM)
โทเค็นต่อนาที (อินพุต) (TPM)
คำขอต่อวัน (RPD)

ระบบจะประเมินการใช้งานของคุณเทียบกับขีดจํากัดแต่ละรายการ และการใช้งานเกินขีดจํากัดใดก็ตามจะ ทําให้เกิดข้อผิดพลาดเกี่ยวกับอัตราการจำกัด เช่น หากขีดจำกัด RPM คือ 20 การส่งคำขอ 21 รายการภายใน 1 นาทีจะทำให้เกิดข้อผิดพลาด แม้ว่าคุณจะยังไม่เกินขีดจำกัด TPM หรือขีดจำกัดอื่นๆ ก็ตาม

ระบบจะใช้การจำกัดอัตราต่อโปรเจ็กต์ ไม่ใช่ต่อคีย์ API คำขอต่อวัน (RPD) โควต้าจะรีเซ็ตตอนเที่ยงคืนตามเวลาแปซิฟิก

ขีดจำกัดจะแตกต่างกันไปตามโมเดลที่ใช้ และขีดจำกัดบางอย่างจะใช้ได้กับโมเดลบางรุ่นเท่านั้น เช่น ระบบจะคำนวณรูปภาพต่อนาที (IPM) สำหรับโมเดลที่สร้างรูปภาพได้ (Nano Banana) เท่านั้น แต่ในเชิงแนวคิดแล้วจะคล้ายกับ TPM โมเดลอื่นๆ อาจมีขีดจำกัดโทเค็นต่อวัน (TPD)

โมเดลทดลองและโมเดลเวอร์ชันตัวอย่างจะมีขีดจำกัดอัตราที่เข้มงวดกว่า

ระดับการใช้งาน

ขีดจำกัดอัตราจะเชื่อมโยงกับระดับการใช้งานของโปรเจ็กต์ เมื่อการใช้งาน API และการใช้จ่ายเพิ่มขึ้น คุณจะมีตัวเลือกในการอัปเกรดเป็นระดับที่สูงขึ้นพร้อมการจำกัดอัตราคำขอที่เพิ่มขึ้น

การมีสิทธิ์สำหรับระดับที่ 2 และ 3 จะพิจารณาจากค่าใช้จ่ายสะสมทั้งหมด ในบริการของ Google Cloud (รวมถึงแต่ไม่จำกัดเพียง Gemini API) สำหรับ บัญชีการเรียกเก็บเงินที่ลิงก์กับโปรเจ็กต์ของคุณ

ระดับ	คุณสมบัติ
ฟรี	ผู้ใช้ในประเทศที่มีสิทธิ์
ระดับ 1	บัญชีสำหรับการเรียกเก็บเงินที่ชำระเงินเต็มจำนวนที่ลิงก์กับโปรเจ็กต์
ระดับ 2	การใช้จ่ายทั้งหมด: มากกว่า $250 และอย่างน้อย 30 วันนับตั้งแต่ชำระเงินสำเร็จ
ระดับ 3	การใช้จ่ายทั้งหมด: มากกว่า $1,000 และอย่างน้อย 30 วันนับตั้งแต่การชำระเงินสำเร็จ

เมื่อคุณขออัปเกรด ระบบป้องกันการละเมิดอัตโนมัติของเราจะทำการตรวจสอบเพิ่มเติม แม้ว่าการมีคุณสมบัติตรงตามเกณฑ์การมีสิทธิ์ที่ระบุไว้โดยทั่วไปจะเพียงพอต่อการอนุมัติ แต่ในบางกรณีที่พบได้ไม่บ่อยนัก คำขออัปเกรดอาจถูกปฏิเสธโดยอิงตามปัจจัยอื่นๆ ที่พบในกระบวนการตรวจสอบ

ระบบนี้ช่วยรักษาความปลอดภัยและความสมบูรณ์ของแพลตฟอร์ม Gemini API สำหรับผู้ใช้ทุกคน

ขีดจำกัดอัตราของ Gemini API

ขีดจำกัดอัตราขึ้นอยู่กับปัจจัยต่างๆ (เช่น ระดับโควต้า) และดูได้ใน Google AI Studio เมื่อระดับและสถานะบัญชีเปลี่ยนแปลงไปตามกาลเวลา ระบบจะอัปเดต ขีดจำกัดอัตราโดยอัตโนมัติ

ดูขีดจำกัดอัตราที่ใช้งานอยู่ใน AI Studio

ระบบไม่รับประกันขีดจำกัดอัตราที่ระบุ และความจุจริงอาจแตกต่างกันไป

ขีดจำกัดอัตราของ Batch API

คำขอ Batch API จะขึ้นอยู่กับขีดจำกัดอัตราของตัวเอง ซึ่งแยกจากการเรียก API แบบไม่เป็นกลุ่ม

คำขอแบบกลุ่มพร้อมกัน: 100
ขีดจำกัดขนาดไฟล์อินพุต: 2 GB
ขีดจำกัดพื้นที่เก็บข้อมูลไฟล์: 20 GB
โทเค็นที่จัดคิวต่อโมเดล: ตารางโทเค็นที่จัดคิวแบบกลุ่มแสดง จำนวนโทเค็นสูงสุดที่จัดคิวสำหรับการประมวลผลแบบกลุ่มได้ ในงานแบบกลุ่มที่ใช้งานอยู่ทั้งหมดสำหรับโมเดลที่กำหนด

ระดับ 1

รุ่น	โทเค็นที่จัดคิวเป็นกลุ่ม
โมเดลข้อความออก
Gemini 3.1 Pro (เวอร์ชันตัวอย่าง)	5,000,000
Gemini 3 Pro เวอร์ชันตัวอย่าง	5,000,000
Gemini 3 Flash (เวอร์ชันตัวอย่าง)	3,000,000
Gemini 2.5 Pro	5,000,000
TTS ของ Gemini 2.5 Pro	25,000
Gemini 2.5 Flash	3,000,000
Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)	3,000,000
เวอร์ชันตัวอย่างของรูปภาพ Gemini 2.5 Flash	3,000,000
TTS ของ Gemini 2.5 Flash	100,000
Gemini 2.5 Flash-Lite	10,000,000
Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง)	10,000,000
Gemini 2.0 Flash	10,000,000
รูปภาพ Gemini 2.0 Flash	3,000,000
Gemini 2.0 Flash-Lite	10,000,000
โมเดลการสร้างแบบหลายโมดัล
ตัวอย่างรูปภาพ Gemini 3 Pro 🍌	2,000,000

ระดับ 2

รุ่น	โทเค็นที่จัดคิวเป็นกลุ่ม
โมเดลข้อความออก
Gemini 3.1 Pro (เวอร์ชันตัวอย่าง)	500,000,000
Gemini 3 Pro เวอร์ชันตัวอย่าง	500,000,000
Gemini 3 Flash (เวอร์ชันตัวอย่าง)	400,000,000
Gemini 2.5 Pro	500,000,000
TTS ของ Gemini 2.5 Pro	100,000
Gemini 2.5 Flash	400,000,000
Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)	400,000,000
เวอร์ชันตัวอย่างของรูปภาพ Gemini 2.5 Flash	400,000,000
TTS ของ Gemini 2.5 Flash	100,000
Gemini 2.5 Flash-Lite	500,000,000
Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง)	500,000,000
Gemini 2.0 Flash	1,000,000,000
รูปภาพ Gemini 2.0 Flash	400,000,000
Gemini 2.0 Flash-Lite	1,000,000,000
โมเดลการสร้างแบบหลายโมดัล
ตัวอย่างรูปภาพ Gemini 3 Pro 🍌	270,000,000

ระดับ 3

รุ่น	โทเค็นที่จัดคิวเป็นกลุ่ม
โมเดลข้อความออก
Gemini 3.1 Pro (เวอร์ชันตัวอย่าง)	1,000,000,000
Gemini 3 Pro เวอร์ชันตัวอย่าง	1,000,000,000
Gemini 3 Flash (เวอร์ชันตัวอย่าง)	1,000,000,000
Gemini 2.5 Pro	1,000,000,000
TTS ของ Gemini 2.5 Pro	1,000,000
Gemini 2.5 Flash	1,000,000,000
Gemini 2.5 Flash (เวอร์ชันตัวอย่าง)	1,000,000,000
เวอร์ชันตัวอย่างของรูปภาพ Gemini 2.5 Flash	1,000,000,000
TTS ของ Gemini 2.5 Flash	4,000,000
Gemini 2.5 Flash-Lite	1,000,000,000
Gemini 2.5 Flash-Lite (เวอร์ชันตัวอย่าง)	1,000,000,000
Gemini 2.0 Flash	5,000,000,000
รูปภาพ Gemini 2.0 Flash	1,000,000,000
Gemini 2.0 Flash-Lite	5,000,000,000
โมเดลการสร้างแบบหลายโมดัล
ตัวอย่างรูปภาพ Gemini 3 Pro 🍌	1,000,000,000

วิธีอัปเกรดเป็นระดับถัดไป

Gemini API ใช้การเรียกเก็บเงินใน Cloud สำหรับบริการเรียกเก็บเงินทั้งหมด หากต้องการเปลี่ยนจาก ระดับฟรีเป็นระดับแบบชำระเงิน คุณต้องเปิดใช้การเรียกเก็บเงินในระบบคลาวด์สำหรับโปรเจ็กต์ Google Cloud ก่อน

เมื่อโปรเจ็กต์มีคุณสมบัติตรงตามเกณฑ์ที่ระบุไว้ โปรเจ็กต์จะมีสิทธิ์ อัปเกรดเป็นระดับถัดไป หากต้องการขออัปเกรด ให้ทำตามขั้นตอนต่อไปนี้

ไปที่หน้าคีย์ API ใน AI Studio
ค้นหาโปรเจ็กต์ที่ต้องการอัปเกรด แล้วคลิก "อัปเกรด" ตัวเลือก "อัปเกรด" จะแสดงเฉพาะในโปรเจ็กต์ที่มีคุณสมบัติตรงตามการมีสิทธิ์สำหรับระดับถัดไป

หลังจากตรวจสอบอย่างรวดเร็วแล้ว ระบบจะอัปเกรดโปรเจ็กต์เป็นระดับถัดไป

ขอเพิ่มขีดจำกัดอัตรา

โมเดลแต่ละรูปแบบจะมีขีดจำกัดอัตรา (คำขอต่อนาที หรือ RPM) ที่เชื่อมโยงกัน ดูรายละเอียดเกี่ยวกับขีดจำกัดของอัตราการใช้งานดังกล่าวได้ที่โมเดล Gemini

ขอเพิ่มขีดจำกัดอัตราของระดับแบบชำระเงิน

เราไม่รับประกันว่าจะเพิ่มขีดจำกัดอัตราได้ แต่จะพยายามอย่างเต็มที่ เพื่อตรวจสอบคำขอของคุณ