การแคชบริบท

ในเวิร์กโฟลว์ AI ทั่วไป คุณอาจส่งโทเค็นอินพุตเดียวกันซ้ำๆ ไปยังโมเดล Gemini API มีการแคชโดยนัยเพื่อเพิ่มประสิทธิภาพและลดต้นทุน

การแคชโดยนัย

ระบบจะเปิดใช้การแคชโดยนัยโดยค่าเริ่มต้นสำหรับโมเดล Gemini 2.5 และรุ่นใหม่กว่าทั้งหมด เราจะส่งต่อส่วนลดค่าใช้จ่ายโดยอัตโนมัติ หากคำขอของคุณเข้าถึงแคช คุณไม่จำเป็นต้องดำเนินการใดๆ เพื่อเปิดใช้ฟีเจอร์นี้ จำนวนโทเค็นอินพุตขั้นต่ำ สำหรับการแคชบริบทแสดงอยู่ในตารางต่อไปนี้สำหรับแต่ละโมเดล

รุ่น ขีดจำกัดโทเค็นขั้นต่ำ
Gemini 3.5 Flash 4096
เวอร์ชันตัวอย่างของ Gemini 3.1 Pro 4096
Gemini 2.5 Flash 2048
Gemini 2.5 Pro 2048

วิธีเพิ่มโอกาสในการพบแคชโดยนัย

  • ลองวางเนื้อหาขนาดใหญ่และเนื้อหาทั่วไปไว้ที่จุดเริ่มต้นของพรอมต์
  • ลองส่งคำขอที่มีคำนำหน้าที่คล้ายกันในช่วงเวลาสั้นๆ

คุณดูจำนวนโทเค็นที่แคชตรงกันได้ในฟิลด์ usage_metadata (Python) หรือ usageMetadata (JavaScript) ของออบเจ็กต์การตอบกลับ