การแคชบริบท

ในเวิร์กโฟลว์ AI ทั่วไป คุณอาจส่งโทเค็นอินพุตเดียวกันซ้ำๆ ไปยังโมเดล Gemini API มีการแคชโดยนัยเพื่อเพิ่มประสิทธิภาพและลดค่าใช้จ่าย

การแคชโดยนัย

ระบบจะเปิดใช้การแคชโดยนัยโดยค่าเริ่มต้นสำหรับโมเดล Gemini 2.5 และรุ่นที่ใหม่กว่าทั้งหมด เราจะส่งต่อส่วนลดค่าใช้จ่ายโดยอัตโนมัติ หากคำขอของคุณตรงกับแคช คุณไม่จำเป็นต้องดำเนินการใดๆ เพื่อเปิดใช้ฟีเจอร์นี้ จำนวนโทเค็นอินพุตขั้นต่ำ สำหรับการแคชบริบทแสดงอยู่ในตารางต่อไปนี้สำหรับแต่ละโมเดล

รุ่น ขีดจำกัดโทเค็นขั้นต่ำ
Gemini 3 Flash (เวอร์ชันตัวอย่าง) 1024
Gemini 3 Pro เวอร์ชันตัวอย่าง 4096
Gemini 2.5 Flash 1024
Gemini 2.5 Pro 4096

วิธีเพิ่มโอกาสในการพบแคชโดยนัย

  • ลองใส่เนื้อหาขนาดใหญ่และเนื้อหาที่ใช้กันทั่วไปไว้ที่จุดเริ่มต้นของพรอมต์
  • ลองส่งคำขอที่มีคำนำหน้าที่คล้ายกันในช่วงเวลาสั้นๆ

คุณดูจำนวนโทเค็นที่แคชตรงกันได้ในฟิลด์ usage_metadata (Python) หรือ usageMetadata (JavaScript) ของออบเจ็กต์การตอบกลับ