ตอนนี้ Interactions API พร้อมให้บริการแก่ผู้ใช้ทั่วไปแล้ว เราขอแนะนำให้ใช้ API นี้เพื่อเข้าถึงฟีเจอร์และโมเดลล่าสุดทั้งหมด

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

การแคชบริบท

ในเวิร์กโฟลว์ AI ทั่วไป คุณอาจส่งโทเค็นอินพุตเดียวกันซ้ำๆ ไปยังโมเดล Gemini API มีการแคชโดยนัยเพื่อเพิ่มประสิทธิภาพและลดต้นทุน

การแคชโดยนัย

ระบบจะเปิดใช้การแคชโดยนัยโดยค่าเริ่มต้นสำหรับโมเดล Gemini 2.5 และรุ่นใหม่กว่าทั้งหมด โดยรองรับทั้งโหมดการสนทนาแบบมีสถานะ (ใช้ previous_interaction_id) และไม่มีสถานะ เราจะส่งต่อส่วนลดค่าใช้จ่ายโดยอัตโนมัติหากคำขอของคุณเข้าถึงแคช คุณไม่จำเป็นต้องดำเนินการใดๆ เพื่อเปิดใช้ฟีเจอร์นี้ จำนวนโทเค็นอินพุตขั้นต่ำ สำหรับการแคชบริบทแสดงอยู่ในตารางต่อไปนี้สำหรับแต่ละโมเดล

รุ่น	ขีดจำกัดโทเค็นขั้นต่ำ
Gemini 3.5 Flash	4096
เวอร์ชันตัวอย่างของ Gemini 3.1 Pro	4096
Gemini 2.5 Flash	2048
Gemini 2.5 Pro	2048

วิธีเพิ่มโอกาสในการเข้าถึงแคชโดยนัย

ลองวางเนื้อหาขนาดใหญ่และเนื้อหาที่ใช้กันทั่วไปไว้ที่จุดเริ่มต้นของพรอมต์
ลองส่งคำขอที่มีคำนำหน้าที่คล้ายกันในระยะเวลาอันสั้น

คุณดูจำนวนโทเค็นที่แคชตรงได้ในฟิลด์ usage.total_cached_tokens (Python และ JavaScript) ของออบเจ็กต์การตอบกลับ