Live API best practices

คู่มือนี้จะอธิบายแนวทางปฏิบัติแนะนำที่คุณทำตามได้เพื่อ เพิ่มประสิทธิภาพการใช้ Live API ดูภาพรวมและโค้ดตัวอย่างสำหรับ Use Case ที่พบบ่อยได้ที่หน้าเริ่มต้นใช้งาน Live API

ออกแบบวิธีการของระบบให้ชัดเจน

หากต้องการให้ Live API ทำงานได้อย่างมีประสิทธิภาพสูงสุด เราขอแนะนำให้คุณมี ชุดคำสั่งของระบบ (SI) ที่กำหนดไว้อย่างชัดเจนซึ่งกำหนดตัวตนของเอเจนต์ กฎการสนทนา และขอบเขตการใช้งานตามลำดับ

แยกเอเจนต์แต่ละรายเป็น SI ที่แตกต่างกันเพื่อให้ได้ผลลัพธ์ที่ดีที่สุด

  1. ระบุตัวตนของเอเจนต์: ระบุรายละเอียดเกี่ยวกับชื่อ บทบาท และ ลักษณะที่ต้องการของเอเจนต์ หากต้องการระบุสำเนียง ให้ตรวจสอบว่าได้ระบุภาษาเอาต์พุตที่ต้องการด้วย (เช่น สำเนียงอังกฤษสำหรับผู้พูดภาษาอังกฤษ)

  2. ระบุกฎการสนทนา: จัดเรียงกฎเหล่านี้ตามลำดับที่คุณคาดหวัง ให้โมเดลปฏิบัติตาม แยกแยะองค์ประกอบแบบครั้งเดียวของการสนทนา และลูปการสนทนา เช่น

    • องค์ประกอบแบบครั้งเดียว: รวบรวมรายละเอียดของลูกค้าเพียงครั้งเดียว (เช่น ชื่อ สถานที่ หมายเลขบัตรสะสมคะแนน)
    • การสนทนาแบบวนซ้ำ: ผู้ใช้สามารถพูดคุยเกี่ยวกับสินค้าแนะนำ ราคา การคืนสินค้า และการนำส่ง และอาจต้องการเปลี่ยนจากหัวข้อหนึ่งไปยังอีกหัวข้อหนึ่ง แจ้งให้โมเดลทราบว่าสามารถวนซ้ำการสนทนานี้ได้ตราบเท่าที่ผู้ใช้ต้องการ
  3. ระบุการเรียกใช้เครื่องมือภายในโฟลว์ในประโยคที่แตกต่างกัน: ตัวอย่างเช่น หากขั้นตอนแบบครั้งเดียวในการรวบรวมรายละเอียดของลูกค้าต้องเรียกใช้get_user_infoฟังก์ชัน คุณอาจพูดว่า ขั้นตอนแรกคือการรวบรวมข้อมูลผู้ใช้ ก่อนอื่น ขอให้ผู้ใช้ระบุชื่อ สถานที่ และหมายเลขบัตรสะสมคะแนน จากนั้น เรียกใช้ get_user_info พร้อมรายละเอียดต่อไปนี้

  4. เพิ่มแนวทางที่จำเป็น: ระบุแนวทางการสนทนาทั่วไปที่คุณไม่ต้องการให้โมเดลทำได้อย่างอิสระ โปรดระบุตัวอย่างที่เฉพาะเจาะจงหากเกิด x คุณต้องการให้โมเดลทำ y หากยังคงได้รับความแม่นยำในระดับที่ต้องการ ไม่ได้ ให้ใช้คำว่า อย่างชัดเจนเพื่อเป็นแนวทางให้โมเดลมีความแม่นยำ

กำหนดเครื่องมืออย่างแม่นยำ

เมื่อใช้เครื่องมือที่มี Live API ให้ระบุคำจำกัดความของเครื่องมืออย่างชัดเจน อย่าลืมบอก Gemini ว่าควรเรียกใช้การเรียกใช้เครื่องมือภายใต้เงื่อนไขใด ดูรายละเอียดเพิ่มเติมได้ที่คำจำกัดความของเครื่องมือในส่วนตัวอย่าง

สร้างพรอมต์ที่มีประสิทธิภาพ

  • ใช้พรอมต์ที่ชัดเจน: ระบุตัวอย่างสิ่งที่โมเดลควรและไม่ควรทำในพรอมต์ และพยายามจำกัดพรอมต์ให้เป็นพรอมต์เดียวต่อลักษณะตัวตนหรือบทบาทหนึ่งๆ ในแต่ละครั้ง ลองใช้การเชื่อมโยงพรอมต์แทนพรอมต์หลายหน้าที่มีความยาว โมเดลจะทำงานได้ดีที่สุดในงานที่มีการเรียกใช้ฟังก์ชันเดียว
  • ระบุคำสั่งและข้อมูลเริ่มต้น: Live API คาดหวัง อินพุตจากผู้ใช้ก่อนที่จะตอบกลับ หากต้องการให้ Live API เริ่มการสนทนา ให้ใส่พรอมต์ที่ขอให้ทักทายผู้ใช้หรือเริ่มการสนทนา รวมข้อมูลเกี่ยวกับผู้ใช้เพื่อให้ Live API ปรับคำทักทายให้เป็นแบบเฉพาะบุคคล

ระบุภาษา

เพื่อให้ได้ประสิทธิภาพสูงสุดใน Live API ที่เรียงซ้อนกัน gemini-live-2.5-flash โปรดตรวจสอบว่า language_code ของ API ตรงกับภาษาที่ผู้ใช้พูด

หากคาดหวังให้โมเดลตอบเป็นภาษาอื่นที่ไม่ใช่ภาษาอังกฤษ ให้ระบุข้อมูลต่อไปนี้เป็นส่วนหนึ่งของคำสั่งของระบบ

RESPOND IN {OUTPUT_LANGUAGE}. YOU MUST RESPOND UNMISTAKABLY IN {OUTPUT_LANGUAGE}.

สตรีมมิง

เมื่อใช้เสียงแบบเรียลไทม์ ให้ทำตามแนวทางปฏิบัติแนะนำต่อไปนี้

  • ขนาดกลุ่มและเวลาในการตอบสนอง: ส่งเสียงเป็นกลุ่มขนาด 20-40 มิลลิวินาที
  • การจัดการการขัดจังหวะ: เมื่อผู้ใช้พูดขณะที่โมเดลตอบกลับ เซิร์ฟเวอร์จะส่งข้อความ server_content พร้อม "interrupted": true คุณต้องทิ้งบัฟเฟอร์เสียงฝั่งไคลเอ็นต์ทันทีเพื่อป้องกันไม่ให้เอเจนต์ พูดแทรกผู้ใช้ต่อไป

การจัดการบริบท

ใช้ ContextWindowCompressionConfig สำหรับเซสชันที่ยาว เนื่องจากโทเค็นเสียงดั้งเดิมจะสะสมอย่างรวดเร็ว (ประมาณ 25 โทเค็นต่อวินาทีของเสียง)

การบัฟเฟอร์ฝั่งไคลเอ็นต์

อย่าบัฟเฟอร์เสียงอินพุตมากเกินไป (เช่น 1 วินาที) ก่อนส่ง ส่ง เป็นก้อนเล็กๆ (20-100 มิลลิวินาที) เพื่อลดเวลาในการตอบสนอง

การสุ่มตัวอย่างใหม่

ตรวจสอบว่าแอปพลิเคชันไคลเอ็นต์ของคุณสุ่มตัวอย่างอินพุตไมโครโฟน (มักจะเป็น 44.1kHz หรือ 48kHz) เป็น 16kHz ก่อนส่ง

การจัดการเซสชัน

ทำตามหลักเกณฑ์ต่อไปนี้เพื่อจัดการวงจรเซสชันและรับประกันประสบการณ์ของผู้ใช้ที่เชื่อถือได้

  • เปิดใช้การบีบอัดหน้าต่างบริบท: โทเค็นเสียงจะสะสมที่ประมาณ 25 โทเค็นต่อวินาที หากไม่มีการบีบอัด เซสชันเสียงอย่างเดียวจะจำกัดไว้ที่ 15 นาที และเซสชันเสียงและวิดีโอจะจำกัดไว้ที่ 2 นาที เปิดใช้ การบีบอัดหน้าต่างบริบท เพื่อขยายเซสชันให้มีระยะเวลาไม่จำกัด
  • ใช้การกลับมาทำงานต่อของเซสชัน: เซิร์ฟเวอร์อาจรีเซ็ตการเชื่อมต่อ WebSocket เป็นระยะ ใช้ การกลับมาใช้เซสชันต่อ เพื่อเชื่อมต่ออีกครั้งได้อย่างราบรื่นโดยไม่สูญเสียบริบท เก็บโทเค็นการกลับมาทำงานต่อล่าสุดจากข้อความ SessionResumptionUpdate และส่งเป็นแฮนเดิลเมื่อ เชื่อมต่ออีกครั้ง โทเค็นการดำเนินการต่อจะมีอายุ 2 ชั่วโมงหลังจากเซสชันสุดท้ายสิ้นสุดลง
  • จัดการข้อความ GoAway: เซิร์ฟเวอร์จะส่งข้อความ GoAway ก่อนที่จะสิ้นสุดการเชื่อมต่อ ฟังข้อความนี้และใช้ฟิลด์ timeLeft เพื่อปิดหรือเชื่อมต่อใหม่ก่อนที่การเชื่อมต่อจะปิด
  • จัดการสัญญาณ generationComplete: ใช้ข้อความ generationComplete เพื่อดูว่าเมื่อใดที่โมเดลสร้างคำตอบเสร็จแล้ว เพื่อให้แอปพลิเคชัน อัปเดต UI หรือดำเนินการต่อไปได้

ดูรายละเอียดการติดตั้งใช้งานได้ที่การจัดการเซสชัน

ตัวอย่าง

ตัวอย่างนี้รวมทั้งแนวทางปฏิบัติแนะนำและหลักเกณฑ์ในการออกแบบคำสั่งของระบบเพื่อ เป็นแนวทางในการทำงานของโมเดลในฐานะโค้ชด้านอาชีพ

**Persona:**
You are Laura, a career coach from Brooklyn, NY. You specialize in providing
data driven advice to give your clients a fresh perspective on the career
questions they're navigating. Your special sauce is providing quantitative,
data-driven insights to help clients think about their issues in a different
way. You leverage statistics, research, and psychology as much as possible.
You only speak to your clients in English, no matter what language they speak
to you in.

**Conversational Rules:**

1. **Introduce yourself:** Warmly greet the client.

2. **Intake:** Ask for your client's full name, date of birth, and state they're
calling in from. Call `create_client_profile` to create a new patient profile.

3. **Discuss the client's issue:** Get a sense of what the client wants to
cover in the session. DO NOT repeat what the client is saying back to them in
your response. Don't ask more than a few questions here.

4. **Reframe the client's issue with real data:** NO PLATITUDES. Start providing
data-driven insights for the client, but embed these as general facts within
conversation. This is what they're coming to you for: your unique thinking on
the subjects that are stressing them out. Show them a new way of thinking about
something. Let this step go on for as long as the client wants. As part of this,
if the client mentions wanting to take any actions, update
`add_action_items_to_profile` to remind the client later.

5. **Next appointment:** Call `get_next_appointment` to see if another
appointment has already been scheduled for the client. If so, then share the
date and time with the client and confirm if they'll be able to attend. If
there is no appointment, then call `get_available_appointments` to see openings.
Share the list of openings with the client and ask what they would prefer. Save
their preference with `schedule_appointment`. If the client prefers to schedule
offline, then let them know that's perfectly fine and to use the patient portal.

**General Guidelines:** You're meant to be a witty, snappy conversational
partner. Keep your responses short and progressively disclose more information
if the client requests it. Don't repeat back what the client says back to them.
Each response you give should be a net new addition to the conversation, not a
recap of what the client said. Be relatable by bringing in your own background 
growing up professionally in Brooklyn, NY. If a client tries to get you off
track, gently bring them back to the workflow articulated above.

**Guardrails:** If the client is being hard on themselves, never encourage that.
Remember that your ultimate goal is to create a supportive environment for your
clients to thrive.

คำจำกัดความของเครื่องมือ

JSON นี้กำหนดฟังก์ชันที่เกี่ยวข้องซึ่งเรียกใช้ในตัวอย่างโค้ชด้านอาชีพ หากต้องการผลลัพธ์ที่ดีที่สุดเมื่อกำหนดฟังก์ชัน ให้ระบุชื่อ คำอธิบาย พารามิเตอร์ และเงื่อนไขการเรียกใช้

[
 {
   "name": "create_client_profile",
   "description": "Creates a new client profile with their personal details. Returns a unique client ID. \n**Invocation Condition:** Invoke this tool *only after* the client has provided their full name, date of birth, AND state. This should only be called once at the beginning of the 'Intake' step.",
   "parameters": {
     "type": "object",
     "properties": {
       "full_name": {
         "type": "string",
         "description": "The client's full name."
       },
       "date_of_birth": {
         "type": "string",
         "description": "The client's date of birth in YYYY-MM-DD format."
       },
       "state": {
         "type": "string",
         "description": "The 2-letter postal abbreviation for the client's state (e.g., 'NY', 'CA')."
       }
     },
     "required": ["full_name", "date_of_birth", "state"]
   }
 },
 {
   "name": "add_action_items_to_profile",
   "description": "Adds a list of actionable next steps to a client's profile using their client ID. \n**Invocation Condition:** Invoke this tool *only after* a list of actionable next steps has been discussed and agreed upon with the client during the 'Actions' step. Requires the `client_id` obtained from the start of the session.",
   "parameters": {
     "type": "object",
     "properties": {
       "client_id": {
         "type": "string",
         "description": "The unique ID of the client, obtained from create_client_profile."
       },
       "action_items": {
         "type": "array",
         "items": {
           "type": "string"
         },
         "description": "A list of action items for the client (e.g., ['Update resume', 'Research three companies'])."
       }
     },
     "required": ["client_id", "action_items"]
   }
 },
 {
   "name": "get_next_appointment",
   "description": "Checks if a client has a future appointment already scheduled using their client ID. Returns the appointment details or null. \n**Invocation Condition:** Invoke this tool at the *start* of the 'Next Appointment' workflow step, immediately after the 'Actions' step is complete. This is used to check if an appointment *already exists*.",
   "parameters": {
     "type": "object",
     "properties": {
       "client_id": {
         "type": "string",
         "description": "The unique ID of the client."
       }
     },
     "required": ["client_id"]
   }
 },
 {
   "name": "get_available_appointments",
   "description": "Fetches a list of the next available appointment slots. \n**Invocation Condition:** Invoke this tool *only if* the `get_next_appointment` tool was called and it returned `null` (or an empty response), indicating no future appointment is scheduled.",
   "parameters": {
     "type": "object",
     "properties": {}
   }
 },
 {
   "name": "schedule_appointment",
   "description": "Books a new appointment for a client at a specific date and time. \n**Invocation Condition:** Invoke this tool *only after* `get_available_appointments` has been called, a list of openings has been presented to the client, and the client has *explicitly confirmed* which specific date and time they want to book.",
   "parameters": {
     "type": "object",
     "properties": {
       "client_id": {
         "type": "string",
         "description": "The unique ID of the client."
       },
       "appointment_datetime": {
         "type": "string",
         "description": "The chosen appointment slot in ISO 8601 format (e.g., '2025-10-30T14:30:00')."
       }
     },
     "required": ["client_id", "appointment_datetime"]
   }
 }
]