บริการฝังใน Gemini API จะสร้างการฝังที่ทันสมัย สำหรับคำ วลี และประโยค การฝังที่ได้จะนำมาใช้กับงาน NLP ได้ เช่น การค้นหาความหมาย การแยกประเภทข้อความ และการจับกลุ่ม และอื่นๆ อีกมากมาย หน้านี้จะอธิบายว่าการฝังคืออะไร และไฮไลต์กรณีการใช้งานที่สำคัญสำหรับบริการฝังเพื่อช่วยให้คุณเริ่มต้นใช้งานได้
การฝังคืออะไร
การฝังข้อความเป็นเทคนิคการประมวลผลภาษาธรรมชาติ (NLP) ที่แปลงข้อความเป็นเวกเตอร์ตัวเลข การฝังจะจับความหมายและบริบทที่มีความหมาย ซึ่งส่งผลให้ข้อความที่มีความหมายคล้ายกันมีการฝังที่ใกล้กว่า ตัวอย่างเช่น ประโยคที่ "ฉันพาสุนัขไปพบสัตวแพทย์" และ "ฉันพาแมวไปพบสัตวแพทย์" จะมีการฝังที่ใกล้ชิดกันในพื้นที่เวกเตอร์ เนื่องจากทั้งคู่อธิบายบริบทที่คล้ายกัน
สิ่งนี้มีความสำคัญเพราะปลดล็อกอัลกอริทึมหลายรายการที่ทำงานกับเวกเตอร์ได้ แต่ไม่ใช่บนข้อความโดยตรง
คุณสามารถใช้การฝังหรือเวกเตอร์เหล่านี้เพื่อเปรียบเทียบข้อความต่างๆ และ ทำความเข้าใจว่าข้อความมีความเกี่ยวข้องกันอย่างไร ตัวอย่างเช่น หากการฝังข้อความ "แมว" และ "สุนัข" อยู่ใกล้เคียงกัน คุณอาจอนุมานได้ว่าคำเหล่านี้มีความหมายหรือบริบทคล้ายกัน หรือทั้งคู่ ความสามารถนี้ช่วยให้สามารถใช้งานได้หลากหลายลักษณะตามที่อธิบายไว้ในส่วนถัดไป
Use Case
การฝังข้อความส่งเสริมกรณีการใช้งาน NLP ที่หลากหลาย เช่น
- การดึงข้อมูล: เป้าหมายคือการเรียกข้อความที่มีลักษณะคล้ายกันในเชิงความหมายจากข้อความอินพุต ระบบการดึงข้อมูลอาจรองรับแอปพลิเคชันที่หลากหลาย เช่น การค้นหาความหมาย การตอบคำถาม หรือการสรุป โปรดดูตัวอย่างในสมุดบันทึกการค้นหาเอกสาร
- การแยกประเภท: คุณสามารถใช้การฝังเพื่อฝึกโมเดลเพื่อจำแนกเอกสารเป็นหมวดหมู่ได้ ตัวอย่างเช่น หากต้องการจัดประเภทความคิดเห็นของผู้ใช้ว่าเป็นความคิดเห็นเชิงลบหรือบวก คุณสามารถใช้บริการการฝังเพื่อดูการแสดงเวกเตอร์ของความคิดเห็นแต่ละรายการเพื่อฝึกตัวแยกประเภท ดูรายละเอียดเพิ่มเติมได้ในตัวอย่างตัวแยกประเภท Gemini
- การจัดกลุ่ม: การเปรียบเทียบเวกเตอร์ของข้อความจะแสดงให้เห็นความคล้ายคลึงหรือแตกต่างกัน ฟีเจอร์นี้สามารถใช้ เพื่อฝึกโมเดลการจัดกลุ่มที่จัดกลุ่มข้อความหรือเอกสารที่คล้ายกันไว้ด้วยกัน และเพื่อตรวจจับความผิดปกติในข้อมูล
- Vector DB: คุณสามารถจัดเก็บการฝังที่สร้างขึ้นในฐานข้อมูลเวกเตอร์เพื่อปรับปรุงความแม่นยำและประสิทธิภาพของแอปพลิเคชัน NLP โปรดดูหน้านี้เพื่อเรียนรู้วิธีใช้ฐานข้อมูลเวกเตอร์เพื่อแปลพรอมต์ข้อความเป็นเวกเตอร์ตัวเลข
การฝังยางยืด
โมเดลการฝังข้อความ Gemini ที่ขึ้นต้นด้วย text-embedding-004
จะมีขนาดการฝังที่ยืดหยุ่นซึ่งต่ำกว่า 768 คุณสามารถใช้การฝังแบบยืดหยุ่นเพื่อสร้างขนาดเอาต์พุตที่เล็กลง และอาจประหยัดค่าใช้จ่ายในการประมวลผลและจัดเก็บข้อมูลโดยสูญเสียประสิทธิภาพไปเล็กน้อย
ขั้นตอนถัดไป
- หากพร้อมที่จะเริ่มต้นพัฒนาแล้ว คุณจะเห็นโค้ดที่เรียกใช้ได้ที่สมบูรณ์ในส่วนการเริ่มต้นอย่างรวดเร็วสำหรับ Python, Go, Node.js และ Dart (Flutter)