AI Edge RAG SDK มีคอมโพเนนต์พื้นฐานในการสร้างไปป์ไลน์การดึงข้อมูลเพื่อการสร้างที่เพิ่มประสิทธิภาพ (RAG) ด้วย LLM Inference API ไปป์ไลน์ RAG ให้สิทธิ์ LLM เข้าถึงข้อมูลที่ได้จากผู้ใช้ ซึ่งอาจรวมถึงข้อมูลที่อัปเดต ข้อมูลที่ละเอียดอ่อน หรือข้อมูลที่เฉพาะเจาะจงสำหรับโดเมน LLM สามารถสร้างคำตอบที่แม่นยำมากขึ้นและคำนึงถึงบริบทสำหรับ Use Case ที่เฉพาะเจาะจงได้ด้วยความสามารถในการดึงข้อมูลเพิ่มเติมจาก RAG
AI Edge RAG SDK พร้อมใช้งานสำหรับ Android และสามารถทำงานบนอุปกรณ์ได้ทั้งหมด เริ่มใช้ SDK โดยทําตามคําแนะนําสําหรับ Android ซึ่งจะอธิบายการติดตั้งใช้งานเบื้องต้นของแอปพลิเคชันตัวอย่างโดยใช้ RAG
ไปป์ไลน์ RAG
การตั้งค่าไปป์ไลน์ RAG ด้วย AI Edge RAG SDK มีขั้นตอนสำคัญต่อไปนี้
- นําเข้าข้อมูล: ระบุข้อมูลที่เป็นข้อความที่ LLM จะใช้เมื่อสร้างเอาต์พุต
- แยกและจัดทำดัชนีข้อมูล: แบ่งข้อมูลออกเป็นส่วนเล็กๆ เพื่อจัดทำดัชนีในฐานข้อมูล
- สร้างการฝัง: ใช้โปรแกรมฝังเพื่อเปลี่ยนข้อมูลส่วนที่เป็นกลุ่มเป็นเวกเตอร์เพื่อจัดเก็บในฐานข้อมูลเวกเตอร์
- ดึงข้อมูล: กําหนดวิธีระบุและดึงข้อมูลที่เกี่ยวข้องเพื่อตอบสนองพรอมต์ของผู้ใช้ สำหรับพรอมต์หนึ่งๆ คอมโพเนนต์การดึงข้อมูลจะค้นหาฐานข้อมูลเวกเตอร์เพื่อระบุข้อมูลที่เกี่ยวข้อง
- สร้างข้อความด้วย LLM: ใช้โมเดลภาษาขนาดใหญ่เพื่อสร้างข้อความเอาต์พุตตามข้อมูลที่ดึงมาจากฐานข้อมูลเวกเตอร์
โมดูลหลัก
AI Edge RAG SDK มีโมดูลและ API หลักต่อไปนี้สําหรับไปป์ไลน์ RAG
- โมเดลภาษา: โมเดล LLM ที่มี API แบบพรอมต์แบบเปิด ซึ่งอาจเป็นแบบในเครื่อง (ในอุปกรณ์) หรือแบบเซิร์ฟเวอร์ API นี้อิงตามอินเทอร์เฟซ LanguageModel
- โมเดลการฝังข้อความ: แปลงข้อความที่มีโครงสร้างและไม่มีโครงสร้างเป็นเวกเตอร์การฝังสําหรับการค้นหาเชิงความหมาย API นี้อิงตามอินเทอร์เฟซEmbedder
- ที่เก็บเวกเตอร์: ที่เก็บเวกเตอร์จะเก็บข้อมูลฝังและข้อมูลเมตาที่มาจากกลุ่มข้อมูล ซึ่งสามารถค้นหาเพื่อดูข้อมูลโค้ดที่คล้ายกันหรือตรงกันทั้งหมด API นี้อิงตามอินเทอร์เฟซ VectorStore
- หน่วยความจําเชิงความหมาย: ทำหน้าที่เป็นผู้ดึงข้อมูลเชิงความหมายเพื่อดึงข้อมูลส่วนที่ตรงกับคําค้นหามากที่สุด k รายการ API นี้อิงตามอินเทอร์เฟซ SemanticMemory
- การแบ่งข้อความเป็นกลุ่ม: แบ่งข้อมูลผู้ใช้ออกเป็นส่วนเล็กๆ เพื่อให้จัดทําดัชนีได้ง่ายขึ้น API นี้อิงตามอินเทอร์เฟซ TextChunker
SDK มีเชนซึ่งรวมคอมโพเนนต์ RAG หลายรายการไว้ในไปป์ไลน์เดียว คุณสามารถใช้เชนเพื่อจัดระเบียบการดึงข้อมูลและรูปแบบการค้นหาได้ API นี้อิงตามอินเทอร์เฟซ Chain หากต้องการเริ่มต้นใช้งาน ให้ลองใช้เชนการดึงข้อมูลและการอนุมานหรือเชนการดึงข้อมูล