Google AI Edge Portal 隆重推出：大規模基準測試 Edge AI。申請在非公開預先發布版期間要求存取權。

AI Edge RAG 指南

AI Edge RAG SDK 提供基本元件，可使用 LLM 推論 API 建構檢索增強生成 (RAG) 管道。RAG 管道可讓 LLM 存取使用者提供的資料，包括最新、私密或特定領域的資訊。有了 RAG 提供的資訊擷取功能，LLM 就能針對特定用途生成更準確且符合情境的回覆。

AI Edge RAG SDK 適用於 Android，且完全可在裝置端執行。請參閱 Android 指南，瞭解如何開始使用 SDK。這份指南會逐步說明如何使用 RAG 實作範例應用程式的基本功能。

RAG 管道

使用 AI Edge RAG SDK 設定 RAG 管線時，請按照下列主要步驟操作：

AI Edge RAG SDK 提供下列 RAG 管道的主要模組和 API：

語言模型：具有開放式提示 API 的 LLM 模型，可以是本機 (裝置端) 或伺服器型。這個 API 是以 LanguageModel 介面為基礎。
文字嵌入模型：將結構化和非結構化文字轉換為嵌入向量，以進行語意搜尋。這個 API 是以 Embedder 介面為基礎。
向量儲存庫：向量儲存庫會保留從資料區塊衍生的嵌入和中繼資料。您可以查詢類似的區塊或完全相符的結果。這項 API 是以 VectorStore 介面為基礎。
語意記憶：做為語意檢索器，根據查詢擷取前 k 個相關區塊。這項 API 以 SemanticMemory 介面為基礎。
文字分塊：將使用者資料分割成較小的片段，方便建立索引。這項 API 以 TextChunker 介面為基礎。

SDK 提供鏈結，可將多個 RAG 元件合併到單一管道。您可以使用鏈結來協調擷取和查詢模型。這個 API 是以 Chain 介面為基礎。如要開始使用，請試試擷取和推論鏈結或擷取鏈結。