嵌入指南

Gemini API 中的嵌入服務會產生字詞、詞組和語句最先進的嵌入功能。產生的嵌入隨後可用於自然語言處理工作,例如語意搜尋、文字分類和分群。本頁說明嵌入功能,並重點介紹嵌入服務的一些重要用途,協助您快速上手。

什麼是嵌入?

文字嵌入是一種自然語言處理 (NLP) 技術,可將文字轉換為數值向量。嵌入功能會擷取語意含義和背景資訊,進而導致具有相似意義的文字在嵌入較接近嵌入。舉例來說,「I take my dog to the vet」(我帶狗去) 和「I 帶 my cat to the vet」(我帶貓去) 這句話在向量空間中,內嵌的嵌入會彼此相近,因為兩者都是描述相似的背景資訊。

這點很重要,因為可以解鎖多種可在向量上作業的演算法,但無法直接處理文字。

您可以使用這些嵌入或向量來比較不同文字,並瞭解兩者之間的關係。舉例來說,如果「cat」和「dog」這兩個文字的嵌入相近,您就能推斷這些字詞在意義或上下文中,或兩者兼具。這項功能可讓您使用下一節所述的各種用途。

用途

文字嵌入功能支援多種自然語言處理用途。例如:

彈性嵌入

Gemini 文字嵌入模型 (從 text-embedding-004 開始) 提供在 768 以下的彈性嵌入大小。您可以使用彈性嵌入來產生較小的輸出維度,而且可能以輕微的效能損失,節省運算和儲存成本。

後續步驟

  • 如果您已準備好開始開發,可以在 PythonGoNode.jsDart (Flutter) 的快速入門導覽課程中找到完整的可執行程式碼。