Mô hình text-embedding-004
tạo các bản nhúng hiện đại cho từ, cụm từ và câu. Sau đó, bạn có thể sử dụng các giá trị nhúng thu được cho các tác vụ như tìm kiếm ngữ nghĩa, phân loại văn bản và tạo cụm, cùng nhiều tác vụ khác. Để biết thêm thông tin về nội dung nhúng, hãy đọc bài nghiên cứu của chúng tôi.
Nhúng là gì?
Các phần nhúng ghi lại ngữ nghĩa và ngữ cảnh, nhờ đó, văn bản có ý nghĩa tương tự sẽ có các phần nhúng "gần hơn". Ví dụ: câu "Tôi đưa chó đến bác sĩ thú y" và "Tôi đưa mèo đến bác sĩ thú y" sẽ có các phần nhúng gần nhau trong không gian vectơ vì cả hai đều mô tả một ngữ cảnh tương tự.
Bạn có thể sử dụng các nội dung nhúng để so sánh các văn bản khác nhau và tìm hiểu mối quan hệ giữa các văn bản đó. Ví dụ: nếu các phần nhúng của văn bản "mèo" và "chó" nằm gần nhau, bạn có thể suy luận rằng các từ này tương tự nhau về ý nghĩa, ngữ cảnh hoặc cả hai. Điều này cho phép nhiều trường hợp sử dụng AI phổ biến.
Tạo nội dung nhúng
Sử dụng phương thức embedContent
để tạo các văn bản nhúng:
Python
import google.generativeai as genai
import os
genai.configure(api_key=os.environ["GEMINI_API_KEY"])
result = genai.embed_content(
model="models/text-embedding-004",
content="What is the meaning of life?")
print(str(result['embedding']))
Node.js
const { GoogleGenerativeAI } = require("@google/generative-ai");
const genAI = new GoogleGenerativeAI(process.env.GEMINI_API_KEY);
const model = genAI.getGenerativeModel({ model: "text-embedding-004"});
async function run() {
const result = await model.embedContent("What is the meaning of life?");
console.log(result.embedding.values);
}
run();
curl
curl "https://generativelanguage.googleapis.com/v1beta/models/text-embedding-004:embedContent?key=$GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{"model": "models/text-embedding-004",
"content": {
"parts":[{
"text": "What is the meaning of life?"}]}
}'
Go
ctx := context.Background()
client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("GEMINI_API_KEY")))
if err != nil {
log.Fatal(err)
}
defer client.Close()
em := client.EmbeddingModel("text-embedding-004")
res, err := em.EmbedContent(ctx, genai.Text("What is the meaning of life?"))
if err != nil {
panic(err)
}
fmt.Println(res.Embedding.Values)
Trường hợp sử dụng
Nội dung nhúng văn bản được dùng trong nhiều trường hợp sử dụng AI phổ biến, chẳng hạn như:
Truy xuất thông tin: Bạn có thể sử dụng các phần nhúng để truy xuất văn bản tương tự về ngữ nghĩa dựa trên một đoạn văn bản đầu vào.
Nhóm: Việc so sánh các nhóm nội dung nhúng có thể giúp xác định các xu hướng ẩn.
Cơ sở dữ liệu vectơ: Khi bạn đưa các trường hợp sử dụng nhúng khác nhau vào sản xuất, thường thì bạn sẽ lưu trữ các phần nhúng trong cơ sở dữ liệu vectơ.
Phân loại: Bạn có thể huấn luyện mô hình bằng cách sử dụng các giá trị nhúng để phân loại tài liệu thành các danh mục.
Mô hình nhúng Gemini
Gemini API cung cấp hai mô hình tạo văn bản nhúng:
Nhúng văn bản là phiên bản cập nhật của mô hình Nhúng, cung cấp kích thước nhúng linh hoạt trong phạm vi 768 phương diện. Các phần nhúng đàn hồi tạo ra kích thước đầu ra nhỏ hơn và có thể tiết kiệm chi phí điện toán và lưu trữ với mức giảm hiệu suất nhỏ.
Sử dụng tính năng Nhúng văn bản cho các dự án hoặc ứng dụng mới.