Nhúng vào Gemini API

Mô hình text-embedding-004 tạo các bản nhúng hiện đại cho từ, cụm từ và câu. Sau đó, bạn có thể sử dụng các giá trị nhúng thu được cho các tác vụ như tìm kiếm ngữ nghĩa, phân loại văn bản và tạo cụm, cùng nhiều tác vụ khác. Để biết thêm thông tin về nội dung nhúng, hãy đọc bài nghiên cứu của chúng tôi.

Nhúng là gì?

Các phần nhúng ghi lại ngữ nghĩa và ngữ cảnh, nhờ đó, văn bản có ý nghĩa tương tự sẽ có các phần nhúng "gần hơn". Ví dụ: câu "Tôi đưa chó đến bác sĩ thú y" và "Tôi đưa mèo đến bác sĩ thú y" sẽ có các phần nhúng gần nhau trong không gian vectơ vì cả hai đều mô tả một ngữ cảnh tương tự.

Bạn có thể sử dụng các nội dung nhúng để so sánh các văn bản khác nhau và tìm hiểu mối quan hệ giữa các văn bản đó. Ví dụ: nếu các phần nhúng của văn bản "mèo" và "chó" nằm gần nhau, bạn có thể suy luận rằng các từ này tương tự nhau về ý nghĩa, ngữ cảnh hoặc cả hai. Điều này cho phép nhiều trường hợp sử dụng AI phổ biến.

Tạo nội dung nhúng

Sử dụng phương thức embedContent để tạo các văn bản nhúng:

Python

import google.generativeai as genai
import os

genai.configure(api_key=os.environ["GEMINI_API_KEY"])

result = genai.embed_content(
        model="models/text-embedding-004",
        content="What is the meaning of life?")

print(str(result['embedding']))

Node.js

const { GoogleGenerativeAI } = require("@google/generative-ai");

const genAI = new GoogleGenerativeAI(process.env.GEMINI_API_KEY);
const model = genAI.getGenerativeModel({ model: "text-embedding-004"});

async function run() {
    const result = await model.embedContent("What is the meaning of life?");
    console.log(result.embedding.values);
}

run();

curl

curl "https://generativelanguage.googleapis.com/v1beta/models/text-embedding-004:embedContent?key=$GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{"model": "models/text-embedding-004",
     "content": {
     "parts":[{
     "text": "What is the meaning of life?"}]}
    }'

Go

ctx := context.Background()

client, err := genai.NewClient(ctx, option.WithAPIKey(os.Getenv("GEMINI_API_KEY")))
if err != nil {
    log.Fatal(err)
}
defer client.Close()

em := client.EmbeddingModel("text-embedding-004")
res, err := em.EmbedContent(ctx, genai.Text("What is the meaning of life?"))

if err != nil {
    panic(err)
}
fmt.Println(res.Embedding.Values)

Trường hợp sử dụng

Nội dung nhúng văn bản được dùng trong nhiều trường hợp sử dụng AI phổ biến, chẳng hạn như:

Mô hình nhúng Gemini

Gemini API cung cấp hai mô hình tạo văn bản nhúng:

Nhúng văn bản là phiên bản cập nhật của mô hình Nhúng, cung cấp kích thước nhúng linh hoạt trong phạm vi 768 phương diện. Các phần nhúng đàn hồi tạo ra kích thước đầu ra nhỏ hơn và có thể tiết kiệm chi phí điện toán và lưu trữ với mức giảm hiệu suất nhỏ.

Sử dụng tính năng Nhúng văn bản cho các dự án hoặc ứng dụng mới.