Gemini 2.5 Pro Experimental, mô hình tiên tiến nhất của chúng tôi, hiện đã ra mắt! Tìm hiểu thêm

Trang này được dịch bởi Cloud Translation API.

Embeddings

Nội dung nhúng là một bản trình bày dạng số của dữ liệu đầu vào văn bản, mở ra một số trường hợp sử dụng riêng biệt, chẳng hạn như phân cụm, đo lường mức độ tương đồng và truy xuất thông tin. Để biết thông tin giới thiệu, hãy xem Hướng dẫn về tính năng nhúng.

Phương thức: models.embedContent

Điểm cuối
Thông số đường dẫn
Nội dung yêu cầu
- Biểu diễn dưới dạng JSON
Nội dung phản hồi
- Biểu diễn dưới dạng JSON
Phạm vi uỷ quyền
Yêu cầu mẫu
- Cơ bản

Tạo một vectơ nhúng văn bản từ Content đầu vào bằng cách sử dụng mô hình Nhúng Gemini được chỉ định.

Điểm cuối

bài đăng https://generativelanguage.googleapis.com/v1beta/{model=models/*}:embedContent

Tham số đường dẫn

model string

Bắt buộc. Tên tài nguyên của mô hình. Đây là mã nhận dạng để Mô hình sử dụng.

Tên này phải khớp với tên mô hình do phương thức models.list trả về.

Định dạng: models/{model} Có dạng models/{model}.

Nội dung yêu cầu

Nội dung yêu cầu chứa dữ liệu có cấu trúc sau:

Trường

content object (Content)

Bắt buộc. Nội dung cần nhúng. Chỉ các trường parts.text mới được tính.

taskType enum (TaskType)

Không bắt buộc. Loại tác vụ không bắt buộc mà các phần nhúng sẽ được sử dụng. Không được hỗ trợ trên các mẫu trước đó (models/embedding-001).

title string

Không bắt buộc. Tiêu đề không bắt buộc cho văn bản. Chỉ áp dụng khi TaskType là RETRIEVAL_DOCUMENT.

Lưu ý: Việc chỉ định title cho RETRIEVAL_DOCUMENT sẽ cung cấp các nội dung nhúng có chất lượng tốt hơn để truy xuất.

outputDimensionality integer

Không bắt buộc. Không bắt buộc giảm kích thước cho phần nhúng đầu ra. Nếu được đặt, các giá trị thừa trong phần nhúng đầu ra sẽ bị cắt bớt từ cuối. Chỉ được các mẫu mới hơn hỗ trợ kể từ năm 2024. Bạn không thể đặt giá trị này nếu sử dụng mô hình cũ (models/embedding-001).

Yêu cầu mẫu

PythonNode.jsVỏ

from google import genai
from google.genai import types

client = genai.Client()
text = "Hello World!"
result = client.models.embed_content(
    model="text-embedding-004",
    contents=text,
    config=types.EmbedContentConfig(output_dimensionality=10),
)
print(result.embeddings)embed.py

// Make sure to include the following import:
// import {GoogleGenAI} from '@google/genai';
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
const text = "Hello World!";
const result = await ai.models.embedContent({
  model: "text-embedding-004",
  contents: text,
  config: { outputDimensionality: 10 },
});
console.log(result.embeddings);embed.js

curl "https://generativelanguage.googleapis.com/v1beta/models/text-embedding-004:embedContent?key=$GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{"model": "models/text-embedding-004",
    "content": {
    "parts":[{
      "text": "Hello world"}]}, }' 2> /dev/null | headembed.sh

Nội dung phản hồi

Phản hồi cho EmbedContentRequest.

Nếu thành công, phần nội dung phản hồi sẽ chứa dữ liệu có cấu trúc sau:

Trường

embedding object (ContentEmbedding)

Chỉ có đầu ra. Nội dung nhúng được tạo từ nội dung đầu vào.

Biểu diễn dưới dạng JSON
{ "embedding": { object (`ContentEmbedding`) } }

Phương thức: models.batchEmbedContents

Điểm cuối
Thông số đường dẫn
Nội dung yêu cầu
- Biểu diễn dưới dạng JSON
Nội dung phản hồi
- Biểu diễn dưới dạng JSON
Phạm vi uỷ quyền
Yêu cầu mẫu
- Cơ bản
EmbedContentRequest
- Biểu diễn dưới dạng JSON

Tạo nhiều vectơ nhúng từ Content đầu vào, bao gồm một loạt chuỗi được biểu thị dưới dạng đối tượng EmbedContentRequest.

Điểm cuối

bài đăng https://generativelanguage.googleapis.com/v1beta/{model=models/*}:batchEmbedContents

Tham số đường dẫn

model string

Bắt buộc. Tên tài nguyên của mô hình. Đây là mã nhận dạng để Mô hình sử dụng.

Tên này phải khớp với tên mô hình do phương thức models.list trả về.

Định dạng: models/{model} Có dạng models/{model}.

Nội dung yêu cầu

Nội dung yêu cầu chứa dữ liệu có cấu trúc sau:

Trường

requests[] object (EmbedContentRequest)

Bắt buộc. Nhúng các yêu cầu cho lô. Mô hình trong mỗi yêu cầu này phải khớp với mô hình được chỉ định BatchEmbedContentsRequest.model.

Yêu cầu mẫu

PythonNode.jsVỏ

from google import genai
from google.genai import types

client = genai.Client()
texts = [
    "What is the meaning of life?",
    "How much wood would a woodchuck chuck?",
    "How does the brain work?",
]
result = client.models.embed_content(
    model="text-embedding-004",
    contents=texts,
    config=types.EmbedContentConfig(output_dimensionality=10),
)
print(result.embeddings)embed.py

// Make sure to include the following import:
// import {GoogleGenAI} from '@google/genai';
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
const texts = [
  "What is the meaning of life?",
  "How much wood would a woodchuck chuck?",
  "How does the brain work?",
];
const result = await ai.models.embedContent({
  model: "text-embedding-004",
  contents: texts,
  config: { outputDimensionality: 10 },
});
console.log(result.embeddings);embed.js

curl "https://generativelanguage.googleapis.com/v1beta/models/text-embedding-004:batchEmbedContents?key=$GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{"requests": [{
      "model": "models/text-embedding-004",
      "content": {
      "parts":[{
        "text": "What is the meaning of life?"}]}, },
      {
      "model": "models/text-embedding-004",
      "content": {
      "parts":[{
        "text": "How much wood would a woodchuck chuck?"}]}, },
      {
      "model": "models/text-embedding-004",
      "content": {
      "parts":[{
        "text": "How does the brain work?"}]}, }, ]}' 2> /dev/null | grep -C 5 valuesembed.sh

Nội dung phản hồi

Phản hồi cho BatchEmbedContentsRequest.

Nếu thành công, phần nội dung phản hồi sẽ chứa dữ liệu có cấu trúc sau:

Trường

embeddings[] object (ContentEmbedding)

Chỉ có đầu ra. Các phần nhúng cho mỗi yêu cầu, theo thứ tự giống như được cung cấp trong yêu cầu theo lô.

Biểu diễn dưới dạng JSON
{ "embeddings": [ { object (`ContentEmbedding`) } ] }

EmbedContentRequest

Yêu cầu chứa Content để mô hình nhúng.

Trường

model string

Bắt buộc. Tên tài nguyên của mô hình. Đây là mã nhận dạng để Mô hình sử dụng.

Tên này phải khớp với tên mô hình do phương thức models.list trả về.

Định dạng models/{model}

content object (Content)

Bắt buộc. Nội dung cần nhúng. Chỉ các trường parts.text mới được tính.

taskType enum (TaskType)

Không bắt buộc. Loại tác vụ không bắt buộc mà các phần nhúng sẽ được sử dụng. Không được hỗ trợ trên các mẫu trước đó (models/embedding-001).

title string

Không bắt buộc. Tiêu đề không bắt buộc cho văn bản. Chỉ áp dụng khi TaskType là RETRIEVAL_DOCUMENT.

Lưu ý: Việc chỉ định title cho RETRIEVAL_DOCUMENT sẽ cung cấp các nội dung nhúng có chất lượng tốt hơn để truy xuất.

outputDimensionality integer

Biểu diễn dưới dạng JSON
{ "model": string, "content": { object (`Content`) }, "taskType": enum (`TaskType`), "title": string, "outputDimensionality": integer }

ContentEmbedding

Biểu diễn dưới dạng JSON

Danh sách các số thực đại diện cho một phần nhúng.

Trường

values[] number

Các giá trị nhúng.

Biểu diễn dưới dạng JSON
{ "values": [ number ] }

TaskType

Loại tác vụ sẽ sử dụng tính năng nhúng.

Enum
`TASK_TYPE_UNSPECIFIED`	Giá trị chưa đặt, sẽ mặc định là một trong các giá trị enum khác.
`RETRIEVAL_QUERY`	Chỉ định văn bản đã cho là một truy vấn trong chế độ cài đặt tìm kiếm/truy xuất.
`RETRIEVAL_DOCUMENT`	Chỉ định văn bản đã cho là một tài liệu trong tập hợp văn bản đang được tìm kiếm.
`SEMANTIC_SIMILARITY`	Chỉ định văn bản đã cho sẽ được dùng cho STS.
`CLASSIFICATION`	Chỉ định rằng văn bản đã cho sẽ được phân loại.
`CLUSTERING`	Chỉ định rằng các mục nhúng sẽ được dùng để tạo cụm.
`QUESTION_ANSWERING`	Chỉ định rằng văn bản đã cho sẽ được dùng để trả lời câu hỏi.
`FACT_VERIFICATION`	Chỉ định rằng văn bản đã cho sẽ được dùng để xác minh thông tin.
`CODE_RETRIEVAL_QUERY`	Chỉ định rằng văn bản đã cho sẽ được dùng để truy xuất mã.