Interfejs Interactions API jest już ogólnie dostępny. Zalecamy korzystanie z tego interfejsu API, aby mieć dostęp do wszystkich najnowszych funkcji i modeli.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Embeddings

Osadzanie to numeryczna reprezentacja tekstu wejściowego, która otwiera wiele unikalnych przypadków użycia, takich jak klastrowanie, pomiar podobieństwa i wyszukiwanie informacji. Więcej informacji znajdziesz w przewodniku po embeddingach.

W przeciwieństwie do modeli generatywnej AI, które tworzą nowe treści, model Gemini Embedding ma tylko przekształcać format danych wejściowych w reprezentację numeryczną. Google odpowiada za udostępnienie modelu osadzania, który przekształca format danych wejściowych na wymagany format numeryczny, ale użytkownicy ponoszą pełną odpowiedzialność za wprowadzane dane i wynikowe osadzanie. Korzystając z modelu Gemini Embedding, potwierdzasz, że masz wymagane prawa do treści, które przesyłasz. Nie twórz treści naruszających prawa własności intelektualnej lub prawo do prywatności innych osób. Korzystanie z tej usługi podlega naszym zasadom dotyczącym niedozwolonych zastosowań i Warunkom korzystania z usług Google.

Generuje wektor dystrybucyjny tekstu z danych wejściowych Content za pomocą określonego modelu Gemini Embedding.

Punkt końcowy

post https://generativelanguage.googleapis.com/v1beta/{model=models/*}:embedContent

Parametry ścieżki

model string

Wymagane. Nazwa zasobu modelu. Służy on jako identyfikator modelu.

Ta nazwa powinna być zgodna z nazwą modelu zwróconą przez metodę models.list.

Format: models/{model} Ma on postać models/{model}.

Treść żądania

Treść żądania zawiera dane o następującej strukturze:

Pola

content object (Content)

Wymagane. Treści do umieszczenia. Zostaną zliczone tylko pola parts.text.

taskType
(deprecated)

enum (TaskType)

Opcjonalnie. Wycofano: zamiast niego użyj EmbedContentConfig.task_type. Opcjonalny typ zadania, do którego będą używane wektory. Nieobsługiwane w starszych modelach (models/embedding-001).

title
(deprecated)

string

Opcjonalnie. Wycofano: zamiast niego użyj EmbedContentConfig.title. Opcjonalny tytuł tekstu. Ma zastosowanie tylko wtedy, gdy TaskType to RETRIEVAL_DOCUMENT.

Uwaga: określenie wartości title dla parametru RETRIEVAL_DOCUMENT zapewnia lepszą jakość wektorów dystrybucyjnych na potrzeby wyszukiwania.

outputDimensionality
(deprecated)

integer

Opcjonalnie. Wycofano: zamiast niego użyj EmbedContentConfig.output_dimensionality. Opcjonalny zmniejszony wymiar wyjściowego wektora dystrybucyjnego. Jeśli ta opcja jest ustawiona, nadmierne wartości w osadzaniu wyjściowym są obcinane od końca. Obsługiwane tylko przez nowsze modele od 2024 r. Jeśli używasz starszego modelu (models/embedding-001), nie możesz ustawić tej wartości.

embedContentConfig object (EmbedContentConfig)

Opcjonalnie. Konfiguracja żądania models.embedContent.

Przykładowe żądanie

Python

from google import genai
from google.genai import types

client = genai.Client()
text = "Hello World!"
result = client.models.embed_content(
    model="gemini-embedding-001",
    contents=text,
    config=types.EmbedContentConfig(output_dimensionality=10),
)
print(result.embeddings)embed.py

Node.js

// Make sure to include the following import:
// import {GoogleGenAI} from '@google/genai';
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
const text = "Hello World!";
const result = await ai.models.embedContent({
  model: "gemini-embedding-001",
  contents: text,
  config: { outputDimensionality: 10 },
});
console.log(result.embeddings);embed.js

Go

ctx := context.Background()
client, err := genai.NewClient(ctx, &genai.ClientConfig{
	APIKey:  os.Getenv("GEMINI_API_KEY"),
	Backend: genai.BackendGeminiAPI,
})
if err != nil {
	log.Fatal(err)
}

text := "Hello World!"
outputDim := int32(10)
contents := []*genai.Content{
	genai.NewContentFromText(text, genai.RoleUser),
}
result, err := client.Models.EmbedContent(ctx, "gemini-embedding-001", 
	contents, &genai.EmbedContentConfig{
		OutputDimensionality: &outputDim,
})
if err != nil {
	log.Fatal(err)
}

embeddings, err := json.MarshalIndent(result.Embeddings, "", "  ")
if err != nil {
	log.Fatal(err)
}
fmt.Println(string(embeddings))embed.go

Muszla

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-embedding-001:embedContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{"model": "models/gemini-embedding-001",
     "content": {
     "parts":[{
     "text": "What is the meaning of life?"}]}
    }'embed.sh

Treść odpowiedzi

W przypadku powodzenia treść odpowiedzi obejmuje wystąpienie elementu EmbedContentResponse.

Metoda: models.batchEmbedContents

Punkt końcowy
Parametry ścieżki
Treść żądania
- Zapis JSON
Treść odpowiedzi
- Zapis JSON
Zakresy autoryzacji
Przykładowe żądanie
- Basic

Generuje wiele wektorów osadzania z danych wejściowych Content, które składają się z grupy ciągów znaków reprezentowanych jako obiekty EmbedContentRequest.

Punkt końcowy

post https://generativelanguage.googleapis.com/v1beta/{model=models/*}:batchEmbedContents

Parametry ścieżki

model string

Wymagane. Nazwa zasobu modelu. Służy on jako identyfikator modelu.

Ta nazwa powinna być zgodna z nazwą modelu zwróconą przez metodę models.list.

Format: models/{model} Ma on postać models/{model}.

Treść żądania

Treść żądania zawiera dane o następującej strukturze:

Pola

requests[] object (EmbedContentRequest)

Wymagane. Umieść prośby w pakiecie. Model w każdym z tych żądań musi być zgodny z modelem określonym w BatchEmbedContentsRequest.model.

Przykładowe żądanie

Python

from google import genai
from google.genai import types

client = genai.Client()
texts = [
    "What is the meaning of life?",
    "How much wood would a woodchuck chuck?",
    "How does the brain work?",
]
result = client.models.embed_content(
    model="gemini-embedding-001",
    contents=texts,
    config=types.EmbedContentConfig(output_dimensionality=10),
)
print(result.embeddings)embed.py

Node.js

// Make sure to include the following import:
// import {GoogleGenAI} from '@google/genai';
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
const texts = [
  "What is the meaning of life?",
  "How much wood would a woodchuck chuck?",
  "How does the brain work?",
];
const result = await ai.models.embedContent({
  model: "gemini-embedding-001",
  contents: texts,
  config: { outputDimensionality: 10 },
});
console.log(result.embeddings);embed.js

Go

ctx := context.Background()
client, err := genai.NewClient(ctx, &genai.ClientConfig{
	APIKey:  os.Getenv("GEMINI_API_KEY"),
	Backend: genai.BackendGeminiAPI,
})
if err != nil {
	log.Fatal(err)
}

contents := []*genai.Content{
	genai.NewContentFromText("What is the meaning of life?", genai.RoleUser),
	genai.NewContentFromText("How much wood would a woodchuck chuck?", genai.RoleUser),
	genai.NewContentFromText("How does the brain work?", genai.RoleUser),
}

outputDim := int32(10)
result, err := client.Models.EmbedContent(ctx, "gemini-embedding-001", contents, &genai.EmbedContentConfig{
	OutputDimensionality: &outputDim,
})
if err != nil {
	log.Fatal(err)
}

embeddings, err := json.MarshalIndent(result.Embeddings, "", "  ")
if err != nil {
	log.Fatal(err)
}
fmt.Println(string(embeddings))embed.go

Muszla

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-embedding-001:batchEmbedContents" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{"requests": [{
      "model": "models/gemini-embedding-001",
      "content": {
      "parts":[{
        "text": "What is the meaning of life?"}]}, },
      {
      "model": "models/gemini-embedding-001",
      "content": {
      "parts":[{
        "text": "How much wood would a woodchuck chuck?"}]}, },
      {
      "model": "models/gemini-embedding-001",
      "content": {
      "parts":[{
        "text": "How does the brain work?"}]}, }, ]}' 2> /dev/null | grep -C 5 valuesembed.sh

Treść odpowiedzi

Odpowiedź na BatchEmbedContentsRequest.

W przypadku powodzenia treść żądania zawiera dane o następującej strukturze:

Pola

embeddings[] object (ContentEmbedding)

Tylko dane wyjściowe. Osadzanie dla każdego żądania w tej samej kolejności, w jakiej zostało podane w żądaniu zbiorczym.

usageMetadata object (EmbeddingUsageMetadata)

Tylko dane wyjściowe. Metadane dotyczące wykorzystania w przypadku żądania.

Zapis JSON
{ "embeddings": [ { object (`ContentEmbedding`) } ], "usageMetadata": { object (`EmbeddingUsageMetadata`) } }

Metoda: models.asyncBatchEmbedContent

Punkt końcowy
Parametry ścieżki
Treść żądania
- Zapis JSON
Treść odpowiedzi
Zakresy autoryzacji

Dodaje do kolejki partię models.embedContent żądań do przetwarzania wsadowego. Mamy moduł obsługi models.batchEmbedContents w GenerativeService, ale został on zsynchronizowany. Aby uniknąć nieporozumień, nazwiemy go Async.

Punkt końcowy

post https://generativelanguage.googleapis.com/v1beta/{batch.model=models/*}:asyncBatchEmbedContent

Parametry ścieżki

batch.model string

Wymagane. Nazwa Model, która ma być użyta do wygenerowania dokończenia.

Format: models/{model}. Ma on postać models/{model}.

Treść żądania

Treść żądania zawiera dane o następującej strukturze:

Pola

batch.name string

Tylko dane wyjściowe. Identyfikator. Nazwa zasobu pakietu.

Format: batches/{batchId}.

batch.displayName string

Wymagane. Nazwa tego pakietu zdefiniowana przez użytkownika.

batch.inputConfig object (InputEmbedContentConfig)

Wymagane. Konfiguracja wejściowa instancji, na których wykonywane jest przetwarzanie wsadowe.

batch.output object (EmbedContentBatchOutput)

Tylko dane wyjściowe. Dane wyjściowe żądania zbiorczego.

batch.createTime string (Timestamp format)

Tylko dane wyjściowe. Czas utworzenia partii.

Korzysta ze standardu RFC 3339, w którym wygenerowane dane wyjściowe są zawsze znormalizowane do formatu Z i zawierają 0, 3, 6 lub 9 cyfr po przecinku. Akceptowane są też przesunięcia inne niż „Z”. Przykłady: "2014-10-02T15:01:23Z", "2014-10-02T15:01:23.045123456Z" lub "2014-10-02T15:01:23+05:30".

batch.endTime string (Timestamp format)

Tylko dane wyjściowe. Czas zakończenia przetwarzania wsadowego.

batch.updateTime string (Timestamp format)

Tylko dane wyjściowe. Czas ostatniej aktualizacji pakietu.

batch.batchStats object (EmbedContentBatchStats)

Tylko dane wyjściowe. Statystyki dotyczące partii.

batch.state enum (BatchState)

Tylko dane wyjściowe. Stan wsadu.

batch.priority string (int64 format)

Opcjonalnie. Priorytet zadania wsadowego. Partie o wyższej wartości priorytetu będą przetwarzane przed partiami o niższej wartości priorytetu. Dozwolone są wartości ujemne. Wartość domyślna to 0.

Treść odpowiedzi

W przypadku powodzenia treść odpowiedzi obejmuje wystąpienie elementu Operation.

EmbedContentResponse

Zapis JSON

Odpowiedź na EmbedContentRequest.

Pola

embedding object (ContentEmbedding)

Tylko dane wyjściowe. Wektor wygenerowany na podstawie treści wejściowych.

usageMetadata object (EmbeddingUsageMetadata)

Tylko dane wyjściowe. Metadane dotyczące wykorzystania w przypadku żądania.

Zapis JSON
{ "embedding": { object (`ContentEmbedding`) }, "usageMetadata": { object (`EmbeddingUsageMetadata`) } }

ContentEmbedding

Zapis JSON

Lista liczb zmiennoprzecinkowych reprezentujących osadzanie.

Pola

values[] number

Wartości wektora dystrybucyjnego. Dotyczy to tylko użytkowników zewnętrznych i nie będzie wypełniane w przypadku połączeń z użyciem numeru własnego.

shape[] integer

To pole przechowuje kształt tensora tokenów miękkich (np. [1, 1, 256, 2048]).

Zapis JSON
{ "values": [ number ], "shape": [ integer ] }

TaskType

Typ zadania, do którego będzie używane osadzanie.

Wartości w polu enum
`TASK_TYPE_UNSPECIFIED`	Nieokreślona wartość, która domyślnie będzie jedną z pozostałych wartości wyliczeniowych.
`RETRIEVAL_QUERY`	Określa, że podany tekst jest zapytaniem w ustawieniu wyszukiwania lub pobierania.
`RETRIEVAL_DOCUMENT`	Określa, że podany tekst jest dokumentem z przeszukiwanego korpusu.
`SEMANTIC_SIMILARITY`	Określa, że podany tekst będzie używany w STS.
`CLASSIFICATION`	Określa, że podany tekst zostanie sklasyfikowany.
`CLUSTERING`	Określa, że wektory dystrybucyjne będą używane do klastrowania.
`QUESTION_ANSWERING`	Określa, że podany tekst będzie używany do odpowiadania na pytania.
`FACT_VERIFICATION`	Określa, że podany tekst będzie używany do weryfikacji faktów.
`CODE_RETRIEVAL_QUERY`	Określa, że podany tekst będzie używany do pobierania kodu.

EmbedContentBatch

Zapis JSON
InputEmbedContentConfig
- Zapis JSON
InlinedEmbedContentRequests
- Zapis JSON
InlinedEmbedContentRequest
- Zapis JSON
EmbedContentBatchOutput
- Zapis JSON
InlinedEmbedContentResponses
- Zapis JSON
InlinedEmbedContentResponse
- Zapis JSON
EmbedContentBatchStats
- Zapis JSON

Zasób reprezentujący partię żądań EmbedContent.

Pola

model string

Wymagane. Nazwa Model, która ma być użyta do wygenerowania dokończenia.

Format: models/{model}.

name string

Tylko dane wyjściowe. Identyfikator. Nazwa zasobu pakietu.

Format: batches/{batchId}.

displayName string

Wymagane. Nazwa tego pakietu zdefiniowana przez użytkownika.

inputConfig object (InputEmbedContentConfig)

Wymagane. Konfiguracja wejściowa instancji, na których wykonywane jest przetwarzanie wsadowe.

output object (EmbedContentBatchOutput)

Tylko dane wyjściowe. Dane wyjściowe żądania zbiorczego.

createTime string (Timestamp format)

Tylko dane wyjściowe. Czas utworzenia partii.

endTime string (Timestamp format)

Tylko dane wyjściowe. Czas zakończenia przetwarzania wsadowego.

updateTime string (Timestamp format)

Tylko dane wyjściowe. Czas ostatniej aktualizacji pakietu.

batchStats object (EmbedContentBatchStats)

Tylko dane wyjściowe. Statystyki dotyczące partii.

state enum (BatchState)

Tylko dane wyjściowe. Stan wsadu.

priority string (int64 format)

Zapis JSON

Zapis JSON
{ "model": string, "name": string, "displayName": string, "inputConfig": { object (`InputEmbedContentConfig`) }, "output": { object (`EmbedContentBatchOutput`) }, "createTime": string, "endTime": string, "updateTime": string, "batchStats": { object (`EmbedContentBatchStats`) }, "state": enum (`BatchState`), "priority": string }

{
  "model": string,
  "name": string,
  "displayName": string,
  "inputConfig": {
    object (InputEmbedContentConfig)
  },
  "output": {
    object (EmbedContentBatchOutput)
  },
  "createTime": string,
  "endTime": string,
  "updateTime": string,
  "batchStats": {
    object (EmbedContentBatchStats)
  },
  "state": enum (BatchState),
  "priority": string
}

InputEmbedContentConfig

Konfiguruje dane wejściowe żądania zbiorczego.

Pola

source Union type

Wymagane. Źródło danych wejściowych. Pole source może mieć tylko jedną z tych wartości:

fileName string

Nazwa File zawierającego żądania wejściowe.

requests object (InlinedEmbedContentRequests)

Żądania do przetworzenia w partii.

Zapis JSON
{ // source "fileName": string, "requests": { object (`InlinedEmbedContentRequests`) } // Union type }

InlinedEmbedContentRequests

Żądania, które mają być przetwarzane w ramach pakietu, jeśli zostały podane w żądaniu utworzenia pakietu.

Pola

requests[] object (InlinedEmbedContentRequest)

Wymagane. Żądania do przetworzenia w partii.

Zapis JSON
{ "requests": [ { object (`InlinedEmbedContentRequest`) } ] }

InlinedEmbedContentRequest

Żądanie do przetworzenia w ramach operacji wsadowej.

Pola

request object (EmbedContentRequest)

Wymagane. Żądanie do przetworzenia w ramach operacji wsadowej.

metadata object (Struct format)

Opcjonalnie. Metadane, które mają być powiązane z żądaniem.

Zapis JSON
{ "request": { object (`EmbedContentRequest`) }, "metadata": { object } }

EmbedContentBatchOutput

Dane wyjściowe żądania zbiorczego. Jest on zwracany w polu AsyncBatchEmbedContentResponse lub EmbedContentBatch.output.

Pola

output Union type

Dane wyjściowe żądania zbiorczego. Pole output może mieć tylko jedną z tych wartości:

responsesFile string

Tylko dane wyjściowe. Identyfikator pliku zawierającego odpowiedzi. Plik będzie miał format JSONL i będzie zawierać po jednej odpowiedzi w wierszu. Odpowiedzi będą miały postać komunikatów EmbedContentResponse w formacie JSON. Odpowiedzi będą zapisywane w tej samej kolejności co żądania wejściowe.

inlinedResponses object (InlinedEmbedContentResponses)

Tylko dane wyjściowe. Odpowiedzi na żądania w partii. Zwracany, gdy pakiet został utworzony przy użyciu żądań wbudowanych. Odpowiedzi będą w tej samej kolejności co żądania wejściowe.

Zapis JSON
{ // output "responsesFile": string, "inlinedResponses": { object (`InlinedEmbedContentResponses`) } // Union type }

InlinedEmbedContentResponses

Odpowiedzi na żądania w partii.

Pola

inlinedResponses[] object (InlinedEmbedContentResponse)

Tylko dane wyjściowe. Odpowiedzi na żądania w partii.

Zapis JSON
{ "inlinedResponses": [ { object (`InlinedEmbedContentResponse`) } ] }

InlinedEmbedContentResponse

Odpowiedź na pojedyncze żądanie w pakiecie.

Pola

metadata object (Struct format)

Tylko dane wyjściowe. Metadane powiązane z żądaniem.

output Union type

Wynik żądania. Pole output może mieć tylko jedną z tych wartości:

error object (Status)

Tylko dane wyjściowe. Błąd, który wystąpił podczas przetwarzania żądania.

response object (EmbedContentResponse)

Tylko dane wyjściowe. Odpowiedź na prośbę.

Zapis JSON
{ "metadata": { object }, // output "error": { object (`Status`) }, "response": { object (`EmbedContentResponse`) } // Union type }

EmbedContentBatchStats

Statystyki dotyczące partii.

Pola

requestCount string (int64 format)

Tylko dane wyjściowe. Liczba żądań w partii.

successfulRequestCount string (int64 format)

Tylko dane wyjściowe. Liczba żądań, które zostały przetworzone.

failedRequestCount string (int64 format)

Tylko dane wyjściowe. Liczba żądań, których nie udało się przetworzyć.

pendingRequestCount string (int64 format)

Tylko dane wyjściowe. Liczba żądań, które nadal oczekują na przetworzenie.

Zapis JSON
{ "requestCount": string, "successfulRequestCount": string, "failedRequestCount": string, "pendingRequestCount": string }

EmbedContentConfig

Zapis JSON

Konfiguracje żądania EmbedContent.

Pola

title string

Opcjonalnie. Tytuł tekstu.

taskType enum (TaskType)

Opcjonalnie. Typ zadania wektora dystrybucyjnego.

autoTruncate boolean

Opcjonalnie. Określa, czy treść wejściowa ma być cicho skracana, jeśli jest dłuższa niż maksymalna długość sekwencji.

outputDimensionality integer

Opcjonalnie. Zmniejszony wymiar wektora dystrybucyjnego. Jeśli ta opcja jest ustawiona, nadmierne wartości w osadzaniu wyjściowym są obcinane od końca.

documentOcr boolean

Opcjonalnie. Czy włączyć optyczne rozpoznawanie znaków w treści dokumentu.

audioTrackExtraction boolean

Opcjonalnie. Czy wyodrębniać dźwięk z treści wideo.

Zapis JSON
{ "title": string, "taskType": enum (`TaskType`), "autoTruncate": boolean, "outputDimensionality": integer, "documentOcr": boolean, "audioTrackExtraction": boolean }

EmbeddingUsageMetadata

Zapis JSON

Metadane dotyczące wykorzystania żądania osadzania.

Pola

promptTokenCount integer

Tylko dane wyjściowe. Liczba tokenów w prompcie.

promptTokenDetails[] object (ModalityTokenCount)

Tylko dane wyjściowe. Lista rodzajów danych, które zostały przetworzone w danych wejściowych żądania.

Zapis JSON
{ "promptTokenCount": integer, "promptTokenDetails": [ { object (`ModalityTokenCount`) } ] }