Gli embedding sono una rappresentazione numerica dell'input di testo che aprono una serie di casi d'uso unici, come il clustering, la misurazione della somiglianza e il recupero delle informazioni. Per un'introduzione, consulta la guida all'inserimento.
Metodo: models.embedContent
- Endpoint
- Parametri del percorso
- Corpo della richiesta
- Corpo della risposta
- Ambiti di autorizzazione
- Richiesta di esempio
Genera un vettore di embedding del testo dall'input Content
utilizzando il modello di embedding Gemini specificato.
Endpoint
posthttps: / /generativelanguage.googleapis.com /v1beta /{model=models /*}:embedContent
L'URL utilizza la sintassi di transcodifica gRPC.
Parametri del percorso
model
string
Obbligatorio. Il nome della risorsa del modello. che funge da ID per il modello.
Questo nome deve corrispondere a un nome del modello restituito dal metodo models.list
.
Formato: models/{model}
Deve avere il formato models/{model}
.
Corpo della richiesta
Il corpo della richiesta contiene dati con la seguente struttura:
content
object (Content
)
Obbligatorio. I contenuti da incorporare. Verranno conteggiati solo i campi parts.text
.
taskType
enum (TaskType
)
Facoltativo. Tipo di attività facoltativo per cui verranno utilizzati gli embedding. Può essere impostato solo per models/embedding-001
.
title
string
Facoltativo. Un titolo facoltativo per il testo. Applicabile solo quando TaskType è RETRIEVAL_DOCUMENT
.
Nota: la specifica di un valore title
per RETRIEVAL_DOCUMENT
fornisce embedding di qualità migliore per il recupero.
outputDimensionality
integer
Facoltativo. Dimensione ridotta facoltativa per l'embedding di output. Se impostato, i valori eccessivi nell'embedding di output vengono troncati dalla fine. Supportato solo dai modelli più recenti dal 2024. Non puoi impostare questo valore se utilizzi il modello precedente (models/embedding-001
).
Richiesta di esempio
Python
Node.js
Conchiglia
Corpo della risposta
La risposta a un EmbedContentRequest
.
In caso di esito positivo, il corpo della risposta contiene dati con la seguente struttura:
embedding
object (ContentEmbedding
)
Solo output. L'embedding generato dai contenuti inseriti.
Rappresentazione JSON |
---|
{
"embedding": {
object ( |
Metodo: models.batchEmbedContents
- Endpoint
- Parametri del percorso
- Corpo della richiesta
- Corpo della risposta
- Ambiti di autorizzazione
- Richiesta di esempio
- EmbedContentRequest
Genera più vettori di embedding dall'input Content
, costituito da un batch di stringhe rappresentate come oggetti EmbedContentRequest
.
Endpoint
posthttps: / /generativelanguage.googleapis.com /v1beta /{model=models /*}:batchEmbedContents
L'URL utilizza la sintassi di transcodifica gRPC.
Parametri del percorso
model
string
Obbligatorio. Il nome della risorsa del modello. che funge da ID per il modello.
Questo nome deve corrispondere a un nome del modello restituito dal metodo models.list
.
Formato: models/{model}
Deve avere il formato models/{model}
.
Corpo della richiesta
Il corpo della richiesta contiene dati con la seguente struttura:
requests[]
object (EmbedContentRequest
)
Obbligatorio. Incorpora le richieste per il batch. Il modello in ciascuna di queste richieste deve corrispondere al modello specificato BatchEmbedContentsRequest.model
.
Richiesta di esempio
Python
Node.js
Conchiglia
Corpo della risposta
La risposta a un BatchEmbedContentsRequest
.
In caso di esito positivo, il corpo della risposta contiene dati con la seguente struttura:
embeddings[]
object (ContentEmbedding
)
Solo output. Gli embedding per ogni richiesta, nello stesso ordine fornito nella richiesta batch.
Rappresentazione JSON |
---|
{
"embeddings": [
{
object ( |
EmbedContentRequest
Richiesta contenente il Content
per il modello da incorporare.
model
string
Obbligatorio. Il nome della risorsa del modello. che funge da ID per il modello.
Questo nome deve corrispondere a un nome del modello restituito dal metodo models.list
.
Formato: models/{model}
content
object (Content
)
Obbligatorio. I contenuti da incorporare. Verranno conteggiati solo i campi parts.text
.
taskType
enum (TaskType
)
Facoltativo. Tipo di attività facoltativo per cui verranno utilizzati gli embedding. Può essere impostato solo per models/embedding-001
.
title
string
Facoltativo. Un titolo facoltativo per il testo. Applicabile solo quando TaskType è RETRIEVAL_DOCUMENT
.
Nota: la specifica di un valore title
per RETRIEVAL_DOCUMENT
fornisce embedding di qualità migliore per il recupero.
outputDimensionality
integer
Facoltativo. Dimensione ridotta facoltativa per l'embedding di output. Se impostato, i valori eccessivi nell'embedding di output vengono troncati dalla fine. Supportato solo dai modelli più recenti dal 2024. Non puoi impostare questo valore se utilizzi il modello precedente (models/embedding-001
).
ContentEmbedding
Un elenco di valori float che rappresentano un embedding.
values[]
number
I valori di incorporamento.
Rappresentazione JSON |
---|
{ "values": [ number ] } |
TaskType
Tipo di attività per la quale verrà utilizzato l'embedding.
Enum | |
---|---|
TASK_TYPE_UNSPECIFIED |
Valore non impostato, che per impostazione predefinita corrisponderà a uno degli altri valori dell'enum. |
RETRIEVAL_QUERY |
Specifica che il testo specificato è una query in un'impostazione di ricerca/recupero. |
RETRIEVAL_DOCUMENT |
Specifica che il testo specificato è un documento del corpus sottoposto a ricerca. |
SEMANTIC_SIMILARITY |
Specifica che il testo specificato verrà utilizzato per STS. |
CLASSIFICATION |
Specifica che il testo specificato verrà classificato. |
CLUSTERING |
Specifica che gli embedding verranno utilizzati per il clustering. |
QUESTION_ANSWERING |
Specifica che il testo specificato verrà utilizzato per rispondere alle domande. |
FACT_VERIFICATION |
Specifica che il testo specificato verrà utilizzato per la verifica dei fatti. |