Veo 3.1 è arrivato! Scopri di più sul nuovo modello e sulle sue funzionalità nel post del blog e nella documentazione.

Questa pagina è stata tradotta dall'API Cloud Translation.

Embedding

L'API Gemini offre modelli di incorporamento di testo per generare incorporamenti per parole, frasi, frasi e codice. Questi embedding di base sono alla base di attività di NLP avanzate come la ricerca semantica, la classificazione e il clustering, fornendo risultati più accurati e sensibili al contesto rispetto agli approcci basati su parole chiave.

La creazione di sistemi di Retrieval Augmented Generation (RAG) è un caso d'uso comune per gli incorporamenti. Gli incorporamenti svolgono un ruolo chiave nel migliorare significativamente gli output del modello con maggiore accuratezza fattuale, coerenza e ricchezza contestuale. Recuperano in modo efficiente le informazioni pertinenti dalle knowledge base, rappresentate da incorporamenti, che vengono poi passati come contesto aggiuntivo nel prompt di input ai modelli linguistici, guidandoli a generare risposte più informate e accurate.

Per scoprire di più sulle varianti del modello di embedding disponibili, consulta la sezione Versioni del modello. Per un servizio con una velocità effettiva maggiore a metà prezzo, prova l'API Batch Embedding.

Generazione degli incorporamenti in corso…

Utilizza il metodo embedContent per generare incorporamenti di testo:

Python

from google import genai

client = genai.Client()

result = client.models.embed_content(
        model="gemini-embedding-001",
        contents="What is the meaning of life?")

print(result.embeddings)

JavaScript

import { GoogleGenAI } from "@google/genai";

async function main() {

    const ai = new GoogleGenAI({});

    const response = await ai.models.embedContent({
        model: 'gemini-embedding-001',
        contents: 'What is the meaning of life?',
    });

    console.log(response.embeddings);
}

main();

Go

package main

import (
    "context"
    "encoding/json"
    "fmt"
    "log"

    "google.golang.org/genai"
)

func main() {
    ctx := context.Background()
    client, err := genai.NewClient(ctx, nil)
    if err != nil {
        log.Fatal(err)
    }

    contents := []*genai.Content{
        genai.NewContentFromText("What is the meaning of life?", genai.RoleUser),
    }
    result, err := client.Models.EmbedContent(ctx,
        "gemini-embedding-001",
        contents,
        nil,
    )
    if err != nil {
        log.Fatal(err)
    }

    embeddings, err := json.MarshalIndent(result.Embeddings, "", "  ")
    if err != nil {
        log.Fatal(err)
    }
    fmt.Println(string(embeddings))
}

REST

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-embedding-001:embedContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{"model": "models/gemini-embedding-001",
     "content": {"parts":[{"text": "What is the meaning of life?"}]}
    }'

Puoi anche generare incorporamenti per più blocchi contemporaneamente passandoli come elenco di stringhe.

Python

from google import genai

client = genai.Client()

result = client.models.embed_content(
        model="gemini-embedding-001",
        contents= [
            "What is the meaning of life?",
            "What is the purpose of existence?",
            "How do I bake a cake?"
        ])

for embedding in result.embeddings:
    print(embedding)

JavaScript

import { GoogleGenAI } from "@google/genai";

async function main() {

    const ai = new GoogleGenAI({});

    const response = await ai.models.embedContent({
        model: 'gemini-embedding-001',
        contents: [
            'What is the meaning of life?',
            'What is the purpose of existence?',
            'How do I bake a cake?'
        ],
    });

    console.log(response.embeddings);
}

main();

Go

package main

import (
    "context"
    "encoding/json"
    "fmt"
    "log"

    "google.golang.org/genai"
)

func main() {
    ctx := context.Background()
    client, err := genai.NewClient(ctx, nil)
    if err != nil {
        log.Fatal(err)
    }

    contents := []*genai.Content{
        genai.NewContentFromText("What is the meaning of life?"),
        genai.NewContentFromText("How does photosynthesis work?"),
        genai.NewContentFromText("Tell me about the history of the internet."),
    }
    result, err := client.Models.EmbedContent(ctx,
        "gemini-embedding-001",
        contents,
        nil,
    )
    if err != nil {
        log.Fatal(err)
    }

    embeddings, err := json.MarshalIndent(result.Embeddings, "", "  ")
    if err != nil {
        log.Fatal(err)
    }
    fmt.Println(string(embeddings))
}

REST

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-embedding-001:batchEmbedContents" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{"requests": [{
    "model": "models/gemini-embedding-001",
    "content": {
    "parts":[{
        "text": "What is the meaning of life?"}]}, },
    {
    "model": "models/gemini-embedding-001",
    "content": {
    "parts":[{
        "text": "How much wood would a woodchuck chuck?"}]}, },
    {
    "model": "models/gemini-embedding-001",
    "content": {
    "parts":[{
        "text": "How does the brain work?"}]}, }, ]}' 2> /dev/null | grep -C 5 values
    ```

Specifica il tipo di attività per migliorare il rendimento

Puoi utilizzare gli incorporamenti per un'ampia gamma di attività, dalla classificazione alla ricerca di documenti. Specificare il tipo di attività corretto consente di ottimizzare gli incorporamenti per le relazioni previste, massimizzando l'accuratezza e l'efficienza. Per un elenco completo dei tipi di attività supportati, consulta la tabella Tipi di attività supportati.

Il seguente esempio mostra come utilizzare SEMANTIC_SIMILARITY per verificare la somiglianza di significato tra stringhe di testo.

Python

from google import genai
from google.genai import types
import numpy as np
from sklearn.metrics.pairwise import cosine_similarity

client = genai.Client()

texts = [
    "What is the meaning of life?",
    "What is the purpose of existence?",
    "How do I bake a cake?"]

result = [
    np.array(e.values) for e in client.models.embed_content(
        model="gemini-embedding-001",
        contents=texts,
        config=types.EmbedContentConfig(task_type="SEMANTIC_SIMILARITY")).embeddings
]

# Calculate cosine similarity. Higher scores = greater semantic similarity.

embeddings_matrix = np.array(result)
similarity_matrix = cosine_similarity(embeddings_matrix)

for i, text1 in enumerate(texts):
    for j in range(i + 1, len(texts)):
        text2 = texts[j]
        similarity = similarity_matrix[i, j]
        print(f"Similarity between '{text1}' and '{text2}': {similarity:.4f}")

JavaScript

import { GoogleGenAI } from "@google/genai";
import * as cosineSimilarity from "compute-cosine-similarity";

async function main() {
    const ai = new GoogleGenAI({});

    const texts = [
        "What is the meaning of life?",
        "What is the purpose of existence?",
        "How do I bake a cake?",
    ];

    const response = await ai.models.embedContent({
        model: 'gemini-embedding-001',
        contents: texts,
        taskType: 'SEMANTIC_SIMILARITY'
    });

    const embeddings = response.embeddings.map(e => e.values);

    for (let i = 0; i < texts.length; i++) {
        for (let j = i + 1; j < texts.length; j++) {
            const text1 = texts[i];
            const text2 = texts[j];
            const similarity = cosineSimilarity(embeddings[i], embeddings[j]);
            console.log(`Similarity between '${text1}' and '${text2}': ${similarity.toFixed(4)}`);
        }
    }
}

main();

Go

package main

import (
    "context"
    "fmt"
    "log"
    "math"

    "google.golang.org/genai"
)

// cosineSimilarity calculates the similarity between two vectors.
func cosineSimilarity(a, b []float32) (float64, error) {
    if len(a) != len(b) {
        return 0, fmt.Errorf("vectors must have the same length")
    }

    var dotProduct, aMagnitude, bMagnitude float64
    for i := 0; i < len(a); i++ {
        dotProduct += float64(a[i] * b[i])
        aMagnitude += float64(a[i] * a[i])
        bMagnitude += float64(b[i] * b[i])
    }

    if aMagnitude == 0 || bMagnitude == 0 {
        return 0, nil
    }

    return dotProduct / (math.Sqrt(aMagnitude) * math.Sqrt(bMagnitude)), nil
}

func main() {
    ctx := context.Background()
    client, _ := genai.NewClient(ctx, nil)
    defer client.Close()

    texts := []string{
        "What is the meaning of life?",
        "What is the purpose of existence?",
        "How do I bake a cake?",
    }

    var contents []*genai.Content
    for _, text := range texts {
        contents = append(contents, genai.NewContentFromText(text, genai.RoleUser))
    }

    result, _ := client.Models.EmbedContent(ctx,
        "gemini-embedding-001",
        contents,
        &genai.EmbedContentRequest{TaskType: genai.TaskTypeSemanticSimilarity},
    )

    embeddings := result.Embeddings

    for i := 0; i < len(texts); i++ {
        for j := i + 1; j < len(texts); j++ {
            similarity, _ := cosineSimilarity(embeddings[i].Values, embeddings[j].Values)
            fmt.Printf("Similarity between '%s' and '%s': %.4f\n", texts[i], texts[j], similarity)
        }
    }
}

REST

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-embedding-001:embedContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d '{"task_type": "SEMANTIC_SIMILARITY",
    "content": {
    "parts":[{
    "text": "What is the meaning of life?"}, {"text": "How much wood would a woodchuck chuck?"}, {"text": "How does the brain work?"}]}
    }'

Di seguito è riportato un esempio di output di questo snippet di codice:

Similarity between 'What is the meaning of life?' and 'What is the purpose of existence?': 0.9481

Similarity between 'What is the meaning of life?' and 'How do I bake a cake?': 0.7471

Similarity between 'What is the purpose of existence?' and 'How do I bake a cake?': 0.7371

Tipi di attività supportati

Tipo di attività	Descrizione	Esempi
SEMANTIC_SIMILARITY	Incorporamenti ottimizzati per valutare la somiglianza del testo.	Sistemi di suggerimenti, rilevamento dei duplicati
CLASSIFICAZIONE	Incorporamenti ottimizzati per classificare i testi in base a etichette preimpostate.	Analisi del sentiment, rilevamento dello spam
CLUSTERING	Incorporamenti ottimizzati per raggruppare i testi in base alle loro somiglianze.	Organizzazione dei documenti, ricerca di mercato, rilevamento di anomalie
RETRIEVAL_DOCUMENT	Incorporamenti ottimizzati per la ricerca di documenti.	Indicizzazione di articoli, libri o pagine web per la ricerca.
RETRIEVAL_QUERY	Incorporamenti ottimizzati per le query di ricerca generali. Utilizza `RETRIEVAL_QUERY` per le query e `RETRIEVAL_DOCUMENT` per i documenti da recuperare.	Ricerca personalizzata
CODE_RETRIEVAL_QUERY	Incorporamenti ottimizzati per il recupero di blocchi di codice in base a query in linguaggio naturale. Utilizza `CODE_RETRIEVAL_QUERY` per le query e `RETRIEVAL_DOCUMENT` per i blocchi di codice da recuperare.	Suggerimenti di codice e ricerca
QUESTION_ANSWERING	Incorporamenti per le domande in un sistema di risposta alle domande, ottimizzati per trovare i documenti che rispondono alla domanda. Utilizza `QUESTION_ANSWERING` per le domande e `RETRIEVAL_DOCUMENT` per i documenti da recuperare.	Chatbox
FACT_VERIFICATION	Incorporamenti per le affermazioni che devono essere verificate, ottimizzati per il recupero di documenti che contengono prove a sostegno o confutazione dell'affermazione. Utilizza `FACT_VERIFICATION` per il testo di destinazione; `RETRIEVAL_DOCUMENT` per i documenti da recuperare	Sistemi di verifica dei fatti automatizzati

Controllare le dimensioni dell'incorporamento

Il modello di incorporamento Gemini, gemini-embedding-001, viene addestrato utilizzando la tecnica di apprendimento della rappresentazione Matrioska (MRL), che insegna a un modello a apprendere incorporamenti ad alta dimensionalità con segmenti iniziali (o prefissi) che sono anche versioni più semplici e utili degli stessi dati.

Utilizza il parametro output_dimensionality per controllare le dimensioni del vettore di incorporamento di output. La selezione di una dimensionalità di output più piccola può consentire di risparmiare spazio di archiviazione e aumentare l'efficienza di calcolo per le applicazioni downstream, sacrificando poco in termini di qualità. Per impostazione predefinita, restituisce un embedding a 3072 dimensioni, ma puoi troncarlo a una dimensione più piccola senza perdere qualità per risparmiare spazio di archiviazione. Ti consigliamo di utilizzare dimensioni di output pari a 768, 1536 o 3072.

Python

from google import genai
from google.genai import types

client = genai.Client()

result = client.models.embed_content(
    model="gemini-embedding-001",
    contents="What is the meaning of life?",
    config=types.EmbedContentConfig(output_dimensionality=768)
)

[embedding_obj] = result.embeddings
embedding_length = len(embedding_obj.values)

print(f"Length of embedding: {embedding_length}")

JavaScript

import { GoogleGenAI } from "@google/genai";

async function main() {
    const ai = new GoogleGenAI({});

    const response = await ai.models.embedContent({
        model: 'gemini-embedding-001',
        content: 'What is the meaning of life?',
        outputDimensionality: 768,
    });

    const embeddingLength = response.embedding.values.length;
    console.log(`Length of embedding: ${embeddingLength}`);
}

main();

Go

package main

import (
    "context"
    "fmt"
    "log"

    "google.golang.org/genai"
)

func main() {
    ctx := context.Background()
    // The client uses Application Default Credentials.
    // Authenticate with 'gcloud auth application-default login'.
    client, err := genai.NewClient(ctx, nil)
    if err != nil {
        log.Fatal(err)
    }
    defer client.Close()

    contents := []*genai.Content{
        genai.NewContentFromText("What is the meaning of life?", genai.RoleUser),
    }

    result, err := client.Models.EmbedContent(ctx,
        "gemini-embedding-001",
        contents,
        &genai.EmbedContentRequest{OutputDimensionality: 768},
    )
    if err != nil {
        log.Fatal(err)
    }

    embedding := result.Embeddings[0]
    embeddingLength := len(embedding.Values)
    fmt.Printf("Length of embedding: %d\n", embeddingLength)
}

REST

curl -X POST "https://generativelanguage.googleapis.com/v1beta/models/gemini-embedding-001:embedContent" \
    -H "x-goog-api-key: $GEMINI_API_KEY" \
    -H 'Content-Type: application/json' \
    -d '{
        "content": {"parts":[{ "text": "What is the meaning of life?"}]},
        "output_dimensionality": 768
    }'

Output di esempio dello snippet di codice:

Length of embedding: 768

Garantire la qualità per le dimensioni più piccole

L'incorporamento della dimensione 3072 è normalizzato. Gli embedding normalizzati producono una somiglianza semantica più accurata confrontando la direzione del vettore, non la sua magnitudo. Per altre dimensioni, tra cui 768 e 1536, devi normalizzare gli incorporamenti nel seguente modo:

Python

import numpy as np
from numpy.linalg import norm

embedding_values_np = np.array(embedding_obj.values)
normed_embedding = embedding_values_np / np.linalg.norm(embedding_values_np)

print(f"Normed embedding length: {len(normed_embedding)}")
print(f"Norm of normed embedding: {np.linalg.norm(normed_embedding):.6f}") # Should be very close to 1

Output di esempio di questo snippet di codice:

Normed embedding length: 768
Norm of normed embedding: 1.000000

La tabella seguente mostra i punteggi MTEB, un benchmark comunemente utilizzato per gli incorporamenti, per diverse dimensioni. In particolare, il risultato mostra che il rendimento non è strettamente legato alle dimensioni della dimensione di incorporamento, con dimensioni inferiori che ottengono punteggi paragonabili a quelli delle dimensioni superiori.

Dimensione MRL	Punteggio MTEB
2048	68.16
1536	68.17
768	67,99
512	67,55
256	66,19
128	63,31

Casi d'uso

Gli incorporamenti di testo sono fondamentali per una serie di casi d'uso comuni dell'AI, ad esempio:

Retrieval-Augmented Generation (RAG): gli incorporamenti migliorano la qualità del testo generato recuperando e incorporando informazioni pertinenti nel contesto di un modello.
Recupero delle informazioni:cerca il testo o i documenti semanticamente più simili dato un testo di input.

Tutorial sulla ricerca di documenti
Riorganizzazione della ricerca: assegna la priorità agli elementi più pertinenti valutando semanticamente i risultati iniziali in base alla query.

Tutorial sul ranking di ricerca
Rilevamento delle anomalie:il confronto di gruppi di incorporamenti può aiutare a identificare tendenze nascoste o valori anomali.

Tutorial sul rilevamento di anomalie
Classificazione:categorizza automaticamente il testo in base ai suoi contenuti, ad esempio l'analisi del sentiment o il rilevamento dello spam

Tutorial sulla classificazione
Clustering:comprendi in modo efficace le relazioni complesse creando cluster e visualizzazioni degli incorporamenti.

Tutorial sulla visualizzazione del clustering

Memorizzazione degli embedding

Quando porti gli incorporamenti in produzione, è comune utilizzare database vettoriali per archiviare, indicizzare e recuperare in modo efficiente incorporamenti ad alta dimensionalità. Google Cloud offre servizi di dati gestiti che possono essere utilizzati a questo scopo, tra cui BigQuery, AlloyDB e Cloud SQL.

I seguenti tutorial mostrano come utilizzare altri database vettoriali di terze parti con Gemini Embedding.

Versioni modello

Proprietà	Descrizione
Codice modello	API Gemini `gemini-embedding-001`
Tipi di dati supportati	Ingresso Testo Output Text embedding
Limiti dei token^[*]	Limite di token di input 2048 Dimensioni della dimensione di output Flessibile, supporta: 128 - 3072, consigliato: 768, 1536, 3072
Versioni	Per ulteriori dettagli, leggi i pattern delle versioni del modello. Stabile: `gemini-embedding-001` Sperimentale: `gemini-embedding-exp-03-07` (ritiro previsto per ottobre 2025)
Ultimo aggiornamento	Giugno 2025

Incorporamenti batch

Se la latenza non è un problema, prova a utilizzare il modello Gemini Embeddings con l'API Batch. Ciò consente un throughput molto più elevato al 50% del prezzo dell'incorporamento interattivo. Trova esempi su come iniziare nella raccolta di ricette dell'API Batch.

Avviso sull'utilizzo responsabile

A differenza dei modelli di AI generativa che creano nuovi contenuti, il modello Gemini Embedding ha lo scopo di trasformare il formato dei dati di input in una rappresentazione numerica. Sebbene Google sia responsabile di fornire un modello di incorporamento che trasforma il formato dei dati di input nel formato numerico richiesto, gli utenti mantengono la piena responsabilità dei dati inseriti e degli incorporamenti risultanti. Utilizzando il modello Gemini Embedding, confermi di detenere i diritti necessari per i contenuti caricati. Non generare contenuti che violano la proprietà intellettuale o i diritti di privacy altrui. L'utilizzo di questo servizio è soggetto alle nostre Norme relative all'uso vietato e ai Termini di servizio di Google.

Inizia a creare con gli incorporamenti

Consulta il notebook della guida rapida sugli incorporamenti per esplorare le funzionalità del modello e scoprire come personalizzare e visualizzare gli incorporamenti.

Avviso di ritiro dei modelli precedenti

I seguenti modelli verranno ritirati a ottobre 2025: - embedding-001 - embedding-gecko-001 - gemini-embedding-exp-03-07 (gemini-embedding-exp)