Guida agli incorporamenti

Il servizio di incorporamento nell'API Gemini genera incorporamenti all'avanguardia per parole, frasi e frasi. Gli incorporamenti risultanti possono essere utilizzati per attività NLP come la ricerca semantica, la classificazione del testo e il clustering. Questa pagina descrive cosa sono gli incorporamenti ed evidenzia alcuni casi d'uso chiave per il servizio di incorporamento per aiutarti a iniziare.

Che cosa sono gli incorporamenti?

Gli incorporamenti di testo sono una tecnica di elaborazione del linguaggio naturale (NLP) che converte il testo in vettori numerici. Gli incorporamenti acquisiscono il contesto e il significato semantico, quindi un testo con significati simili Ad esempio, le frasi "Ho portato il cane dal veterinario" e "Ho portato il gatto dal veterinario" avranno degli incorporamenti vicini tra loro nello spazio vettoriale poiché entrambi descrivono un contesto simile.

Questo è importante perché sblocca molti algoritmi che possono operare sui vettori ma non direttamente sul testo.

Puoi utilizzare questi incorporamenti o vettori per confrontare testi diversi e comprendere come si relazionano. Ad esempio, se gli incorporamenti del testo "gatto" e "cane" sono vicini, puoi dedurre che queste parole sono simili per significato, contesto o entrambi. Questa funzionalità consente una varietà di casi d'uso descritti nella prossima sezione.

casi d'uso

Gli incorporamenti di testo supportano una varietà di casi d'uso di NLP. Ad esempio:

  • Recupero di informazioni: l'obiettivo è recuperare un testo semanticamente simile in base a una porzione di testo di input. Un sistema di recupero delle informazioni supporta una varietà di applicazioni, ad esempio la ricerca semantica, la risposta a domande o il riassunto. Fai riferimento al blocco note per la ricerca di documenti come esempio.
  • Classificazione: puoi utilizzare gli incorporamenti per addestrare un modello per classificare i documenti in categorie. Ad esempio, se vuoi classificare i commenti degli utenti come negativi o positivi, puoi utilizzare il servizio di incorporamento per ottenere la rappresentazione vettoriale di ogni commento per addestrare il classificatore. Per ulteriori dettagli, consulta l'esempio di classificatore Gemini.
  • Clustering: il confronto di vettori di testo può mostrarne la somiglianza o la differenza. Questa funzionalità può essere utilizzata per addestrare un modello di clustering che raggruppa testo o documenti simili e per rilevare anomalie nei dati.
  • Database vettoriale: puoi archiviare gli incorporamenti generati in un database vettoriale per migliorare la precisione e l'efficienza della tua applicazione NLP. Consulta questa pagina per scoprire come utilizzare un database vettoriale per tradurre i prompt di testo in vettori numerici.

Incorporamenti elastici

Il modello di incorporamento di testo Gemini, a partire da text-embedding-004, offre dimensioni di incorporamento elastico inferiori a 768. Puoi utilizzare gli incorporamenti elastici per generare dimensioni di output più piccole e risparmiare potenzialmente sui costi di computing e archiviazione con una minima perdita di prestazioni.

Passaggi successivi

  • Se è tutto pronto per iniziare a sviluppare, puoi trovare il codice eseguibile completo nelle guide rapide per Python, Go, Node.js e Dart (Flutter).