Guia de embeddings

O serviço de embedding na API Gemini gera embeddings de última geração para palavras, frases e sentenças. Os embeddings resultantes podem ser usados para tarefas de PLN, como pesquisa semântica, classificação de texto e clustering, entre muitos outros. Esta página descreve o que são embeddings e destaca alguns casos de uso importantes do serviço de embedding para ajudar você a começar.

O que são embeddings?

Embeddings de texto são uma técnica de processamento de linguagem natural (PLN) que converte texto em vetores numéricos. Os embeddings capturam significado semântico e contexto, resultando em um texto com significados semelhantes com embeddings mais próximos. Por exemplo, as frases "Levei meu cachorro ao veterinário" e "Levei meu gato ao veterinário" teriam embeddings próximos uns dos outros no espaço vetorial, já que ambas descrevem um contexto semelhante.

Isso é importante porque desbloqueia muitos algoritmos que podem operar em vetores, mas não diretamente no texto.

É possível usar esses embeddings ou vetores para comparar diferentes textos e entender como eles se relacionam. Por exemplo, se os embeddings do texto "gato" e "cão" estiverem próximos, você poderá inferir que essas palavras são semelhantes em significado, contexto ou ambos. Esse recurso permite vários casos de uso descritos na próxima seção.

Casos de uso

Os embeddings de texto servem para vários casos de uso de PLN. Exemplo:

Embeddings flexíveis

O modelo Gemini Text Embedding, começando com text-embedding-004, oferece tamanhos de embedding elásticos abaixo de 768. É possível usar embeddings elásticos para gerar dimensões de saída menores e economizar custos de computação e armazenamento com pequena perda de desempenho.

A seguir

  • Se estiver tudo pronto para começar a desenvolver, você poderá encontrar o código executável completo nos guias de início rápido para Python, Go, Node.js e Dart (Flutter).