Entender e contar tokens


O Gemini e outros modelos de IA generativa processam entradas e saídas em uma granularidade chamada token.

Este guia explica como receber as janelas de contexto de modelos específicos e como contar tokens para casos de uso como entrada de texto, chat, entrada multimodal e instruções e ferramentas do sistema.

Sobre os tokens

Os tokens podem ser caracteres únicos, como z, ou palavras inteiras, como cat. Palavras longas são divididas em vários tokens. O conjunto de todos os tokens usados pelo modelo é chamado de vocabulário, e o processo de dividir o texto em tokens é chamado de tokenização.

Para modelos do Gemini, um token equivale a cerca de quatro caracteres. 100 tokens equivalem a cerca de 60-80 palavras em inglês.

Quando o faturamento está ativado, o custo de uma chamada para a API Gemini é determinado em parte pelo número de tokens de entrada e saída. Por isso, saber como contar os tokens pode ser útil.