Comprender y contar tokens


Gemini y otros modelos de IA generativa procesan las entradas y salidas con un nivel de detalle llamado token.

En esta guía, se explica cómo obtener las ventanas de contexto de modelos específicos y cómo contar tokens para casos de uso como entrada de texto, chat, entrada multimodal, así como instrucciones y herramientas del sistema.

Información acerca de los tokens

Los tokens pueden ser caracteres individuales, como z, o palabras completas, como cat. Las palabras largas se dividen en varios tokens. El conjunto de todos los tokens que usa el modelo se llama vocabulario, y el proceso de dividir el texto en tokens se denomina tokenización.

En los modelos de Gemini, un token equivale a unos 4 caracteres. 100 tokens equivalen a entre 60 y 80 palabras en inglés.

Cuando la facturación está habilitada, el costo de una llamada a la API de Gemini se determina en parte por la cantidad de tokens de entrada y salida, por lo que puede ser útil saber cómo contar tokens.