Facturation

Ce guide présente les différentes options de facturation de l'API Gemini, explique comment activer la facturation et surveiller l'utilisation, et fournit des réponses aux questions suivantes : questions fréquentes sur la facturation.

À propos de la facturation

La facturation de l'API Gemini repose sur deux niveaux de tarification: sans frais. (ou sans frais) et paiement à l'usage (ou paiement). Différences entre la tarification et les limites de débit entre ces niveaux et varient également selon les modèles. Pour connaître les tarifs et les limites de débit actuels, consultez la section Tarifs. Pour consulter la répartition des capacités modèle par modèle, reportez-vous à la Page des modèles Gemini.

Limites de débit

Les limites de débit sont des quotas qui limiter le nombre de requêtes ou de jetons que vous pouvez envoyer à l'API Gemini pour une période donnée. Les limites de débit peuvent s'appliquer par requête ou par jeton. Voici un exemple fictif de quotas pouvant s'appliquer à un modèle donné et à un niveau donné:

  • 10 tr/min (requêtes par minute)
  • 10 000 TPM (jetons par minute)
  • 1 000 RPD (requêtes par jour)

Dans cet exemple, si vous dépassez 10 tr/min (ou 10 000 TPM ou 1 000 RPD), Le service de l'API Gemini génère une erreur 429: RESOURCE_EXHAUSTED indiquant que vous avez dépassé la limite de trafic.

Lorsque vous activez la facturation et que vous utilisez le niveau payant, vous bénéficiez d'un tarif plus élevé et vos requêtes et réponses ne sont pas utilisées pour améliorer les produits Google. Pour en savoir plus sur l'utilisation des données pour les services payants, consultez les Conditions d'utilisation.

Cloud Billing

L'API Gemini utilise Cloud Billing pour les services de facturation. Pour utiliser le niveau payant, vous devez configurer Cloud Billing sur votre projet Cloud. Après avoir activé Cloud Billing, vous pouvez utiliser Cloud Billing Des outils de facturation pour suivre les dépenses, comprendre les coûts, effectuer des paiements et accéder Assistance Cloud Billing

Activer la facturation

Vous pouvez activer Cloud Billing à partir de Google AI Studio:

  1. Ouvrez Google AI Studio.

  2. Au bas de la barre latérale de gauche, sélectionnez Paramètres > Informations sur le forfait.

  3. Cliquez sur Configurer la facturation pour le projet de votre choix afin d'activer Cloud Billing.

Surveiller l'utilisation

Après avoir activé Cloud Billing, vous pouvez surveiller votre utilisation de l'API Gemini dans la Console Google Cloud Le nom de service de l'API est generativelanguage.googleapis.com. Dans la partie l'API Gemini est également appelée API de langage génératif.

Cloud Console

Pour en savoir plus, consultez la documentation Google Cloud sur Utilisation de l'API Monitoring.

Questions fréquentes

Cette section fournit des réponses aux questions fréquentes.

Qu'est-ce qui m'est facturé ?

Les tarifs de l'API Gemini sont basés sur les éléments suivants:

  • Saisir le nombre de jetons
  • Nombre de jetons de sortie
  • Nombre de jetons en cache
  • Durée de stockage des jetons en cache

Pour en savoir plus sur leur prix, consultez la page des tarifs.

Où puis-je consulter mon quota ?

Vous pouvez consulter votre quota et les limites du système dans la Console Google Cloud

Puis-je utiliser l'API Gemini sans frais dans l'EEE (y compris l'UE), au Royaume-Uni et en Suisse ?

Deux ensembles de modèles sont disponibles via l'API:

  1. Modèles payants, dont Gemini 1.5 Flash, Gemini 1.5 Pro et Gemini 1.0 Avantages Ces modèles ne proposeront pas de version sans frais dans l'EEE (y compris au Royaume-Uni et en Suisse. Les développeurs devront suivre les étapes nécessaires pour configurer un compte de facturation et payer à l'utilisation.
  2. Certains modèles peuvent être accessibles sans frais dans l'API Gemini. (Voir ai.google.dev/pricing pour en savoir plus sur les modèles que nous facturons ; les autres modèles sont sans frais). Vous devez toutefois configurer la facturation compte pour utiliser ces modèles.

Si je configure la facturation avec l'API Gemini, mon utilisation de Google AI Studio me sera-t-elle facturée ?

Non, l'utilisation de Google AI Studio reste sans frais, que vous configuriez ou non la facturation dans toutes les régions où la fonctionnalité est disponible, y compris l'EEE, la Suisse, le Royaume-Uni et l'UE.

Puis-je utiliser un million de jetons dans la version sans frais ?

La version sans frais de l'API Gemini diffère selon le modèle sélectionné. Pour l'instant, vous vous pouvez tester la fenêtre de contexte d'un million de jetons de différentes manières:

  • Dans Google AI Studio
  • Avec les forfaits avec paiement à l'usage
  • Avec des forfaits sans frais pour certains modèles

Découvrez les dernières limites de débit sans frais par modèle sur le page des tarifs.

Comment calculer le nombre de jetons que j'utilise ?

Utilisez le GenerativeModel.count_tokens pour compter le nombre de jetons. Consultez le Consultez le guide sur les jetons pour en savoir plus sur les jetons.

Comment la facturation est-elle gérée ?

La facturation de l'API Gemini est gérée par le Système Cloud Billing.

Les requêtes qui ont échoué sont-elles facturées ?

Si votre requête échoue et affiche une erreur 400 ou 500, aucuns frais ne vous seront facturés pour le ou jetons utilisés. Toutefois, la requête sera quand même comptabilisée dans votre quota.

L'affinage des modèles est-il payant ?

Le réglage de modèle est sans frais, mais l'inférence est réglée sont facturés au même tarif que les modèles de base.

GetTokens est-il facturé ?

Les requêtes envoyées à l'API GetTokens ne sont pas facturées et ne sont pas prises en compte quota d'inférence.

Où puis-je obtenir de l'aide concernant la facturation ?

Pour obtenir de l'aide concernant la facturation, consultez Obtenir de l'aide pour Cloud Billing