Fatturazione

Questa guida fornisce una panoramica delle diverse opzioni di fatturazione dell'API Gemini, spiega come attivare la fatturazione e monitorare l'utilizzo e fornisce risposte alle domande frequenti sulla fatturazione.

Informazioni sulla fatturazione

La fatturazione dell'API Gemini si basa su due fasce di prezzo: senza costi (o senza costi) e a consumo (o a pagamento). I prezzi e i limiti di tariffa differiscono tra questi livelli e variano anche in base al modello. Per i prezzi e i limiti di tariffa attuali, consulta Prezzi. Per un'analisi dettagliata delle funzionalità per modello, consulta la pagina Modelli Gemini.

Limiti di frequenza

I limiti di frequenza sono quote che regolano il numero di richieste che puoi inviare all'API Gemini in un determinato periodo di tempo. Questi limiti contribuiscono a garantire un utilizzo corretto, a proteggere da abusi e a mantenere un rendimento ottimale per tutti gli utenti.

I limiti di frequenza hanno diverse funzioni essenziali:

  • Prevenzione di abusi:proteggono l'API da malintenzionati che tentano di interrompere o sovraccaricare il sistema.
  • Garantire un accesso equo:i limiti di frequenza impediscono a un singolo utente di monopolizzare le risorse dell'API, garantendo un'esperienza fluida per tutti.
  • Gestisci il carico dell'infrastruttura: controllando il volume delle richieste, i limiti di frequenza contribuiscono a mantenere le prestazioni dell'API coerenti e a evitare il sovraccarico del server.

Ecco un esempio fittizio di quote che potrebbero essere applicate a un determinato modello in un determinato livello:

  • 10 RPM (richieste al minuto)
  • 10.000 TPM (token al minuto)
  • 1000 RPD (richieste al giorno)

In questo esempio, se superi 10 RPM (o 10.000 TPM o 1.000 RPD), il servizio API Gemini genera un errore 429: RESOURCE_EXHAUSTED che indica che hai superato il limite di frequenza.

Come funzionano i limiti di frequenza

I limiti di frequenza vengono misurati in quattro dimensioni:

  • Richieste al minuto (RPM)
  • Richieste al giorno (RPD)
  • Token al minuto (TPM)
  • Immagini al minuto (IPM)

Il tuo utilizzo viene valutato in base a ciascun limite e il superamento di uno di questi attiverà un errore di limite di frequenza. Ad esempio, se il limite di RPM è 20, l'invio di 21 richieste in un minuto comporterà un errore, anche se non hai superato il TPM o altri limiti.

I limiti di frequenza vengono applicati per progetto, non per chiave API.

I limiti variano a seconda del modello specifico utilizzato e alcuni si applicano solo a modelli specifici. Ad esempio, l'IPM viene calcolato solo per i modelli in grado di generare immagini.

Aumenti dei livelli di utilizzo e dei limiti di frequenza

I limiti di frequenza sono legati al livello di utilizzo del progetto. Man mano che l'utilizzo e la spesa per le API aumentano, avrai la possibilità di eseguire l'upgrade a un livello superiore con limiti di tariffa più elevati.

Livello Requisiti
Gratis Utenti nei paesi idonei
Livello 1 Account di fatturazione collegato
Livello 2 Spesa totale: 250 $; la spesa totale richiesta è scaduta da almeno 30 giorni

Quando richiedi un upgrade, il nostro sistema automatico di protezione da abusi esegue controlli aggiuntivi. Anche se in genere è sufficiente soddisfare i criteri di idoneità indicati per ottenere l'approvazione, in rari casi una richiesta di upgrade potrebbe essere rifiutata in base ad altri fattori identificati durante la procedura di revisione.

Questo sistema contribuisce a garantire la sicurezza e l'integrità della piattaforma API Gemini per tutti gli utenti.

Come richiedere un upgrade

L'API Gemini utilizza Cloud Billing per tutti i servizi di fatturazione. Per passare dal livello senza costi a un livello a pagamento, devi prima attivare la fatturazione Cloud per il tuo progetto Google Cloud.

Quando il progetto soddisfa i criteri specificati, diventa idoneo per un upgrade al livello successivo. Per richiedere un upgrade:

  1. Vai alla pagina Chiavi API di AI Studio.
  2. Individua il progetto di cui vuoi eseguire l'upgrade e fai clic su Esegui l'upgrade.
  3. Il sistema verificherà automaticamente l'idoneità del tuo progetto. Questa procedura richiede alcuni secondi.
  4. Se il progetto soddisfa tutti i requisiti, verrà eseguito immediatamente l'upgrade al livello successivo.

Se attivi la fatturazione e utilizzi il livello a pagamento, puoi usufruire di limiti di frequenza più elevati e i tuoi prompt e le tue risposte non vengono utilizzati per migliorare i prodotti Google. Per ulteriori informazioni sull'utilizzo dei dati per i servizi a pagamento, consulta i Termini di servizio.

Cloud Billing

L'API Gemini utilizza Cloud Billing per i servizi di fatturazione. Per utilizzare il livello a pagamento, devi configurare la fatturazione Cloud nel tuo progetto cloud. Dopo aver attivato la fatturazione Cloud, puoi utilizzare gli strumenti di fatturazione Cloud per monitorare la spesa, comprendere i costi, effettuare pagamenti e accedere all'assistenza per la fatturazione Cloud.

Abilita fatturazione

Puoi attivare la fatturazione Cloud da Google AI Studio:

  1. Apri Google AI Studio.

  2. Nella parte inferiore della barra laterale sinistra, seleziona Impostazioni > Informazioni sul piano.

  3. Fai clic su Configura la fatturazione per il progetto scelto per attivare la fatturazione Cloud.

Monitorare l'utilizzo

Dopo aver attivato la fatturazione cloud, puoi monitorare l'utilizzo dell'API Gemini nella console Google Cloud. Il nome del servizio per l'API è generativelanguage.googleapis.com e nella console l'API Gemini è indicata anche come API Generative Language.

console Cloud

Per saperne di più, consulta la documentazione di Google Cloud sul monitoraggio dell'utilizzo delle API.

Domande frequenti

Questa sezione fornisce risposte alle domande frequenti.

A che cosa si riferiscono gli addebiti che ricevo?

I prezzi dell'API Gemini si basano su quanto segue:

  • Conteggio dei token di input
  • Conteggio dei token di output
  • Conteggio token memorizzati nella cache
  • Durata di archiviazione dei token memorizzati nella cache

Per informazioni sui prezzi, consulta la pagina dei prezzi.

Dove posso visualizzare la mia quota?

Puoi visualizzare la quota e i limiti di sistema nella console Google Cloud.

Come faccio a richiedere una quota maggiore?

Per richiedere una quota maggiore, segui le istruzioni riportate in Come richiedere un upgrade.

Posso utilizzare l'API Gemini senza costi nel SEE (inclusa l'UE), nel Regno Unito e in Svizzera?

Sì, il livello senza costi e quello a pagamento sono disponibili in molte regioni.

Se configuro la fatturazione con l'API Gemini, mi verrà addebitato l'utilizzo di Google AI Studio?

No, l'utilizzo di Google AI Studio rimane senza costi, indipendentemente dal fatto che tu abbia configurato la fatturazione in tutte le regioni supportate.

Posso utilizzare 1 milione di token nel livello senza costi?

Il livello senza costi per l'API Gemini varia in base al modello selezionato. Per il momento, puoi provare la finestra contestuale da 1 milione di token nei seguenti modi:

  • In Google AI Studio
  • Con i piani di pagamento a consumo
  • Con piani senza costi per alcuni modelli

Consulta i limiti di tariffa senza costi per modello più recenti nella pagina dei prezzi.

Come faccio a calcolare il numero di token che sto utilizzando?

Utilizza il metodo GenerativeModel.count_tokens per conteggiare il numero di token. Per saperne di più sui token, consulta la guida ai token.

Posso utilizzare i miei crediti Google Cloud con l'API Gemini?

Sì, i crediti Google Cloud possono essere utilizzati per l'utilizzo dell'API Gemini.

Come viene gestita la fatturazione?

La fatturazione dell'API Gemini è gestita dal sistema Cloud Billing.

Mi vengono addebitate le richieste non riuscite?

Se la richiesta non va a buon fine con un errore 400 o 500, non ti verrà addebitato alcun importo per i token utilizzati. Tuttavia, la richiesta verrà comunque conteggiata ai fini del calcolo della quota.

Viene applicato un costo per l'ottimizzazione dei modelli?

L'ottimizzazione del modello è senza costi, ma l'inferenza sui modelli ottimizzati viene addebitata alla stessa tariffa dei modelli di base.

GetTokens viene fatturato?

Le richieste all'API GetTokens non vengono fatturate e non vengono conteggiate ai fini della quota di inferenza.

Consulta i termini per informazioni dettagliate su come vengono gestiti i dati quando la fatturazione Cloud è attivata (vedi "In che modo Google utilizza i dati" nella sezione "Servizi a pagamento"). Tieni presente che i prompt di Google AI Studio sono trattati ai sensi degli stessi termini "Servizi a pagamento", a condizione che la fatturazione sia attivata per almeno un progetto API, che puoi convalidare nella pagina della chiave API Gemini se visualizzi progetti contrassegnati come "A pagamento" in "Piano".

Dove posso ricevere assistenza per la fatturazione?

Per ricevere assistenza in merito alla fatturazione, consulta la pagina Ricevere assistenza per la fatturazione Cloud.