Questa guida fornisce una panoramica delle diverse opzioni di fatturazione dell'API Gemini, spiega come abilitare la fatturazione e monitorare l'utilizzo e fornisce risposte a domande frequenti sulla fatturazione.
Informazioni sulla fatturazione
La fatturazione per l'API Gemini si basa su due livelli di prezzo: senza costi (o senza costi) e pagamento a consumo (o a pagamento). I limiti di tariffa e di prezzo sono diversi tra questi livelli e variano anche in base al modello. Per i prezzi e le limitazioni di frequenza correnti, consulta la sezione Prezzi. Per un'analisi delle funzionalità di ogni modello, consulta Pagina dei modelli Gemini.
Limiti di frequenza
I limiti di frequenza sono quote che limitare il numero di richieste o token che puoi inviare all'API Gemini in un in un determinato intervallo di tempo. Possono essere applicati limiti di frequenza per richiesta o per token. Ecco un esempio fittizio di quote che potrebbero essere applicate a un determinato modello in un determinato livello:
- 10 RPM (richieste al minuto)
- 10.000 TPM (token al minuto)
- 1000 RPD (richieste al giorno)
In questo esempio, se superi i 10 RPM (o 10.000 TPM o 1000 RPD),
Il servizio API Gemini genera un errore 429: RESOURCE_EXHAUSTED
che indica
che hai superato il limite di frequenza.
Perché usare il livello a pagamento?
Abilitando la fatturazione e utilizzando il livello a pagamento, puoi beneficiare di una tariffa più alta Inoltre, le tue richieste e le tue risposte non vengono utilizzate per migliorare i prodotti Google. Per ulteriori informazioni sull'utilizzo dei dati per i servizi a pagamento, vedi Termini di servizio.
Cloud Billing
L'API Gemini utilizza Fatturazione Cloud per i servizi di fatturazione. Per utilizzare il livello a pagamento, devi configurare la fatturazione Cloud per il tuo progetto cloud. Dopo aver abilitato la fatturazione Cloud, puoi utilizzare Cloud Strumenti di fatturazione per monitorare le spese, comprendere i costi, effettuare pagamenti e accedere assistenza per la fatturazione Cloud.
Abilita fatturazione
Puoi abilitare la fatturazione Cloud a partire da Google AI Studio:
Apri Google AI Studio.
In fondo alla barra laterale sinistra, seleziona Impostazioni > Informazioni sul piano.
Fai clic su Configura la fatturazione per il progetto che hai scelto per attivare la fatturazione Cloud.
Monitoraggio dell'utilizzo
Dopo aver abilitato la fatturazione Cloud, puoi monitorare il tuo utilizzo dell'API Gemini in
il
Console Google Cloud.
Il nome del servizio dell'API è generativelanguage.googleapis.com
e nella
L'API Gemini è detta anche API Generative Language.
Per saperne di più, consulta la documentazione di Google Cloud su monitoraggio dell'utilizzo delle API.
Domande frequenti
Questa sezione fornisce risposte alle domande frequenti.
Che cosa mi viene addebitato?
I prezzi dell'API Gemini si basano su quanto segue:
- Conteggio token di input
- Conteggio token di output
- Conteggio token memorizzati nella cache
- Durata dell'archiviazione dei token memorizzati nella cache
Per informazioni sui prezzi, consulta la pagina dei prezzi.
Dove posso visualizzare la mia quota?
Puoi visualizzare i limiti di quota e di sistema nel Console Google Cloud.
Posso utilizzare l'API Gemini senza costi nel SEE (UE inclusa), nel Regno Unito e in Svizzera?
L'API mette a disposizione due set di modelli:
- Modelli a pagamento che includono Gemini 1.5 Flash, Gemini 1.5 Pro e Gemini 1.0 Pro. Questi modelli non avranno un Livello senza costi disponibile nel SEE (tra cui UE), nel Regno Unito e in Svizzera. Gli sviluppatori dovranno seguire i passaggi necessari per configurare un account di fatturazione e pagare per l'utilizzo.
- Alcuni modelli potrebbero essere accessibili senza costi nell'API Gemini. (Vedi ai.google.dev/pricing per informazioni dettagliate sui modelli addebitati. gli altri modelli sono senza costi). Tuttavia, dovrai comunque configurare un account per utilizzare questi modelli.
Se configuro la fatturazione con l'API Gemini, mi verrà addebitato l'utilizzo di Google AI Studio?
No, l'utilizzo di Google AI Studio rimane senza costi indipendentemente dalla configurazione e la fatturazione in tutte le regioni supportate, tra cui SEE, UE, Regno Unito e Svizzera.
Posso utilizzare 1 milione di token nel livello senza costi?
Il livello senza costi per l'API Gemini varia in base al modello selezionato. Per il momento, puoi provare la finestra contestuale da 1 milione di token nei seguenti modi:
- In Google AI Studio
- Con piani di pagamento a consumo
- Con piani senza costi per alcuni modelli
Scopri i più recenti limiti di frequenza senza costi per modello sulla pagina dei prezzi.
Come faccio a calcolare il numero di token che utilizzo?
Utilizza la GenerativeModel.count_tokens
per contare il numero di token. Consulta le
Guida ai token per scoprire di più sui token.
Come viene gestita la fatturazione?
La fatturazione dell'API Gemini è gestita dal Sistema di fatturazione Cloud.
Mi vengono addebitati i costi per le richieste non riuscite?
Se la richiesta non va a buon fine e restituisce un errore 400 o 500, non ti verrà addebitato il costo utilizzati. Tuttavia, la richiesta verrà comunque conteggiata ai fini della quota.
È previsto un costo per il perfezionamento dei modelli?
L'ottimizzazione del modello è senza costi, ma l'inferenza è ottimizzata vengono addebitati alla stessa tariffa dei modelli base.
I GetToken vengono fatturati?
Le richieste all'API GetTokens non vengono fatturate e non sono conteggiate ai fini del calcolo quota di inferenza.
Dove posso ricevere assistenza per la fatturazione?
Per ricevere assistenza in merito alla fatturazione, consulta: Ricevi assistenza per la fatturazione Cloud.