Al prezzo di aiutarti a far conoscere la tua app al mondo
Disponibile ora
Disponibile ora
Disponibile ora
Il nostro modello multimodale più veloce con ottime prestazioni per attività diverse e ripetitive e una finestra contestuale di 1 milione. Ora in disponibilità generale per l'uso in produzione.
Senza costi*
Limiti di frequenza**
15 RPM (richieste al minuto)
1 milione di TPM (token al minuto)
1500 RPD (richieste al giorno)
Prezzo (input)
Senza costi
Memorizzazione nella cache del contesto
Senza costi, fino a 1 milione di token di spazio di archiviazione all'ora
Prezzo (output)
Senza costi
Prompt/risposte utilizzati per migliorare i nostri prodotti
Pagamento a consumo (prezzi in USD)***
Limiti di frequenza**
1000 RPM (richieste al minuto)
4 milioni di TPM (token al minuto)
Prezzo (input)
0,35 $ / 1 milione di token (per prompt fino a 128.000 token)
0,70 $ / 1 milione di token (per prompt più lunghi di 128.000)
Memorizzazione nella cache del contesto
$0,0875 / 1 milione di token (per prompt fino a 128.000 token)
0,175 $ / 1 milione di token (per prompt più lunghi di 128.000)
1,00 $ / 1 milione di token all'ora (archiviazione)
Prezzo (output)
1,05 $ / 1 milione di token (per prompt fino a 128.000 token)
$2,10 / 1 milione di token (per prompt più lunghi di 128.000)
Prompt/risposte utilizzati per migliorare i nostri prodotti
Il nostro modello di nuova generazione con una finestra contestuale innovativa da 2 milioni. Ora in disponibilità generale per l'uso in produzione.
Senza costi*
Limiti di frequenza**
2 RPM (richieste al minuto)
32.000 TPM (token al minuto)
50 RPD (richieste al giorno)
Prezzo (input)
Senza costi
Memorizzazione nella cache del contesto
Non applicabile
Prezzo (output)
Senza costi
Prompt/risposte utilizzati per migliorare i nostri prodotti
Pagamento a consumo (prezzi in USD)***
Limiti di frequenza**
360 RPM (richieste al minuto)
4 milioni di TPM (token al minuto)
10.000 RPD (richieste al giorno)
Prezzo (input)
$3,50 / 1 milione di token (per prompt fino a 128.000 token)
$7,00 / 1 milione di token (per prompt più lunghi di 128.000)
Memorizzazione nella cache del contesto
0,875 $ / 1 milione di token (per prompt fino a 128.000 token)
$1,75 / 1 milione di token (per prompt più lunghi di 128.000)
4,50 $ / 1 milione di token all'ora (archiviazione)
Prezzo (output)
10,50 $ / 1 milione di token (per prompt fino a 128.000 token)
$21,00 / 1 milione di token (per prompt più lunghi di 128.000)
Prompt/risposte utilizzati per migliorare i nostri prodotti
Il nostro modello di prima generazione che offre solo ragionamento con testo e immagini. Generalmente disponibile per l'uso in produzione.
Senza costi*
Limiti di frequenza**
15 RPM (richieste al minuto)
32.000 TPM (token al minuto)
1500 RPD (richieste al giorno)
Prezzo (input)
Senza costi
Memorizzazione nella cache del contesto
Non applicabile
Prezzo (output)
Senza costi
Prompt/risposte utilizzati per migliorare i nostri prodotti
Pagamento a consumo (prezzi in USD)***
Limiti di frequenza**
360 RPM (richieste al minuto)
120.000 TPM (token al minuto)
30.000 RPD (richieste al giorno)
Prezzo (input)
$0,50 / 1 milione di token
Memorizzazione nella cache del contesto
Non disponibile
Prezzo (output)
$1,50 / 1 milione di token
Prompt/risposte utilizzati per migliorare i nostri prodotti
*Le limitazioni all'utilizzo del livello senza costi dell'API Gemini si applicano a SEE (inclusa UE), Regno Unito e Svizzera. Consulta Domande frequenti sulla fatturazione per maggiori dettagli.
**I limiti di frequenza specificati non sono garantiti e la capacità effettiva potrebbe variare. Richiedi un limite di frequenza massimo aumentato (solo per il livello a pagamento).
***I costi di inferenza del modello ottimizzato vengono fatturati allo stesso prezzo dei modelli di base. Per ricevere assistenza in merito alla fatturazione, consulta: Assistenza per la fatturazione Cloud.
****I prezzi possono essere diversi da quelli elencati qui e dai prezzi offerti su Vertex AI. Per i prezzi di Vertex, consulta documentazione di Vertex.
Crea con Vertex AI su Google Cloud