Modelli Gemini

Varianti del modello

L'API Gemini offre diversi modelli ottimizzati per casi d'uso specifici. Ecco una breve panoramica delle varianti di Gemini disponibili:

Variante del modello Input Output Ottimizzato per
Gemini 2.0 Flash
gemini-2.0-flash
Audio, immagini, video e testo Testo, immagini (sperimentale) e audio (disponibile a breve) Funzionalità di nuova generazione, velocità, pensiero, streaming in tempo reale e generazione multimodale
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite
Audio, immagini, video e testo Testo Un modello Gemini 2.0 Flash ottimizzato per l'efficienza in termini di costi e la bassa latenza
Gemini 2.0 Pro Experimental
gemini-2.0-pro-exp-02-05
Audio, immagini, video e testo Testo Il nostro modello Gemini 2.0 più potente
Gemini 1.5 Flash
gemini-1.5-flash
Audio, immagini, video e testo Testo Prestazioni rapide e versatili per una vasta gamma di attività
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
Audio, immagini, video e testo Testo Attività con volumi elevati e un livello di intelligenza inferiore
Gemini 1.5 Pro
gemini-1.5-pro
Audio, immagini, video e testo Testo Attività di ragionamento complesso che richiedono una maggiore intelligenza
Incorporamento di Gemini
gemini-embedding-exp
Testo Incorporamenti di testo Misurazione della pertinenza delle stringhe di testo
Imagen 3
imagen-3.0-generate-002
Testo Immagini Il nostro modello di generazione di immagini più avanzato

Puoi visualizzare i limiti di frequenza per ciascun modello nella pagina dei limiti di frequenza.

Gemini 2.0 Flash

Gemini 2.0 Flash offre funzionalità di nuova generazione e funzionalità migliorate, tra cui velocità superiore, utilizzo di strumenti nativi, generazione multimodale e una finestra contestuale da 1 milione di token.

Provare in Google AI Studio

Dettagli modello

Proprietà Descrizione
Codice modello models/gemini-2.0-flash
Tipi di dati supportati

Input

Audio, immagini, video e testo

Output

Testo, immagini (sperimentale) e audio(disponibile a breve)

Limiti di token[*]

Limite di token di input

1.048.576

Limite di token di output

8.192

Funzionalità

Output strutturati

Supportato

Memorizzazione nella cache

Disponibile a breve

Sintonizzazione

Non supportato

Chiamata di funzioni

Supportato

Esecuzione del codice

Supportato

Ricerca

Supportato

Generazione di immagini

Sperimentale

Utilizzo di strumenti nativi

Supportato

Generare audio

Disponibile a breve

API Multimodal Live

Sperimentale

Pensare

Sperimentale

Versions
Leggi i pattern delle versioni del modello per ulteriori dettagli.
  • Più recente: gemini-2.0-flash
  • Stabile: gemini-2.0-flash-001
  • Sperimentale: gemini-2.0-flash-exp
  • Sperimentale: gemini-2.0-flash-thinking-exp-01-21
Aggiornamento più recente Febbraio 2025
Soglia di conoscenza Agosto 2024

Gemini 2.0 Pro Experimental

Gemini 2.0 Pro è il nostro modello Gemini di seconda generazione più potente, con un'efficace capacità di ragionamento, l'utilizzo di strumenti nativi e una finestra contestuale di 2 milioni di token.

Provare in Google AI Studio

Dettagli modello

Proprietà Descrizione
Codice modello gemini-2.0-pro-exp-02-05
Tipi di dati supportati

Input

Audio, immagini, video e testo

Output

Testo

Limiti di token[*]

Limite di token di input

2.048.576

Limite di token di output

8.192

Funzionalità

Output strutturati

Supportato

Memorizzazione nella cache

Non supportato

Sintonizzazione

Non supportato

Chiamata di funzioni

Supportato

Esecuzione del codice

Supportato

Ricerca

Supportato

Generazione di immagini

Non supportato

Utilizzo di strumenti nativi

Supportato

Generare audio

Non supportato

API Multimodal Live

Non supportato

Versions
Leggi i pattern delle versioni del modello per ulteriori dettagli.
  • Sperimentale: gemini-2.0-pro-exp-02-05
  • Sperimentale: gemini-2.0-pro-exp
Aggiornamento più recente Febbraio 2025
Soglia di conoscenza Agosto 2024

Gemini 2.0 Flash-Lite

Un modello Gemini 2.0 Flash ottimizzato per l'efficienza in termini di costi e la bassa latenza.

Provare in Google AI Studio

Dettagli modello

Proprietà Descrizione
Codice modello models/gemini-2.0-flash-lite
Tipi di dati supportati

Input

Audio, immagini, video e testo

Output

Testo

Limiti di token[*]

Limite di token di input

1.048.576

Limite di token di output

8.192

Funzionalità

Output strutturati

Supportato

Memorizzazione nella cache

Non supportato

Sintonizzazione

Non supportato

Chiamata di funzioni

Non supportato

Esecuzione del codice

Non supportato

Ricerca

Non supportato

Generazione di immagini

Non supportato

Utilizzo di strumenti nativi

Non supportato

Generare audio

Non supportato

API Multimodal Live

Non supportato

Versions
Leggi i pattern delle versioni del modello per ulteriori dettagli.
  • Più recente: gemini-2.0-flash-lite
  • Stabile: gemini-2.0-flash-lite-001
Aggiornamento più recente Febbraio 2025
Soglia di conoscenza Agosto 2024

Gemini 1.5 Flash

Gemini 1.5 Flash è un modello multimodale veloce e versatile per eseguire il scaling su diverse attività.

Provare in Google AI Studio

Dettagli modello

Proprietà Descrizione
Codice modello models/gemini-1.5-flash
Tipi di dati supportati

Input

Audio, immagini, video e testo

Output

Testo

Limiti di token[*]

Limite di token di input

1.048.576

Limite di token di output

8.192

Specifiche audio/video

Numero massimo di immagini per prompt

3.600

Durata massima del video

1 ora

Durata massima dell'audio

Circa 9,5 ore

Funzionalità

Istruzioni di sistema

Supportato

Modalità JSON

Supportato

Schema JSON

Supportato

Impostazioni di sicurezza regolabili

Supportato

Memorizzazione nella cache

Supportato

Sintonizzazione

Supportato

Chiamata di funzioni

Supportato

Esecuzione del codice

Supportato

Streaming bidirezionale

Non supportato

Versions
Leggi i pattern delle versioni del modello per ulteriori dettagli.
  • Più recente: gemini-1.5-flash-latest
  • Ultima versione stabile: gemini-1.5-flash
  • Stabile:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
Aggiornamento più recente Settembre 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B è un modello di piccole dimensioni progettato per attività di intelligenza di livello inferiore.

Provare in Google AI Studio

Dettagli modello

Proprietà Descrizione
Codice modello models/gemini-1.5-flash-8b
Tipi di dati supportati

Input

Audio, immagini, video e testo

Output

Testo

Limiti di token[*]

Limite di token di input

1.048.576

Limite di token di output

8.192

Specifiche audio/video

Numero massimo di immagini per prompt

3.600

Durata massima del video

1 ora

Durata massima dell'audio

Circa 9,5 ore

Funzionalità

Istruzioni di sistema

Supportato

Modalità JSON

Supportato

Schema JSON

Supportato

Impostazioni di sicurezza regolabili

Supportato

Memorizzazione nella cache

Supportato

Sintonizzazione

Supportato

Chiamata di funzioni

Supportato

Esecuzione del codice

Supportato

Streaming bidirezionale

Non supportato

Versions
Leggi i pattern delle versioni del modello per ulteriori dettagli.
  • Più recente: gemini-1.5-flash-8b-latest
  • Ultima versione stabile: gemini-1.5-flash-8b
  • Stabile:
    • gemini-1.5-flash-8b-001
Aggiornamento più recente Ottobre 2024

Gemini 1.5 Pro

Prova Gemini 2.0 Pro Experimental, il nostro modello Gemini più avanzato finora.

Gemini 1.5 Pro è un modello multimodale di medie dimensioni ottimizzato per un'ampia gamma di attività di ragionamento. 1.5 Pro può elaborare grandi quantità di dati contemporaneamente, tra cui 2 ore di video, 19 ore di audio, codebase con 60.000 righe di codice o 2000 pagine di testo.

Provare in Google AI Studio

Dettagli modello

Proprietà Descrizione
Codice modello models/gemini-1.5-pro
Tipi di dati supportati

Input

Audio, immagini, video e testo

Output

Testo

Limiti di token[*]

Limite di token di input

2.097.152

Limite di token di output

8.192

Specifiche audio/video

Numero massimo di immagini per prompt

7200

Durata massima del video

2 ore

Durata massima dell'audio

Circa 19 ore

Funzionalità

Istruzioni di sistema

Supportato

Modalità JSON

Supportato

Schema JSON

Supportato

Impostazioni di sicurezza regolabili

Supportato

Memorizzazione nella cache

Supportato

Sintonizzazione

Non supportato

Chiamata di funzioni

Supportato

Esecuzione del codice

Supportato

Streaming bidirezionale

Non supportato

Versions
Leggi i pattern delle versioni del modello per ulteriori dettagli.
  • Più recente: gemini-1.5-pro-latest
  • Ultima versione stabile: gemini-1.5-pro
  • Stabile:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
Aggiornamento più recente Settembre 2024

Imagen 3

Imagen 3 è il nostro modello di conversione da testo a immagine di massima qualità, in grado di generare immagini con dettagli ancora migliori, illuminazione più ricca e meno artefatti che distraggono rispetto ai nostri modelli precedenti.

Dettagli modello
Proprietà Descrizione
Codice modello

API Gemini

imagen-3.0-generate-002

Tipi di dati supportati

Ingresso

Testo

Output

Immagini

Limiti di token[*]

Limite di token di input

N/D

Immagini di output

Fino a 4

Aggiornamento più recente Febbraio 2025

Embedding di Gemini (sperimentale)

Gemini embedding raggiunge un rendimento SOTA in molte dimensioni chiave, tra cui codice, multilingue e recupero.

Dettagli modello
Proprietà Descrizione
Codice modello

API Gemini

gemini-embedding-exp-03-07

Tipi di dati supportati

Ingresso

Testo

Output

Incorporamenti di testo

Limiti di token[*]

Limite di token di input

8.192

Dimensione della dimensione di output

Elastic, supporta: 3072, 1536 o 768

Aggiornamento più recente Marzo 2025

Embedding di testo e incorporamento

Incorporamento di testo

Prova il nostro nuovo modello di embedding Gemini sperimentale, che offre prestazioni all'avanguardia.

Gli embedding di testo vengono utilizzati per misurare la pertinenza delle stringhe e sono ampiamente utilizzati in molte applicazioni di IA.

text-embedding-004 ottiene un rendimento di recupero migliore e supera i modelli esistenti con dimensioni paragonabili, sui benchmark di embedding MTEB standard.

Dettagli modello
Proprietà Descrizione
Codice modello

API Gemini

models/text-embedding-004

Tipi di dati supportati

Ingresso

Testo

Output

Incorporamenti di testo

Limiti di token[*]

Limite di token di input

2048

Dimensione della dimensione di output

768

Limiti di frequenza[**] 1500 richieste al minuto
Impostazioni di sicurezza regolabili Non supportato
Aggiornamento più recente Aprile 2024

Incorporamento

Puoi utilizzare il modello di embedding per generare incorporamenti di testo per il testo di input.

Il modello di embedding è ottimizzato per la creazione di incorporamenti con 768 dimensioni per testo fino a 2048 token.

Dettagli del modello di embedding
Proprietà Descrizione
Codice modello models/embedding-001
Tipi di dati supportati

Ingresso

Testo

Output

Incorporamenti di testo

Limiti di token[*]

Limite di token di input

2048

Dimensione della dimensione di output

768

Limiti di frequenza[**] 1500 richieste al minuto
Impostazioni di sicurezza regolabili Non supportato
Aggiornamento più recente Dicembre 2023

AQA

Puoi utilizzare il modello AQA per eseguire attività correlate alla risposta alle domande attribuite (AQA) su un documento, un corpus o un insieme di passaggi. Il modello AQA restituisce le risposte alle domande basate sulle fonti fornite, oltre a stimare la probabilità di risposta.

Dettagli modello

Proprietà Descrizione
Codice modello models/aqa
Tipi di dati supportati

Ingresso

Testo

Output

Testo

Lingua supportata Inglese
Limiti di token[*]

Limite di token di input

7.168

Limite di token di output

1024

Limiti di frequenza[**] 1500 richieste al minuto
Impostazioni di sicurezza regolabili Supportato
Aggiornamento più recente Dicembre 2023

Consulta gli esempi per scoprire le funzionalità di queste varianti del modello.

[*] Un token equivale a circa 4 caratteri per i modelli Gemini. 100 token equivale a circa 60-80 parole in inglese.

Pattern dei nomi delle versioni del modello

I modelli Gemini sono disponibili nelle versioni preview o stabile. Nel codice, puoi utilizzare uno dei seguenti formati dei nomi dei modelli per specificare il modello e la versione che vuoi utilizzare.

  • Ultima: indica la versione più avanzata del modello per una generazione e una variante specificate. Il modello sottostante viene aggiornato regolarmente e potrebbe essere una versione di anteprima. Solo le app e i prototipi di test esplorativi devono utilizzare questo alias.

    Per specificare la versione più recente, utilizza il seguente pattern: <model>-<generation>-<variation>-latest. Ad esempio, gemini-1.0-pro-latest.

  • Ultima versione stabile:fa riferimento alla versione stabile più recente rilasciata per la generazione e la variazione del modello specificati.

    Per specificare la versione stabile più recente, utilizza il seguente pattern: <model>-<generation>-<variation>. Ad esempio, gemini-1.0-pro.

  • Stabile:indica un modello stabile specifico. I modelli stabili di solito non cambiano. La maggior parte delle app di produzione dovrebbe utilizzare un modello stabile specifico.

    Per specificare una versione stabile, utilizza il seguente pattern: <model>-<generation>-<variation>-<version>. Ad esempio, gemini-1.0-pro-001.

  • Sperimentale:indica un modello sperimentale (non per l'uso in produzione). Lanciamo modelli sperimentali per raccogliere feedback, mettere rapidamente a disposizione degli sviluppatori i nostri aggiornamenti più recenti e mettere in evidenza il ritmo dell'innovazione in Google.

    Per specificare una versione sperimentale, utilizza il seguente pattern: <model>-<generation>-<variation>-<version>. Ad esempio, gemini-2.0-pro-exp-02-05.

Modelli sperimentali

Oltre ai modelli pronti per la produzione, l'API Gemini offre modelli sperimentali (non per l'uso in produzione, come definito nei nostri Termini).

L'obiettivo del rilascio di modelli sperimentali è raccogliere feedback, mettere rapidamente a disposizione degli sviluppatori gli aggiornamenti più recenti e mettere in evidenza il ritmo dell'innovazione in Google. Ciò che impariamo dai lanci sperimentali definisce il modo in cui rilasciamo i modelli a un pubblico più ampio. Un modello sperimentale può essere sostituito con un altro senza preavviso. Non garantiamo che un modello sperimentale diventerà un modello stabile in futuro.

Modelli sperimentali precedenti

Man mano che diventano disponibili nuove versioni o release stabili, rimuoviamo e sostituiamo i modelli sperimentali. Puoi trovare i modelli sperimentali precedenti che abbiamo rilasciato nella sezione seguente, insieme alla versione sostitutiva:

Codice modello Modello di base Versione sostitutiva
gemini-2.0-flash-exp Gemini 2.0 Flash gemini-2.0-flash
gemini-exp-1206 Gemini 2.0 Pro gemini-2.0-pro-exp-02-05
gemini-2.0-flash-thinking-exp-1219 Gemini 2.0 Flash Thinking gemini-2.0-flash-thinking-exp-01-21
gemini-exp-1121 Gemini gemini-exp-1206
gemini-exp-1114 Gemini gemini-exp-1206
gemini-1.5-pro-exp-0827 Gemini 1.5 Pro gemini-exp-1206
gemini-1.5-pro-exp-0801 Gemini 1.5 Pro gemini-exp-1206
gemini-1.5-flash-8b-exp-0924 Gemini 1.5 Flash-8B gemini-1.5-flash-8b
gemini-1.5-flash-8b-exp-0827 Gemini 1.5 Flash-8B gemini-1.5-flash-8b

Lingue supportate

I modelli Gemini vengono addestrati per funzionare con le seguenti lingue:

  • Arabo (ar)
  • Bengali (bn)
  • Bulgaro (bg)
  • Cinese semplificato e tradizionale (zh)
  • Croato (hr)
  • Ceco (cs)
  • Danese (da)
  • Olandese (nl)
  • Inglese (en)
  • Estone (et)
  • Finlandese (fi)
  • Francese (fr)
  • Tedesco (de)
  • Greco (el)
  • Ebraico (iw)
  • Hindi (hi)
  • Ungherese (hu)
  • Indonesian (id)
  • Italiano (it)
  • Giapponese (ja)
  • Coreano (ko)
  • Lettone (lv)
  • Lituano (lt)
  • Norvegese (no)
  • Polacco (pl)
  • Portoghese (pt)
  • Rumeno (ro)
  • Russo (ru)
  • Serbo (sr)
  • Slovacco (sk)
  • Sloveno (sl)
  • Spagnolo (es)
  • Swahili (sw)
  • Svedese (sv)
  • Thailandese (th)
  • Turco (tr)
  • Ucraino (uk)
  • Vietnamita (vi)