Grounding con la Ricerca Google è ora disponibile. Scopri di più

Questa pagina è stata tradotta dall'API Cloud Translation.

Modelli Gemini

1.5 Flash

Il nostro modello multimodale più equilibrato con ottime prestazioni per la maggior parte delle attività

Inserisci audio, immagini, video e testo e ricevi risposte di testo
Genera codice, estrae dati, modifica testo e altro ancora
Ideale per le attività che bilanciano prestazioni e costi

1.5 Flash-8B

Il nostro modello multimodale più veloce ed economico con ottime prestazioni per attività ad alta frequenza

Inserisci audio, immagini, video e testo e ricevi risposte di testo
Genera codice, estrae dati, modifica testo e altro ancora
Ideale per attività ad alta frequenza con un'intelligenza inferiore

1.5 Pro

Il nostro modello multimodale con il rendimento migliore, con funzionalità per una vasta gamma di attività di ragionamento

Inserisci audio, immagini, video e testo e ricevi risposte di testo
Genera codice, estrae dati, modifica testo e altro ancora
Per quando hai bisogno di un aumento delle prestazioni

Varianti del modello

L'API Gemini offre diversi modelli ottimizzati per casi d'uso specifici. Ecco una breve panoramica delle varianti di Gemini disponibili:

Variante del modello	Input	Output	Ottimizzato per
Gemini 1.5 Flash `gemini-1.5-flash`	Audio, immagini, video e testo	Testo	Prestazioni rapide e versatili per una vasta gamma di attività
Gemini 1.5 Flash-8B `gemini-1.5-flash-8b`	Audio, immagini, video e testo	Testo	Attività con volumi elevati e un livello di intelligenza inferiore
Gemini 1.5 Pro `gemini-1.5-pro`	Audio, immagini, video e testo	Testo	Attività di ragionamento complesso che richiedono una maggiore intelligenza
Gemini 1.0 Pro (ritirato il 15/02/2025) `gemini-1.0-pro`	Testo	Testo	Attività di elaborazione del linguaggio naturale, chat di testo e codice in più passaggi e generazione di codice
Incorporamento di testo `text-embedding-004`	Testo	Incorporamenti di testo	Misurazione della pertinenza delle stringhe di testo
AQA `aqa`	Testo	Testo	Fornire risposte alle domande basate su fonti

Gemini 1.5 Flash

Gemini 1.5 Flash è un modello multimodale veloce e versatile per eseguire il scaling su diverse attività.

Provare in AI Studio

Dettagli modello

Proprietà	Descrizione
Codice modello	`models/gemini-1.5-flash`
Tipi di dati supportati	Input Audio, immagini, video e testo Output Testo
Limiti di token^[*]	Limite di token di input 1.048.576 Limite di token di output 8.192
Specifiche audio/video	Numero massimo di immagini per prompt 3.600 Durata massima del video 1 ora Durata massima dell'audio Circa 9,5 ore
Limiti di velocità^[**]	Nessun costo: 15 RPM 1 milione di TPM 1500 RPD Pay-as-you-go: 2000 rpm 4 milioni di TPM
Funzionalità	Istruzioni di sistema Supportato Modalità JSON Supportato Schema JSON Supportato Impostazioni di sicurezza regolabili Supportato Memorizzazione nella cache Supportato Sintonizzazione Supportato Chiamata di funzioni Supportato Esecuzione del codice Supportato
Versions	Leggi i pattern delle versioni del modello per maggiori dettagli. Più recente: `gemini-1.5-flash-latest` Ultima versione stabile: `gemini-1.5-flash` Stabile: `gemini-1.5-flash-001` `gemini-1.5-flash-002` Sperimentale: `gemini-1.5-flash-8b-exp-0924` `gemini-1.5-flash-8b-exp-0827` `gemini-1.5-flash-exp-0827`
Aggiornamento più recente	Settembre 2024

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B è un piccolo modello progettato per attività di intelligenza di livello inferiore.

Provare in AI Studio

Dettagli modello

Proprietà	Descrizione
Codice modello	`models/gemini-1.5-flash-8b`
Tipi di dati supportati	Input Audio, immagini, video e testo Output Testo
Limiti di token^[*]	Limite di token di input 1.048.576 Limite di token di output 8.192
Specifiche audio/video	Numero massimo di immagini per prompt 3.600 Durata massima del video 1 ora Durata massima dell'audio Circa 9,5 ore
Limiti di velocità^[**]	Nessun costo: 15 RPM 1 milione di TPM 1500 RPD Pay-as-you-go: 4000 rpm 4 milioni di TPM
Funzionalità	Istruzioni di sistema Supportato Modalità JSON Supportato Schema JSON Supportato Impostazioni di sicurezza regolabili Supportato Memorizzazione nella cache Supportato Sintonizzazione Supportato Chiamata di funzioni Supportato Esecuzione del codice Supportato
Versions	Leggi i pattern delle versioni del modello per maggiori dettagli. Più recente: `gemini-1.5-flash-8b-latest` Ultima versione stabile: `gemini-1.5-flash-8b` Stabile: `gemini-1.5-flash-8b-001`
Aggiornamento più recente	Ottobre 2024

Gemini 1.5 Pro

Gemini 1.5 Pro è un modello multimodale di medie dimensioni ottimizzato per un'ampia gamma di attività di ragionamento. 1.5 Pro può elaborare grandi quantità di dati contemporaneamente, tra cui 2 ore di video, 19 ore di audio, codebase con 60.000 righe di codice o 2000 pagine di testo.

Provare in AI Studio

Dettagli modello

Proprietà	Descrizione
Codice modello	`models/gemini-1.5-pro`
Tipi di dati supportati	Input Audio, immagini, video e testo Output Testo
Limiti di token^[*]	Limite di token di input 2.097.152 Limite di token di output 8.192
Specifiche audio/video	Numero massimo di immagini per prompt 7200 Durata massima del video 2 ore Durata massima dell'audio Circa 19 ore
Limiti di velocità^[**]	Nessun costo: 2 RPM 32.000 TPM 50 RPD Pay-as-you-go: 1000 RPM 4 milioni di TPM
Funzionalità	Istruzioni di sistema Supportato Modalità JSON Supportato Schema JSON Supportato Impostazioni di sicurezza regolabili Supportato Memorizzazione nella cache Supportato Sintonizzazione Non supportato Chiamata di funzioni Supportato Esecuzione del codice Supportato
Versions	Leggi i pattern delle versioni del modello per maggiori dettagli. Più recente: `gemini-1.5-pro-latest` Ultima versione stabile: `gemini-1.5-pro` Stabile: `gemini-1.5-pro-001` `gemini-1.5-pro-002` Sperimentale: `gemini-1.5-pro-exp-0827`
Aggiornamento più recente	Settembre 2024

Gemini 1.0 Pro (non più supportato)

Gemini 1.0 Pro è un modello di elaborazione del linguaggio naturale che gestisce attività come chat di testo e codice in più passaggi e generazione di codice.

Provare in AI Studio

Dettagli modello

Proprietà	Descrizione
Codice modello	`models/gemini-1.0-pro`
Tipi di dati supportati	Ingresso Testo Output Testo
Limiti di velocità^[**]	Nessun costo: 15 RPM 32.000 TPM 1500 RPD Pay-as-you-go: 360 RPM 120.000 TPM 30.000 RPD
Funzionalità	Istruzioni di sistema Non supportato Modalità JSON Non supportato Schema JSON Non supportato Impostazioni di sicurezza regolabili Supportato Memorizzazione nella cache Non supportato Sintonizzazione Supportato Chiamata di funzioni Supportato Configurazione delle chiamate di funzione Non supportato Esecuzione del codice Non supportato
Versions	Più recente: `gemini-1.0-pro-latest` Ultima versione stabile: `gemini-1.0-pro` Stabile: `gemini-1.0-pro-001`
Aggiornamento più recente	Febbraio 2024

Nota: gemini-pro è un alias per gemini-1.0-pro.

Embedding di testo e incorporamento

Incorporamento di testo

Gli embedding di testo vengono utilizzati per misurare la pertinenza delle stringhe e sono ampiamente utilizzati in molte applicazioni di IA.

text-embedding-004 ottiene un rendimento di recupero migliore e supera i modelli esistenti con dimensioni paragonabili, sui benchmark di embedding MTEB standard.

Dettagli modello

Proprietà	Descrizione
Codice modello	API Gemini `models/text-embedding-004`
Tipi di dati supportati	Ingresso Testo Output Incorporamenti di testo
Limiti di token^[*]	Limite di token di input 2048 Dimensione della dimensione di output 768
Limiti di velocità^[**]	1500 richieste al minuto
Impostazioni di sicurezza regolabili	Non supportato
Aggiornamento più recente	Aprile 2024

Incorporamento

Puoi utilizzare il modello di embedding per generare incorporamenti di testo per il testo di input.

Il modello di embedding è ottimizzato per la creazione di incorporamenti con 768 dimensioni per testo fino a 2048 token.

Dettagli del modello di embedding

Proprietà	Descrizione
Codice modello	`models/embedding-001`
Tipi di dati supportati	Ingresso Testo Output Incorporamenti di testo
Limiti di token^[*]	Limite di token di input 2048 Dimensione della dimensione di output 768
Limiti di velocità^[**]	1500 richieste al minuto
Impostazioni di sicurezza regolabili	Non supportato
Aggiornamento più recente	Dicembre 2023

AQA

Puoi utilizzare il modello AQA per eseguire attività correlate alla risposta alle domande attribuita (AQA) su un documento, un corpus o un insieme di passaggi. Il modello AQA restituisce le risposte alle domande basate sulle fonti fornite, oltre a stimare la probabilità di risposta.

Dettagli modello

Proprietà	Descrizione
Codice modello	`models/aqa`
Tipi di dati supportati	Ingresso Testo Output Testo
Lingua supportata	Inglese
Limiti di token^[*]	Limite di token di input 7.168 Limite di token di output 1024
Limiti di velocità^[**]	1500 richieste al minuto
Impostazioni di sicurezza regolabili	Supportato
Aggiornamento più recente	Dicembre 2023

Consulta gli esempi per scoprire le funzionalità di queste varianti del modello.

[*] Un token equivale a circa 4 caratteri per i modelli Gemini. 100 token equivale a circa 60-80 parole in inglese.

[**] RPM: richieste al minuto
TPM: token al minuto
RPD: richieste al giorno
TPD: token al giorno

A causa delle limitazioni di capacità, i limiti di frequenza massima specificati non sono garantiti.

Pattern dei nomi delle versioni del modello

I modelli Gemini sono disponibili nelle versioni di anteprima o stabili. Nel codice, puoi utilizzare uno dei seguenti formati dei nomi dei modelli per specificare il modello e la versione che vuoi utilizzare.

Ultima: indica la versione più avanzata del modello per una generazione e una variante specificate. Il modello sottostante viene aggiornato regolarmente e potrebbe essere una versione di anteprima. Solo le app e i prototipi di test esplorativi devono utilizzare questo alias.

Per specificare la versione più recente, utilizza il seguente pattern: <model>-<generation>-<variation>-latest. Ad esempio, gemini-1.0-pro-latest.
Ultima versione stabile:indica la versione stabile più recente rilasciata per la generazione e la variazione del modello specificati.

Per specificare la versione stabile più recente, utilizza il seguente pattern: <model>-<generation>-<variation>. Ad esempio, gemini-1.0-pro.
Stabile:indica un modello stabile specifico. I modelli stabili non cambiano. La maggior parte delle app di produzione dovrebbe utilizzare un modello stabile specifico.

Per specificare una versione stabile, utilizza il seguente pattern: <model>-<generation>-<variation>-<version>. Ad esempio, gemini-1.0-pro-001.
Sperimentale: fa riferimento a un modello sperimentale disponibile in Anteprima, come definito nei Termini, il che significa che non è destinato all'uso in produzione. Lanciamo modelli sperimentali per raccogliere feedback, mettere rapidamente a disposizione degli sviluppatori i nostri aggiornamenti più recenti ed evidenziare il ritmo dell'innovazione in Google. Ciò che scopriamo dai lanci sperimentali ci aiuta a decidere come rilasciare i modelli su larga scala. Un modello sperimentale può essere sostituito con un altro senza preavviso. Non garantiamo che un modello sperimentale diventerà un modello stabile in futuro.

Per specificare una versione sperimentale, utilizza il seguente pattern: <model>-<generation>-<variation>-<version>. Ad esempio, gemini-1.5-pro-exp-0827.

Lingue disponibili

I modelli Gemini sono addestrati per funzionare con le seguenti lingue:

Arabo (ar)
Bengali (bn)
Bulgaro (bg)
Cinese semplificato e tradizionale (zh)
Croato (hr)
Ceco (cs)
Danese (da)
Olandese (nl)
Inglese (en)
Estone (et)
Finlandese (fi)
Francese (fr)
Tedesco (de)
Greco (el)
Ebraico (iw)
Hindi (hi)
Ungherese (hu)
Indonesian (id)
Italiano (it)
Giapponese (ja)
Coreano (ko)
Lettone (lv)
Lituano (lt)
Norvegese (no)
Polacco (pl)
Portoghese (pt)
Rumeno (ro)
Russo (ru)
Serbo (sr)
Slovacco (sk)
Sloveno (sl)
Spagnolo (es)
Swahili (sw)
Svedese (sv)
Thailandese (th)
Turco (tr)
Ucraino (uk)
Vietnamita (vi)