L'API Interactions è ora disponibile a livello generale. Ti consigliamo di utilizzare questa API per accedere a tutti i modelli e a tutte le funzionalità più recenti.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Modelli

Gemini 3

Stabile

Gemini 3.5 Flash

Il modello più intelligente per prestazioni all'avanguardia sostenute per attività di agenti e programmazione.

Stabile

Gemini 3.1 Flash-Lite

Prestazioni di classe all'avanguardia che rivaleggiano con i modelli più grandi a una frazione del costo.

Stabile

Nano Banana 2

Generazione e modifica di immagini potenti e ad alta efficienza, ottimizzate per la velocità e i casi d'uso ad alto volume.

Stabile

Nano Banana Lite

Generazione e modifica di immagini a latenza molto bassa ed economiche, progettate per casi d'uso interattivi ad alto volume.

Stabile

Nano Banana Pro

Modelli allo stato dell'arte per la generazione e la modifica di immagini per la creazione di immagini native altamente contestuali.

Stabile

Anteprima

Gemini 3.1 Pro

Intelligenza avanzata, capacità di risoluzione di problemi complessi e potenti funzionalità di programmazione di agenti e vibe.

Anteprima

Gemini 3 Flash

Prestazioni di classe all'avanguardia che rivaleggiano con i modelli più grandi a una frazione del costo.

Anteprima

Gemini 3.5 Live Translate

Modello di traduzione vocale in tempo reale a bassa latenza che supporta oltre 70 lingue.

Nuova anteprima

Gemini 3.1 Flash Live

Modello API Live di alta qualità e a bassa latenza per applicazioni di AI vocali e di dialogo in tempo reale.

Nuova anteprima

Gemini 3.1 Flash TTS

Generazione vocale potente e a bassa latenza.

Nuova anteprima

Gemini Omni Flash

Generazione e modifica di video rapide e conversazionali. Trasforma testo e immagini in video e perfeziona i risultati tramite il linguaggio naturale.

Nuova anteprima

Gemini 2.5 Flash

Il nostro modello con il miglior rapporto qualità-prezzo per attività a bassa latenza e ad alto volume che richiedono ragionamento.

Nano Banana

Generazione e modifica di immagini native allo stato dell'arte progettate per workflow creativi e veloci.

Anteprima di Gemini 2.5 Flash Live

Ottimizzato per agenti conversazionali in tempo reale con streaming audio nativo inferiore al secondo.

Anteprima di Gemini 2.5 Flash TTS Preview

Generazione di audio Text-to-Speech controllabile con un controllo preciso su stile e ritmo.

Gemini 2.5 Flash-Lite

Il modello multimodale più veloce ed economico della famiglia 2.5.

Gemini 2.5 Pro

Il nostro modello più avanzato per attività complesse, con funzionalità di ragionamento e programmazione approfondite.

Anteprima di Gemini 2.5 Pro TTS

Sintesi vocale ad alta fedeltà ottimizzata per la qualità in workflow strutturati come podcast e audiolibri.

Modelli audio

Questa sezione contiene tutti i modelli audio, inclusi quelli che potrebbero essere già elencati in altre sezioni

Anteprima di Gemini 3.1 Flash Live

Il nostro modello audio-audio (A2A) di alta qualità e a bassa latenza progettato per applicazioni di AI vocali e di dialogo in tempo reale.

Anteprima di Gemini 3.1 Flash TTS Preview

Generazione vocale potente e a bassa latenza, con output naturali, prompt guidabili e nuovi tag audio espressivi per un controllo preciso della narrazione.

Anteprima di Gemini 2.5 Flash Live

Il nostro modello API Live di punta per agenti vocali e video bidirezionali a bassa latenza con ragionamento audio nativo.

Anteprima di Gemini 2.5 Flash TTS Preview

Text-to-Speech veloce e controllabile per applicazioni a bassa latenza ed economiche e assistenti in tempo reale.

Anteprima di Gemini 2.5 Pro TTS

Sintesi vocale ad alta fedeltà ottimizzata per la qualità in workflow strutturati come podcast e audiolibri.

Modelli di contenuti multimediali generativi

Questa sezione contiene tutti i modelli di contenuti multimediali generativi, inclusi quelli che potrebbero essere già elencati in altre sezioni

Nano Banana 2

Creazione visiva ad alta efficienza su scala di produzione, che combina l'intelligenza della serie Gemini 3 con velocità di generazione elevatissime.

Nano Banana Lite

Progettato come specialista dell'efficienza della famiglia di generazione di immagini, offre generazione e modifica di immagini a latenza molto bassa ed economiche.

Anteprimadi Veo 3.1

Generazione di video cinematografici allo stato dell'arte con controlli creativi avanzati e audio sincronizzato in modo nativo.

Nano Banana Pro

Un motore di progettazione professionale con un nucleo di ragionamento per immagini 4K di qualità da studio, layout complessi e rendering di testo preciso.

Anteprima di Veo 3.1 Lite

Generazione, modifica e controllo cinematografico di video ad alta efficienza, a basso costo e incentrati sugli sviluppatori della famiglia Veo 3.1.

Anteprima di Gemini Omni Flash

Generazione e modifica di video rapide e conversazionali. Trasforma testo e immagini in video e perfeziona i risultati tramite il linguaggio naturale.

Nano Banana

Generazione e modifica di immagini native allo stato dell'arte progettate per workflow creativi e veloci.

Imagen 4 (deprecato)

Modello da testo a immagine, con generazione rapida e velocissima e chiarezza eccezionale fino alla risoluzione 2K.

Modelli di generazione di musica

Questa sezione contiene tutti i modelli di generazione di musica, inclusi quelli che potrebbero essere già elencati in altre sezioni

Anteprima di Lyria 3 Pro

Il nostro modello di generazione di musica di punta, ottimizzato per brani di lunga durata con una coerenza strutturale complessa.

Anteprima di Lyria 3 Clip

Ottimizzato per la generazione di brevi clip musicali, loop e anteprime fino a 30 secondi.

Lyria RealTime (sperimentale)

Modello di generazione di musica ad alta fedeltà che offre un controllo creativo granulare e funzionalità di streaming in tempo reale.

Modelli di strumenti e agenti

Anteprima di Computer Use

Un modello specializzato in grado di "vedere" uno schermo digitale ed eseguire azioni dell'interfaccia utente come fare clic, digitare e navigare per automatizzare attività complesse del browser.

Anteprima di Gemini Deep Research

Un modello di agenti che pianifica ed esegue autonomamente ricerche in più passaggi su centinaia di fonti per produrre report interattivi citati.

Anteprima di Gemini Deep Research Max

Massima completezza per la raccolta e la sintesi automatizzate del contesto su centinaia di fonti.

Anteprimadell'agente Antigravity

Un agente gestito per uso generico che pianifica, ragiona, esegue codice, gestisce file e naviga sul web autonomamente all'interno di una sandbox Linux sicura e isolata.

Modelli di attività specializzati

Gemini Embedding 2

Il nostro primo modello di embedding multimodale, che mappa testo, immagini, video, audio e PDF in uno spazio di embedding unificato per sistemi di ricerca semantica e RAG avanzati.

Gemini Embedding

Rappresentazioni vettoriali ad alta dimensione per sistemi di ricerca semantica, classificazione del testo e RAG avanzati.

Anteprima di Gemini Robotics-ER 1.6

Modello di ragionamento incarnato avanzato che comprende gli spazi fisici e pianifica attività in più passaggi per agenti robotici con nuove funzionalità come la lettura di strumenti, il ragionamento spaziale e fisico migliorato.

Modelli precedenti

Arresto di Gemini 2.0 Flash

Il nostro modello di seconda generazione, con funzionalità di nuova generazione e funzionalità migliorate, tra cui velocità superiore, utilizzo di strumenti nativi e una finestra contestuale da 1 milione di token.

Arresto di Gemini 2.0 Flash-Lite

Il nostro modello di seconda generazione più veloce, ottimizzato per l'efficienza dei costi e la bassa latenza.

Anteprima di Gemini 3.1 Flash-Lite Arresta

Il nostro modello multimodale più economico, che offre le prestazioni più veloci per attività leggere ad alta frequenza.

Anteprima di Gemini 3 Pro Arresto

Il nostro modello di ragionamento allo stato dell'arte, con una comprensione multimodale avanzata.

Pattern dei nomi delle versioni dei modelli

I modelli Gemini sono disponibili nelle versioni stabile, anteprima, più recente o sperimentale.

Stabile

Indica un modello stabile specifico. I modelli stabili di solito non cambiano. La maggior parte delle app di produzione deve utilizzare un modello stabile specifico.

Ad esempio: gemini-3.5-flash.

Anteprima

Indica un modello di anteprima che può essere utilizzato per la produzione. I modelli di anteprima in genere hanno la fatturazione abilitata, potrebbero avere limiti di frequenza più restrittivi e verranno ritirati con un preavviso di almeno due settimane.

Ad esempio: gemini-2.5-flash-preview-09-2025.

Più recenti

Indica l'ultima release per una variante specifica del modello. Può trattarsi di una release stabile, di anteprima o sperimentale. Questo alias verrà sostituito a caldo con ogni nuova release di una variante specifica del modello. Prima della modifica della versione precedente alla più recente, verrà fornito un preavviso di due settimane via email.

Ad esempio: gemini-flash-latest.

Sperimentale

Indica un modello sperimentale che in genere non è adatto all'uso in produzione e ha limiti di frequenza più restrittivi. Rilasciamo modelli sperimentali per raccogliere feedback e mettere rapidamente a disposizione degli sviluppatori i nostri aggiornamenti più recenti.

I modelli sperimentali non sono stabili e la disponibilità degli endpoint dei modelli è soggetta a modifiche.

Deprecazioni dei modelli

Per informazioni sulle deprecazioni dei modelli, visita la pagina Deprecazioni di Gemini.