Modelli Gemini

Varianti del modello

L'API Gemini offre diversi modelli ottimizzati per un uso specifico d'uso diversi. Ecco una breve panoramica delle varianti di Gemini disponibili:

Variante del modello Input Output Ottimizzato per
Gemini 1.5 Flash
gemini-1.5-flash
Audio, immagini, video e testo Testo Prestazioni rapide e versatili per un'ampia varietà di attività
Gemini 1.5 Pro
gemini-1.5-pro
Audio, immagini, video e testo Testo Attività di ragionamento complesse come la generazione di codice e testo, modifica del testo, problem solving, estrazione e generazione di dati
Gemini 1.0 Pro
gemini-1.0-pro
Testo Testo Attività di elaborazione del linguaggio naturale, chat di testo e codice in più passaggi e programmazione generazione
Incorporamento del testo
text-embedding-004
Testo Incorporamenti di testo Misurazione della correlazione delle stringhe di testo
AQA
aqa
Testo Testo Fornire risposte alle domande basate sulla fonte

La seguente tabella descrive gli attributi dei modelli Gemini che sono comuni a tutte le varianti di modello:

Attributo Descrizione
Dati di addestramento Il limite di conoscenze per Gemini è novembre 2023. Le conoscenze sugli eventi successivi a questo periodo sono limitate.
Lingue supportate Vedi le lingue disponibili
Parametri del modello configurabili
  • Top-p
  • Top-k
  • Temperatura
  • Interrompi sequenza
  • Lunghezza massima output
  • Numero di candidati per la risposta

Consulta i parametri del modello del i modelli generativi forniscono informazioni su ciascuno di questi parametri.

Gemini 1.5 Flash

Gemini 1.5 Flash è un modello multimodale veloce e versatile per la scalabilità diverse attività.

Prova in AI Studio

Dettagli modello

Proprietà Descrizione
Codice modello models/gemini-1.5-flash
Tipi di dati supportati

Input

Audio, immagini, video e testo

Output

Testo

Limiti dei token[*]

Limite di token di input

1.048.576

Limite di token di output

8.192

Specifiche audio/video

Numero massimo di immagini per prompt

3.600

Durata massima del video

1 ora

Durata massima dell'audio

Circa 9,5 ore

Limiti di frequenza[**]
Senza costi:
  • 15 rpm
  • 1 milione di TPM
  • 1500 RPD
di Gemini Advanced.
.
. Pay-as-you-go:
  • 1.000 rpm
  • 4 milioni di TPM
Capabilities

Istruzioni di sistema

Supportato

Modalità JSON

Supportato

Schema JSON

Supportato

Impostazioni di sicurezza regolabili

Supportato

Memorizzazione nella cache

Supportato

Ottimizzazione

Supportato

Chiamate di funzione

Supportato

Configurazione della chiamata di funzione

Supportato

Esecuzione del codice

Supportato

Versioni
  • Più recente: gemini-1.5-flash-latest
  • Ultima versione stabile: gemini-1.5-flash
  • Stabile: gemini-1.5-flash-001
  • Sperimentale:
    • gemini-1.5-flash-exp-0827
    • gemini-1.5-flash-8b-exp-0827
Aggiornamento più recente Maggio 2024

Gemini 1.5 Pro

Gemini 1.5 Pro è un modello multimodale di medie dimensioni ottimizzato per per svolgere un'ampia gamma di attività di ragionamento. 1.5 Pro può elaborare grandi quantità di dati contemporaneamente, incluse 2 ore di video, 19 ore di audio, codebase con 60.000 righe di codice o 2000 pagine di testo.

Prova in AI Studio

Dettagli modello

Proprietà Descrizione
Codice modello models/gemini-1.5-pro
Tipi di dati supportati

Input

Audio, immagini, video e testo

Output

Testo

Limiti dei token[*]

Limite di token di input

2.097.152

Limite di token di output

8.192

Specifiche audio/video

Numero massimo di immagini per prompt

7200

Durata massima del video

2 ore

Durata massima dell'audio

Circa 19 ore

Limiti di frequenza[**]
Senza costi:
  • 2 rpm
  • 32.000 T/M
  • 50 RPD
di Gemini Advanced.
.
. Pay-as-you-go:
  • 360 rpm
  • 4 milioni di TPM
Capabilities

Istruzioni di sistema

Supportato

Modalità JSON

Supportato

Schema JSON

Supportato

Impostazioni di sicurezza regolabili

Supportato

Memorizzazione nella cache

Supportato

Ottimizzazione

Non supportato

Chiamate di funzione

Supportato

Configurazione della chiamata di funzione

Supportato

Esecuzione del codice

Supportato

Versioni
  • Più recente: gemini-1.5-pro-latest
  • Ultima versione stabile: gemini-1.5-pro
  • Stabile: gemini-1.5-pro-001
  • Sperimentale:
    • gemini-1.5-pro-exp-0801
    • gemini-1.5-pro-exp-0827
Aggiornamento più recente Maggio 2024

Gemini 1.0 Pro

Gemini 1.0 Pro è un modello NLP che gestisce attività come testo in più passaggi e chat di codice e generazione del codice.

Prova in AI Studio

Dettagli modello

Proprietà Descrizione
Codice modello models/gemini-1.0-pro
Tipi di dati supportati

Ingresso

Testo

Output

Testo

Limiti di frequenza[**]
Senza costi:
  • 15 rpm
  • 32.000 T/M
  • 1500 RPD
di Gemini Advanced.
.
. Pay-as-you-go:
  • 360 rpm
  • 120.000 T/M
  • 30.000 RPD
Capabilities

Istruzioni di sistema

Non supportato

Modalità JSON

Non supportato

Schema JSON

Non supportato

Impostazioni di sicurezza regolabili

Supportato

Memorizzazione nella cache

Non supportato

Ottimizzazione

Supportato

Chiamate di funzione

Supportato

Configurazione della chiamata di funzione

Non supportato

Esecuzione del codice

Non supportato

Versioni
  • Più recente: gemini-1.0-pro-latest
  • Ultima versione stabile: gemini-1.0-pro
  • Stabile: gemini-1.0-pro-001
Aggiornamento più recente Febbraio 2024

Incorporamento di testo

Incorporamento del testo

Gli incorporamenti di testo sono utilizzati per misurare la correlazione delle stringhe e sono ampiamente utilizzati in molte applicazioni dell'IA.

text-embedding-004 raggiunge prestazioni di recupero più elevate e prestazioni migliori dei modelli esistenti con dimensioni paragonabili ai benchmark di incorporamento MTEB standard.

Dettagli modello
Proprietà Descrizione
Codice modello

API Gemini

models/text-embedding-004

Tipi di dati supportati

Ingresso

Testo

Output

Incorporamenti di testo

Limiti dei token[*]

Limite di token di input

2048

Dimensioni della dimensione di output

768

Limiti di frequenza[**] 1500 richieste al minuto
Impostazioni di sicurezza regolabili Non supportato
Aggiornamento più recente Aprile 2024

Incorporamento

Puoi utilizzare il modello Embedding per generare incorporamenti di testo per del testo di input.

Il modello di incorporamento è ottimizzato per creare incorporamenti con dimensioni 768 per testi fino a 2048 token.

Incorporamento dei dettagli del modello
Proprietà Descrizione
Codice modello models/embedding-001
Tipi di dati supportati

Ingresso

Testo

Output

Incorporamenti di testo

Limiti dei token[*]

Limite di token di input

2048

Dimensioni della dimensione di output

768

Limiti di frequenza[**] 1500 richieste al minuto
Impostazioni di sicurezza regolabili Non supportato
Aggiornamento più recente Dicembre 2023

AQA

Puoi utilizzare il modello AQA per Risposte alle domande attribuite attività correlate all'AQA in un documento, un corpus o una serie di passaggi. L'AQA del modello restituisce le risposte alle domande basate sulle fonti fornite, insieme alla stima della probabilità di risposta.

Dettagli modello

Proprietà Descrizione
Codice modello models/aqa
Tipi di dati supportati

Ingresso

Testo

Output

Testo

Lingua supportata Inglese
Limiti dei token[*]

Limite di token di input

7168

Limite di token di output

1024

Limiti di frequenza[**] 1500 richieste al minuto
Impostazioni di sicurezza regolabili Supportato
Aggiornamento più recente Dicembre 2023

Esamina gli esempi per esplorare le capacità di questo modello varianti.

[*] Un token equivale a circa 4 caratteri per i modelli Gemini. 100 token sono circa 60-80 parole inglesi.

[**] RPM: richieste al minuto
TPM: token al minuto
RPD: richieste al giorno
TPD: token al giorno

A causa delle limitazioni della capacità, i limiti di frequenza massima specificati non sono garantito.

Pattern dei nomi di versione del modello

I modelli Gemini sono disponibili in versione anteprima o stabile. Nel tuo puoi utilizzare uno dei seguenti formati di nome del modello per specificare quale modello e la versione che vuoi utilizzare.

  • Più recente: rimanda alla versione più recente del modello per uno specifico generazione e variazione dei dati. Il modello sottostante viene aggiornato regolarmente e potrebbe essere una versione in anteprima. Solo le app per i test esplorativi e i prototipi usano questo alias.

    Per specificare la versione più recente, utilizza il seguente pattern: <model>-<generation>-<variation>-latest. Ad esempio: gemini-1.0-pro-latest.

  • Stabile più recente:rimanda alla versione stabile più recente rilasciata per il la generazione e la variazione del modello specificate.

    Per specificare l'ultima versione stabile, usa il seguente pattern: <model>-<generation>-<variation>. Ad esempio, gemini-1.0-pro.

  • Stabile:rimanda a un modello stabile specifico. I modelli stabili non cambiano. La maggior parte delle app di produzione dovrebbe usare un modello stabile specifico.

    Per specificare una versione stabile, utilizza il seguente pattern: <model>-<generation>-<variation>-<version>. Ad esempio: gemini-1.0-pro-001.

  • Sperimentale: rimanda a un modello sperimentale disponibile in anteprima, come definito nei Termini, il che significa che non devono essere usate in produzione. Rilasciamo modelli sperimentali per raccogliere feedback, mettiamo a disposizione degli sviluppatori i nostri ultimi aggiornamenti rapidamente ed evidenziare il ritmo dell'innovazione di Google. Cosa apprendiamo dai lanci sperimentali ci informa sul modo in cui rilasciamo i modelli ampiamente. Un modello sperimentale può essere sostituito con un altro senza una notifica. Non garantiamo che un modello sperimentale diventi un un modello stabile in futuro.

    Per specificare una versione sperimentale, utilizza il seguente pattern: <model>-<generation>-<variation>-<version>. Ad esempio: gemini-1.5-pro-exp-0801.

Lingue disponibili

I modelli Gemini sono addestrati per funzionare con i seguenti linguaggi:

  • Arabo (ar)
  • Bengalese (bn)
  • Bulgaro (bg)
  • Cinese semplificato e tradizionale (zh)
  • Croato (hr)
  • Ceco (cs)
  • Danese (da)
  • Olandese (nl)
  • Inglese (en)
  • Estone (et)
  • Finlandese (fi)
  • Francese (fr)
  • Tedesco (de)
  • Greco (el)
  • Ebraico (iw)
  • Hindi (hi)
  • Ungherese (hu)
  • Indonesiano (id)
  • Italiano (it)
  • Giapponese (ja)
  • Coreano (ko)
  • Lettone (lv)
  • Lituano (lt)
  • Norvegese (no)
  • Polacco (pl)
  • Portoghese (pt)
  • Rumeno (ro)
  • Russo (ru)
  • Serbo (sr)
  • Slovacco (sk)
  • Sloveno (sl)
  • Spagnolo (es)
  • Swahili (sw)
  • Svedese (sv)
  • Thailandese (th)
  • Turco (tr)
  • Ucraino (uk)
  • Vietnamita (vi)