1,5 unità flash
Il nostro modello multimodale più veloce ed economico con grandi prestazioni per attività ad alta frequenza
- Inserisci audio, immagini, video e testo e ricevi risposte testuali
- Genera codice, estrai dati, modifica testo e altro ancora
- Ideale per attività limitate e ad alta frequenza
1.5 Pro
Il nostro modello multimodale con le migliori prestazioni, con funzionalità per un'ampia varietà di attività di ragionamento
- Inserisci audio, immagini, video e testo e ricevi risposte testuali
- Genera codice, estrai dati, modifica testo e altro ancora
- Per quando hai bisogno di migliorare il rendimento
Varianti del modello
L'API Gemini offre diversi modelli ottimizzati per un uso specifico d'uso diversi. Ecco una breve panoramica delle varianti di Gemini disponibili:
Variante del modello | Input | Output | Ottimizzato per |
---|---|---|---|
Gemini 1.5 Flash
gemini-1.5-flash |
Audio, immagini, video e testo | Testo | Prestazioni rapide e versatili per un'ampia varietà di attività |
Gemini 1.5 Pro
gemini-1.5-pro |
Audio, immagini, video e testo | Testo | Attività di ragionamento complesse come la generazione di codice e testo, modifica del testo, problem solving, estrazione e generazione di dati |
Gemini 1.0 Pro
gemini-1.0-pro |
Testo | Testo | Attività di elaborazione del linguaggio naturale, chat di testo e codice in più passaggi e programmazione generazione |
Incorporamento del testo
text-embedding-004 |
Testo | Incorporamenti di testo | Misurazione della correlazione delle stringhe di testo |
AQA
aqa |
Testo | Testo | Fornire risposte alle domande basate sulla fonte |
La seguente tabella descrive gli attributi dei modelli Gemini che sono comuni a tutte le varianti di modello:
Attributo | Descrizione |
---|---|
Dati di addestramento | Il limite di conoscenze per Gemini è novembre 2023. Le conoscenze sugli eventi successivi a questo periodo sono limitate. |
Lingue supportate | Vedi le lingue disponibili |
Parametri del modello configurabili |
|
Consulta i parametri del modello del i modelli generativi forniscono informazioni su ciascuno di questi parametri.
Gemini 1.5 Flash
Gemini 1.5 Flash è un modello multimodale veloce e versatile per la scalabilità diverse attività.
Dettagli modello
Proprietà | Descrizione |
---|---|
Codice modello | models/gemini-1.5-flash |
Tipi di dati supportati |
Input Audio, immagini, video e testo Output Testo |
[*] | Limiti dei token
Limite di token di input 1.048.576 Limite di token di output 8.192 |
Specifiche audio/video |
Numero massimo di immagini per prompt 3.600 Durata massima del video 1 ora Durata massima dell'audio Circa 9,5 ore |
[**] | Limiti di frequenza
|
Capabilities |
Istruzioni di sistema Supportato Modalità JSON Supportato Schema JSON Supportato Impostazioni di sicurezza regolabili Supportato Memorizzazione nella cache Supportato Ottimizzazione Supportato Chiamate di funzione Supportato Configurazione della chiamata di funzione Supportato Esecuzione del codice Supportato |
Versioni |
|
Aggiornamento più recente | Maggio 2024 |
Gemini 1.5 Pro
Gemini 1.5 Pro è un modello multimodale di medie dimensioni ottimizzato per per svolgere un'ampia gamma di attività di ragionamento. 1.5 Pro può elaborare grandi quantità di dati contemporaneamente, incluse 2 ore di video, 19 ore di audio, codebase con 60.000 righe di codice o 2000 pagine di testo.
Dettagli modello
Proprietà | Descrizione |
---|---|
Codice modello | models/gemini-1.5-pro |
Tipi di dati supportati |
Input Audio, immagini, video e testo Output Testo |
[*] | Limiti dei token
Limite di token di input 2.097.152 Limite di token di output 8.192 |
Specifiche audio/video |
Numero massimo di immagini per prompt 7200 Durata massima del video 2 ore Durata massima dell'audio Circa 19 ore |
[**] | Limiti di frequenza
|
Capabilities |
Istruzioni di sistema Supportato Modalità JSON Supportato Schema JSON Supportato Impostazioni di sicurezza regolabili Supportato Memorizzazione nella cache Supportato Ottimizzazione Non supportato Chiamate di funzione Supportato Configurazione della chiamata di funzione Supportato Esecuzione del codice Supportato |
Versioni |
|
Aggiornamento più recente | Maggio 2024 |
Gemini 1.0 Pro
Gemini 1.0 Pro è un modello NLP che gestisce attività come testo in più passaggi e chat di codice e generazione del codice.
Dettagli modello
Proprietà | Descrizione |
---|---|
Codice modello | models/gemini-1.0-pro |
Tipi di dati supportati |
Ingresso Testo Output Testo |
[**] | Limiti di frequenza
|
Capabilities |
Istruzioni di sistema Non supportato Modalità JSON Non supportato Schema JSON Non supportato Impostazioni di sicurezza regolabili Supportato Memorizzazione nella cache Non supportato Ottimizzazione Supportato Chiamate di funzione Supportato Configurazione della chiamata di funzione Non supportato Esecuzione del codice Non supportato |
Versioni |
|
Aggiornamento più recente | Febbraio 2024 |
Incorporamento di testo
Incorporamento del testo
Gli incorporamenti di testo sono utilizzati per misurare la correlazione delle stringhe e sono ampiamente utilizzati in molte applicazioni dell'IA.
text-embedding-004
raggiunge prestazioni di recupero più elevate e prestazioni migliori dei modelli esistenti
con dimensioni paragonabili ai benchmark di incorporamento MTEB standard.
Dettagli modello
Proprietà | Descrizione |
---|---|
Codice modello |
API Gemini
|
Tipi di dati supportati |
Ingresso Testo Output Incorporamenti di testo |
[*] | Limiti dei token
Limite di token di input 2048 Dimensioni della dimensione di output 768 |
[**] | Limiti di frequenza1500 richieste al minuto |
Impostazioni di sicurezza regolabili | Non supportato |
Aggiornamento più recente | Aprile 2024 |
Incorporamento
Puoi utilizzare il modello Embedding per generare incorporamenti di testo per del testo di input.
Il modello di incorporamento è ottimizzato per creare incorporamenti con dimensioni 768 per testi fino a 2048 token.
Incorporamento dei dettagli del modello
Proprietà | Descrizione |
---|---|
Codice modello |
models/embedding-001
|
Tipi di dati supportati |
Ingresso Testo Output Incorporamenti di testo |
[*] | Limiti dei token
Limite di token di input 2048 Dimensioni della dimensione di output 768 |
[**] | Limiti di frequenza1500 richieste al minuto |
Impostazioni di sicurezza regolabili | Non supportato |
Aggiornamento più recente | Dicembre 2023 |
AQA
Puoi utilizzare il modello AQA per Risposte alle domande attribuite attività correlate all'AQA in un documento, un corpus o una serie di passaggi. L'AQA del modello restituisce le risposte alle domande basate sulle fonti fornite, insieme alla stima della probabilità di risposta.
Dettagli modello
Proprietà | Descrizione |
---|---|
Codice modello | models/aqa |
Tipi di dati supportati |
Ingresso Testo Output Testo |
Lingua supportata | Inglese |
[*] | Limiti dei token
Limite di token di input 7168 Limite di token di output 1024 |
[**] | Limiti di frequenza1500 richieste al minuto |
Impostazioni di sicurezza regolabili | Supportato |
Aggiornamento più recente | Dicembre 2023 |
Esamina gli esempi per esplorare le capacità di questo modello varianti.
[*] Un token equivale a circa 4 caratteri per i modelli Gemini. 100 token sono circa 60-80 parole inglesi.
[**] RPM: richieste al minuto
TPM: token al minuto
RPD: richieste al giorno
TPD: token al giorno
A causa delle limitazioni della capacità, i limiti di frequenza massima specificati non sono
garantito.
Pattern dei nomi di versione del modello
I modelli Gemini sono disponibili in versione anteprima o stabile. Nel tuo puoi utilizzare uno dei seguenti formati di nome del modello per specificare quale modello e la versione che vuoi utilizzare.
Più recente: rimanda alla versione più recente del modello per uno specifico generazione e variazione dei dati. Il modello sottostante viene aggiornato regolarmente e potrebbe essere una versione in anteprima. Solo le app per i test esplorativi e i prototipi usano questo alias.
Per specificare la versione più recente, utilizza il seguente pattern:
<model>-<generation>-<variation>-latest
. Ad esempio:gemini-1.0-pro-latest
.Stabile più recente:rimanda alla versione stabile più recente rilasciata per il la generazione e la variazione del modello specificate.
Per specificare l'ultima versione stabile, usa il seguente pattern:
<model>-<generation>-<variation>
. Ad esempio,gemini-1.0-pro
.Stabile:rimanda a un modello stabile specifico. I modelli stabili non cambiano. La maggior parte delle app di produzione dovrebbe usare un modello stabile specifico.
Per specificare una versione stabile, utilizza il seguente pattern:
<model>-<generation>-<variation>-<version>
. Ad esempio:gemini-1.0-pro-001
.Sperimentale: rimanda a un modello sperimentale disponibile in anteprima, come definito nei Termini, il che significa che non devono essere usate in produzione. Rilasciamo modelli sperimentali per raccogliere feedback, mettiamo a disposizione degli sviluppatori i nostri ultimi aggiornamenti rapidamente ed evidenziare il ritmo dell'innovazione di Google. Cosa apprendiamo dai lanci sperimentali ci informa sul modo in cui rilasciamo i modelli ampiamente. Un modello sperimentale può essere sostituito con un altro senza una notifica. Non garantiamo che un modello sperimentale diventi un un modello stabile in futuro.
Per specificare una versione sperimentale, utilizza il seguente pattern:
<model>-<generation>-<variation>-<version>
. Ad esempio:gemini-1.5-pro-exp-0801
.
Lingue disponibili
I modelli Gemini sono addestrati per funzionare con i seguenti linguaggi:
- Arabo (
ar
) - Bengalese (
bn
) - Bulgaro (
bg
) - Cinese semplificato e tradizionale (
zh
) - Croato (
hr
) - Ceco (
cs
) - Danese (
da
) - Olandese (
nl
) - Inglese (
en
) - Estone (
et
) - Finlandese (
fi
) - Francese (
fr
) - Tedesco (
de
) - Greco (
el
) - Ebraico (
iw
) - Hindi (
hi
) - Ungherese (
hu
) - Indonesiano (
id
) - Italiano (
it
) - Giapponese (
ja
) - Coreano (
ko
) - Lettone (
lv
) - Lituano (
lt
) - Norvegese (
no
) - Polacco (
pl
) - Portoghese (
pt
) - Rumeno (
ro
) - Russo (
ru
) - Serbo (
sr
) - Slovacco (
sk
) - Sloveno (
sl
) - Spagnolo (
es
) - Swahili (
sw
) - Svedese (
sv
) - Thailandese (
th
) - Turco (
tr
) - Ucraino (
uk
) - Vietnamita (
vi
)