Gemini è una famiglia di modelli di IA generativa che consente agli sviluppatori di generare contenuti e Questi modelli sono progettati e addestrati per gestire testo e immagini come input. Questa guida fornisce informazioni su ogni variante di modello per aiutarti a decidere quale sia la più adatta al tuo caso d'uso.
Ecco un breve riepilogo dei modelli disponibili e delle loro funzionalità:
ottimizzabili | Input | Output |
---|---|---|
Gemini | ||
|
Testo e immagini | Testo |
|
Testo | Testo |
|
Testo e immagini | Testo |
Incorporamenti | ||
|
Testo | Incorporamenti di testo |
Recupero | ||
|
Testo | Testo |
Sicurezza e utilizzo previsto
I modelli di intelligenza artificiale generativa sono strumenti potenti, ma non sono privi di limitazioni. La loro versatilità e applicabilità a volte possono generare risultati imprevisti, ad esempio output imprecisi, distorti o offensivi. La post-elaborazione e la rigorosa valutazione manuale sono essenziali per limitare il rischio di danni derivanti da questo tipo di output. Consulta le indicazioni sulla sicurezza per ulteriori suggerimenti sull'utilizzo sicuro.
I modelli forniti dall'API Gemini possono essere utilizzati per un'ampia gamma di applicazioni di IA generativa e di elaborazione del linguaggio naturale (NLP). L'utilizzo di queste funzioni è disponibile solo tramite l'API Gemini o l'app web Google AI Studio. L'utilizzo dell'API Gemini è inoltre soggetto alle Norme relative all'uso vietato dell'IA generativa e ai Termini di servizio dell'API Gemini.
Dimensioni del modello
La seguente tabella mostra le dimensioni disponibili e il loro significato l'una rispetto all'altra.
Dimensione modello | Descrizione | Servizi |
---|---|---|
Gemini 1.0 Pro | Una dimensione del modello che bilancia capacità ed efficienza. |
|
Versioni modello
I modelli Gemini sono disponibili in versione anteprima o stabile. Nel codice, puoi utilizzare uno dei seguenti formati dei nomi dei modelli per specificare quale modello e versione vuoi utilizzare.
Più recente: rimanda alla versione all'avanguardia del modello per una generazione e una variazione specificate. Il modello sottostante viene aggiornato regolarmente e potrebbe essere una versione in anteprima. Solo le app e i prototipi di test esplorativo devono usare questo alias.
Per specificare la versione più recente, utilizza il seguente pattern:
<model>-<generation>-<variation>-latest
. Ad esempio,gemini-1.0-pro-latest
.Stabile più recente: rimanda alla versione stabile più recente rilasciata per la generazione e la variazione del modello specificate.
Per specificare l'ultima versione stabile, utilizza il seguente pattern:
<model>-<generation>-<variation>
. Ad esempio,gemini-1.0-pro
.Stabile: rimanda a un modello stabile specifico. I modelli stabili non cambiano. La maggior parte delle app di produzione dovrebbe utilizzare un modello stabile specifico.
Per specificare una versione stabile, utilizza il seguente pattern:
<model>-<generation>-<variation>-<version>
. Ad esempio,gemini-1.0-pro-001
.
Per i modelli che hanno una versione stabile, vedi la riga "Nomi dei modelli" per il modello in Varianti del modello.
Varianti del modello
L'API Gemini offre diversi modelli ottimizzati per casi d'uso specifici. La seguente tabella descrive gli attributi di ognuno.
Variazione | Attributo | Descrizione |
---|---|---|
Gemini 1.5 Pro (solo anteprima) | Ultimo aggiornamento del modello | Aprile 2024 |
Codice modello | models/gemini-1.5-pro-latest |
|
Capacità del modello |
|
|
Metodi di generazione supportati | generateContent |
|
Limite token di input | 1048576 | |
Limite di token di output | 8192 | |
Sicurezza del modello | Impostazioni di sicurezza applicate automaticamente e regolabili dagli sviluppatori. Per informazioni dettagliate, consulta l'argomento Impostazioni di sicurezza. | |
Limite di frequenza | 2 query al minuto, 1000 query al giorno[1] | |
Gemini Pro | Ultimo aggiornamento del modello | February 2024 |
Codice modello | models/gemini-pro |
|
Capacità del modello |
|
|
Metodi di generazione supportati | generateContent |
|
Limite token di input | 30720 | |
Limite di token di output | 2048 | |
Sicurezza del modello | Impostazioni di sicurezza applicate automaticamente e regolabili dagli sviluppatori. Per informazioni dettagliate, consulta l'argomento Impostazioni di sicurezza. | |
Limite di frequenza | 60 richieste al minuto[1] | |
Nomi dei modelli |
|
|
Gemini 1.0 Pro Vision | Ultimo aggiornamento del modello | Dicembre 2023 |
Codice modello | models/gemini-pro-vision |
|
Capacità del modello |
|
|
Metodi di generazione supportati | generateContent |
|
Limite token di input | 12288 | |
Limite di token di output | 4096 | |
Sicurezza del modello | Impostazioni di sicurezza applicate automaticamente e regolabili dagli sviluppatori. Per informazioni dettagliate, consulta l'argomento Impostazioni di sicurezza. | |
Limite di frequenza | 60 richieste al minuto[1] | |
Incorporamento | Ultimo aggiornamento del modello | Dicembre 2023 |
Codice modello | models/embedding-001 |
|
Capacità del modello |
|
|
Metodi di generazione supportati | embedContent |
|
Sicurezza del modello | Nessuna impostazione di sicurezza regolabile. | |
Limite di frequenza | 1500 richieste al minuto[1] | |
Incorporamento del testo | Ultimo aggiornamento del modello | Aprile 2024 |
Codice modello | models/text-embedding-004 (text-embedding-preview-0409
in Vertex AI)
|
|
Capacità del modello |
|
|
Metodi di generazione supportati | embedContent |
|
Sicurezza del modello | Nessuna impostazione di sicurezza regolabile. | |
Limite di frequenza | 1500 richieste al minuto[1] | |
AQA | Ultimo aggiornamento del modello | Dicembre 2023 |
Codice modello | models/aqa |
|
Capacità del modello |
|
|
Metodi di generazione supportati | generateAnswer |
|
Lingue supportate | Inglese | |
Limite token di input | 7168 | |
Limite di token di output | 1024 | |
Sicurezza del modello | Impostazioni di sicurezza applicate automaticamente e regolabili dagli sviluppatori. Per informazioni dettagliate, consulta l'argomento Impostazioni di sicurezza. | |
Limite di frequenza | 60 richieste al minuto[1] |
Consulta gli esempi per esplorare le funzionalità di queste varianti dei modelli.
Metadati del modello
Usa l'API ModelService
per ottenere metadati aggiuntivi sui modelli più recenti, come i limiti dei token di input e di output. La seguente tabella mostra i metadati per la variante del modello Gemini Pro.
Attributo | Valore |
---|---|
Nome visualizzato | Gemini 1.0 Pro |
Codice modello | models/gemini-1.0-pro |
Descrizione | Modello scelto come target per la generazione di testo |
Metodi di generazione supportati | generateContent |
Temperatura | 0,9 |
top_p | 1 |
top_k | 1 |
Attributi del modello
La seguente tabella descrive gli attributi dei modelli Gemini che sono comuni a tutte le varianti dei modelli.
Attributo | Descrizione |
---|---|
Dati di addestramento | La soglia delle conoscenze per Gemini è l'inizio del 2023. La conoscenza degli eventi successivi a questo periodo è limitata. |
Lingue supportate | Scopri le lingue disponibili |
Parametri del modello configurabili |
|
[1] A causa delle limitazioni di capacità, i limiti di frequenza massimi specificati non sono garantiti.
Per informazioni su ciascuno di questi parametri, consulta la sezione relativa ai parametri del modello nella guida Introduzione agli LLM.
Passaggi successivi
- Per iniziare a usare il servizio senza codice, consulta la guida rapida di Google AI Studio.
- Per iniziare a utilizzare l'API, consulta la guida rapida di Python.