L'API Gemini supporta la generazione di contenuti con immagini, audio, codice, strumenti e altro ancora. Per i dettagli su ciascuna di queste funzionalità, continua a leggere e consulta il codice di esempio specifico per le attività oppure leggi le guide complete.
- Generazione di testo
- Vision
- Audio
- Contesto lungo
- Esecuzione del codice
- Modalità JSON
- Chiamate di funzione
- Istruzioni di sistema
Metodo: model.generateContent
- Endpoint
- Parametri percorso
- Corpo della richiesta
- Corpo della risposta
- Ambiti di autorizzazione
- Richiesta di esempio
Genera una risposta del modello dato un input GenerateContentRequest
. Per informazioni dettagliate sull'utilizzo, consulta la guida alla generazione del testo. Le capacità di input variano tra i modelli, inclusi i modelli ottimizzati. Per maggiori dettagli, consulta la guida ai modelli e la guida all'ottimizzazione.
Endpoint
pubblica
https://generativelanguage.googleapis.com/v1beta/{model=models/*}:generateContent
Parametri del percorso
model
string
Obbligatorio. Il nome dell'elemento Model
da utilizzare per generare il completamento.
Formato: name=models/{model}
. Il formato è models/{model}
.
Corpo della richiesta
Il corpo della richiesta contiene dati con la seguente struttura:
contents[]
object (Content
)
Obbligatorio. I contenuti della conversazione corrente con il modello.
Per le query a turno singolo, si tratta di una singola istanza. Per le query in più passaggi come la chat, si tratta di un campo ripetuto che contiene la cronologia della conversazione e l'ultima richiesta.
tools[]
object (Tool
)
(Facoltativo) Un elenco di Tools
che Model
può utilizzare per generare la risposta successiva.
Un Tool
è una porzione di codice che consente al sistema di interagire con sistemi esterni per eseguire un'azione o un insieme di azioni al di fuori delle conoscenze e dell'ambito di Model
. I valori di tipo Tool
supportati sono Function
e codeExecution
. Per saperne di più, consulta le Chiamate di funzione e le guide sull'esecuzione del codice.
toolConfig
object (ToolConfig
)
(Facoltativo) Configurazione dello strumento per qualsiasi Tool
specificato nella richiesta. Per un esempio di utilizzo, consulta la guida alla chiamata di funzione.
safetySettings[]
object (SafetySetting
)
(Facoltativo) Un elenco di istanze SafetySetting
univoche per il blocco di contenuti non sicuri.
Questa norma verrà applicata in modo forzato a GenerateContentRequest.contents
e GenerateContentResponse.candidates
. Non dovrebbe essere presente più di un'impostazione per ogni tipo di SafetyCategory
. L'API bloccherà tutti i contenuti e le risposte che non rispetteranno le soglie impostate da queste impostazioni. Questo elenco sostituisce le impostazioni predefinite per ogni SafetyCategory
specificato in safetySettings. Se non è presente alcun valore SafetySetting
per un determinato SafetyCategory
nell'elenco, l'API utilizzerà l'impostazione di sicurezza predefinita per la categoria in questione. Sono supportate le categorie di danni HARM_CATEGORY_HATE_SPEECH, HARM_CATEGORY_SEXUALLY_EXPLICIT, HARM_CATEGORY_DANGEROUS_CONTENT e HARM_CATEGORY_HARASSMENT. Consulta la guida per informazioni dettagliate sulle impostazioni di sicurezza disponibili. Consulta anche le indicazioni sulla sicurezza per scoprire come incorporare le considerazioni sulla sicurezza nelle tue applicazioni di IA.
systemInstruction
object (Content
)
(Facoltativo) Lo sviluppatore ha impostato le istruzioni di sistema. Al momento, solo testo.
generationConfig
object (GenerationConfig
)
(Facoltativo) Opzioni di configurazione per la generazione e gli output del modello.
cachedContent
string
(Facoltativo) Il nome dei contenuti memorizzati nella cache da utilizzare come contesto per la previsione. Formato: cachedContents/{cachedContent}
Esempio di richiesta
Testo
Python
Node.js
Vai
Conchiglia
Kotlin
Swift
Dart
Java
Immagine
Python
Node.js
Vai
Conchiglia
Kotlin
Swift
Dart
Java
Audio
Python
Node.js
Conchiglia
Video
Python
Node.js
Vai
Conchiglia
Python
Conchiglia
Chat
Python
Node.js
Vai
Conchiglia
Kotlin
Swift
Dart
Java
Cache
Python
Node.js
Modello ottimizzato
Python
Modalità JSON
Python
Node.js
Vai
Conchiglia
Kotlin
Swift
Dart
Java
Esecuzione del codice
Python
Kotlin
Java
Chiamata di funzione
Python
Node.js
Conchiglia
Kotlin
Swift
Dart
Java
Configurazione di generazione
Python
Node.js
Vai
Conchiglia
Kotlin
Swift
Dart
Java
Impostazioni di sicurezza
Python
Node.js
Vai
Conchiglia
Kotlin
Swift
Dart
Java
Istruzione di sistema
Python
Node.js
Vai
Conchiglia
Kotlin
Swift
Dart
Java
Corpo della risposta
In caso di esito positivo, il corpo della risposta contiene un'istanza di GenerateContentResponse
.
Metodo: models.streamGenerateContent
- Endpoint
- Parametri percorso
- Corpo della richiesta
- Corpo della risposta
- Ambiti di autorizzazione
- Richiesta di esempio
Genera una risposta in modalità flusso dal modello a cui è stato dato un input GenerateContentRequest
.
Endpoint
pubblica
https://generativelanguage.googleapis.com/v1beta/{model=models/*}:streamGenerateContent
Parametri del percorso
model
string
Obbligatorio. Il nome dell'elemento Model
da utilizzare per generare il completamento.
Formato: name=models/{model}
. Il formato è models/{model}
.
Corpo della richiesta
Il corpo della richiesta contiene dati con la seguente struttura:
contents[]
object (Content
)
Obbligatorio. I contenuti della conversazione corrente con il modello.
Per le query a turno singolo, si tratta di una singola istanza. Per le query in più passaggi come la chat, si tratta di un campo ripetuto che contiene la cronologia della conversazione e l'ultima richiesta.
tools[]
object (Tool
)
(Facoltativo) Un elenco di Tools
che Model
può utilizzare per generare la risposta successiva.
Un Tool
è una porzione di codice che consente al sistema di interagire con sistemi esterni per eseguire un'azione o un insieme di azioni al di fuori delle conoscenze e dell'ambito di Model
. I valori di tipo Tool
supportati sono Function
e codeExecution
. Per saperne di più, consulta le Chiamate di funzione e le guide sull'esecuzione del codice.
toolConfig
object (ToolConfig
)
(Facoltativo) Configurazione dello strumento per qualsiasi Tool
specificato nella richiesta. Per un esempio di utilizzo, consulta la guida alla chiamata di funzione.
safetySettings[]
object (SafetySetting
)
(Facoltativo) Un elenco di istanze SafetySetting
univoche per il blocco di contenuti non sicuri.
Questa norma verrà applicata in modo forzato a GenerateContentRequest.contents
e GenerateContentResponse.candidates
. Non dovrebbe essere presente più di un'impostazione per ogni tipo di SafetyCategory
. L'API bloccherà tutti i contenuti e le risposte che non rispetteranno le soglie impostate da queste impostazioni. Questo elenco sostituisce le impostazioni predefinite per ogni SafetyCategory
specificato in safetySettings. Se non è presente alcun valore SafetySetting
per un determinato SafetyCategory
nell'elenco, l'API utilizzerà l'impostazione di sicurezza predefinita per la categoria in questione. Sono supportate le categorie di danni HARM_CATEGORY_HATE_SPEECH, HARM_CATEGORY_SEXUALLY_EXPLICIT, HARM_CATEGORY_DANGEROUS_CONTENT e HARM_CATEGORY_HARASSMENT. Consulta la guida per informazioni dettagliate sulle impostazioni di sicurezza disponibili. Consulta anche le indicazioni sulla sicurezza per scoprire come incorporare le considerazioni sulla sicurezza nelle tue applicazioni di IA.
systemInstruction
object (Content
)
(Facoltativo) Lo sviluppatore ha impostato le istruzioni di sistema. Al momento, solo testo.
generationConfig
object (GenerationConfig
)
(Facoltativo) Opzioni di configurazione per la generazione e gli output del modello.
cachedContent
string
(Facoltativo) Il nome dei contenuti memorizzati nella cache da utilizzare come contesto per la previsione. Formato: cachedContents/{cachedContent}
Esempio di richiesta
Testo
Python
Node.js
Vai
Conchiglia
Kotlin
Swift
Dart
Java
Immagine
Python
Node.js
Vai
Conchiglia
Kotlin
Swift
Dart
Java
Audio
Python
Conchiglia
Video
Python
Node.js
Vai
Conchiglia
Python
Conchiglia
Chat
Python
Node.js
Vai
Conchiglia
Kotlin
Swift
Dart
Java
Corpo della risposta
In caso di esito positivo, il corpo della risposta contiene un flusso di istanze GenerateContentResponse
.
GenerateContentResponse
Risposta del modello che supporta più risposte dei candidati.
Le classificazioni di sicurezza e il filtro dei contenuti vengono segnalati sia per la richiesta in GenerateContentResponse.prompt_feedback
sia per ogni candidato in finishReason
e in safetyRatings
. L'API: - Restituisce tutti i candidati richiesti o nessuno di essi - Non restituisce nessun candidato solo se si è verificato un problema con la richiesta (seleziona promptFeedback
) - Segnala feedback su ogni candidato in finishReason
e safetyRatings
.
candidates[]
object (Candidate
)
Risposte dei candidati del modello.
promptFeedback
object (PromptFeedback
)
Restituisce il feedback del prompt relativo ai filtri per i contenuti.
usageMetadata
object (UsageMetadata
)
Solo output. Metadati sulla riga delle richieste di generazione l'utilizzo dei token.
Rappresentazione JSON |
---|
{ "candidates": [ { object ( |
PromptFeedback
Un insieme di metadati dei feedback specificati dal prompt in GenerateContentRequest.content
.
blockReason
enum (BlockReason
)
(Facoltativo) Se impostato, la richiesta è stata bloccata e non vengono restituiti candidati. Riformula il prompt.
safetyRatings[]
object (SafetyRating
)
Classificazioni per la sicurezza del prompt. Esiste al massimo una classificazione per categoria.
Rappresentazione JSON |
---|
{ "blockReason": enum ( |
BlockReason
Specifica il motivo per cui la richiesta è stata bloccata.
Enum | |
---|---|
BLOCK_REASON_UNSPECIFIED |
Valore predefinito. Questo valore non è utilizzato. |
SAFETY |
Il prompt è stato bloccato per motivi di sicurezza. Controlla safetyRatings per capire quale categoria di sicurezza l'ha bloccata. |
OTHER |
Il prompt è stato bloccato per motivi sconosciuti. |
BLOCKLIST |
Il prompt è stato bloccato a causa dei termini inclusi dalla lista bloccata terminologica. |
PROHIBITED_CONTENT |
La richiesta è stata bloccata a causa di contenuti vietati. |
UsageMetadata
Metadati sull'utilizzo dei token della richiesta di generazione.
promptTokenCount
integer
Numero di token nel prompt. Quando il criterio cachedContent
è impostato, si tratta comunque della dimensione effettiva totale del prompt, il che significa che include il numero di token nei contenuti memorizzati nella cache.
cachedContentTokenCount
integer
Numero di token nella parte della richiesta memorizzata nella cache (i contenuti memorizzati nella cache)
candidatesTokenCount
integer
Numero totale di token tra tutti i candidati di risposta generati.
totalTokenCount
integer
Conteggio totale dei token per la richiesta di generazione (prompt + candidati di risposta).
Rappresentazione JSON |
---|
{ "promptTokenCount": integer, "cachedContentTokenCount": integer, "candidatesTokenCount": integer, "totalTokenCount": integer } |
Candidato
- Rappresentazione JSON
- FinishReason
- GroundingAttribution
- AttributionSourceId
- GroundingPassageId
- SemanticRetrieverChunk
Un candidato per la risposta generato dal modello.
content
object (Content
)
Solo output. Contenuti generati restituiti dal modello.
finishReason
enum (FinishReason
)
(Facoltativo) Solo output. Il motivo per cui il modello ha smesso di generare token.
Se vuoto, il modello non ha smesso di generare token.
safetyRatings[]
object (SafetyRating
)
Elenco di classificazioni per la sicurezza di un candidato a una risposta.
Esiste al massimo una classificazione per categoria.
citationMetadata
object (CitationMetadata
)
Solo output. Informazioni di citazione per il candidato generato dal modello.
Questo campo può essere compilato con informazioni sulle citazioni per qualsiasi testo incluso in content
. Questi sono passaggi che vengono "recitati" tratti da materiale protetto da copyright nei dati di addestramento degli LLM di base.
tokenCount
integer
Solo output. Conteggio dei token per questo candidato.
groundingAttributions[]
object (GroundingAttribution
)
Solo output. Informazioni sull'attribuzione per le fonti che hanno contribuito a una risposta basata su dati concreti.
Questo campo viene compilato per le chiamate GenerateAnswer
.
index
integer
Solo output. Indice del candidato nell'elenco dei candidati per la risposta.
Rappresentazione JSON |
---|
{ "content": { object ( |
FinishReason
Definisce il motivo per cui il modello ha smesso di generare token.
Enum | |
---|---|
FINISH_REASON_UNSPECIFIED |
Valore predefinito. Questo valore non è utilizzato. |
STOP |
Punto di interruzione naturale del modello o sequenza di interruzione fornita. |
MAX_TOKENS |
È stato raggiunto il numero massimo di token specificato nella richiesta. |
SAFETY |
I contenuti dei candidati per la risposta sono stati segnalati per motivi di sicurezza. |
RECITATION |
I contenuti dei candidati per la risposta sono stati segnalati per motivi di richiesta. |
LANGUAGE |
I contenuti candidati per la risposta sono stati segnalati per l'utilizzo di una lingua non supportata. |
OTHER |
Motivo sconosciuto. |
BLOCKLIST |
Generazione del token interrotta perché i contenuti includono termini vietati. |
PROHIBITED_CONTENT |
Generazione del token interrotta per la possibile presenza di contenuti vietati. |
SPII |
La generazione del token è stata interrotta perché i contenuti potenzialmente contengono informazioni sensibili che consentono l'identificazione personale (informazioni personali sensibili). |
MALFORMED_FUNCTION_CALL |
La chiamata di funzione generata dal modello non è valida. |
GroundingAttribution
Attribuzione di una fonte che ha contribuito a una risposta.
sourceId
object (AttributionSourceId
)
Solo output. Identificatore della sorgente che contribuisce a questa attribuzione.
content
object (Content
)
Basandosi sui contenuti di origine che compongono questa attribuzione.
Rappresentazione JSON |
---|
{ "sourceId": { object ( |
AttributionSourceId
Identificatore della sorgente che contribuisce a questa attribuzione.
Campo unione source
.
source
può essere solo uno dei seguenti:
groundingPassage
object (GroundingPassageId
)
Identificatore per un passaggio in linea.
semanticRetrieverChunk
object (SemanticRetrieverChunk
)
Identificatore per un Chunk
recuperato tramite Semantic Retriever.
Rappresentazione JSON |
---|
{ // Union field |
GroundingPassageId
Identificatore per una parte all'interno di un GroundingPassage
.
passageId
string
Solo output. ID del passaggio corrispondente al valore GroundingPassage.id
di GenerateAnswerRequest
.
partIndex
integer
Solo output. Indice della parte all'interno del GroundingPassage.content
di GenerateAnswerRequest
.
Rappresentazione JSON |
---|
{ "passageId": string, "partIndex": integer } |
SemanticRetrieverChunk
Identificatore di Chunk
recuperato tramite il Semantic Retriever specificato in GenerateAnswerRequest
utilizzando SemanticRetrieverConfig
.
source
string
Solo output. Nome dell'origine corrispondente a SemanticRetrieverConfig.source
della richiesta. Esempio: corpora/123
o corpora/123/documents/abc
chunk
string
Solo output. Nome dell'evento Chunk
contenente il testo attribuito. Esempio: corpora/123/documents/abc/chunks/xyz
Rappresentazione JSON |
---|
{ "source": string, "chunk": string } |
CitationMetadata
Una raccolta di attribuzioni della fonte per un contenuto.
citationSources[]
object (CitationSource
)
Citazioni di fonti per una risposta specifica.
Rappresentazione JSON |
---|
{
"citationSources": [
{
object ( |
CitationSource
Una citazione a una fonte per una parte di una risposta specifica.
startIndex
integer
(Facoltativo) Inizio del segmento della risposta attribuito a questa sorgente.
L'indice indica l'inizio del segmento, misurato in byte.
endIndex
integer
(Facoltativo) Fine del segmento attribuito (escluso).
uri
string
(Facoltativo) URI attribuito come origine per una parte del testo.
license
string
(Facoltativo) Licenza per il progetto GitHub attribuito come origine del segmento.
Le informazioni sulla licenza sono obbligatorie per le citazioni di codici.
Rappresentazione JSON |
---|
{ "startIndex": integer, "endIndex": integer, "uri": string, "license": string } |
GenerationConfig
Opzioni di configurazione per la generazione e gli output del modello. Non tutti i parametri sono configurabili per ogni modello.
stopSequences[]
string
(Facoltativo) L'insieme di sequenze di caratteri (fino a 5) che interrompono la generazione dell'output. Se specificato, l'API si interromperà alla prima apparizione di un stop_sequence
. La sequenza di interruzione non sarà inclusa nella risposta.
responseMimeType
string
(Facoltativo) Tipo MIME del testo candidato generato. I tipi MIME supportati sono: text/plain
: output di testo (predefinito). application/json
: risposta JSON nei candidati di risposta. Per un elenco di tutti i tipi MIME di testo supportati, consulta la documentazione.
responseSchema
object (Schema
)
(Facoltativo) Schema di output del testo candidato generato. Gli schemi devono essere un sottoinsieme dello schema OpenAPI e possono essere oggetti, primitive o array.
Se impostato, è necessario impostare anche un responseMimeType
compatibile. Tipi MIME compatibili: application/json
: schema per la risposta JSON. Per saperne di più, consulta la guida alla generazione di testo JSON.
candidateCount
integer
(Facoltativo) Numero di risposte generate da restituire.
Al momento, questo valore può essere impostato solo su 1. Se non viene configurato, il valore predefinito è 1.
maxOutputTokens
integer
(Facoltativo) Il numero massimo di token da includere in un candidato di risposta.
Nota: il valore predefinito varia a seconda del modello; controlla l'attributo Model.output_token_limit
di Model
restituito dalla funzione getModel
.
temperature
number
(Facoltativo) Controlla la casualità dell'output.
Nota: il valore predefinito varia a seconda del modello; controlla l'attributo Model.temperature
di Model
restituito dalla funzione getModel
.
I valori possono essere compresi tra [0,0, 2,0].
topP
number
(Facoltativo) La probabilità cumulativa massima dei token da considerare durante il campionamento.
Il modello utilizza un campionamento combinato di Top-k e Top-p (nucleo).
I token vengono ordinati in base alle probabilità assegnate in modo che vengano presi in considerazione solo i token più probabili. Il campionamento top-k limita direttamente il numero massimo di token da considerare, mentre il campionamento Nucleo limita il numero di token in base alla probabilità cumulativa.
Nota: il valore predefinito varia in base a Model
ed è specificato dall'attributo Model.top_p
restituito dalla funzione getModel
. Un attributo topK
vuoto indica che il modello non applica il campionamento top-k e non consente di impostare topK
sulle richieste.
topK
integer
(Facoltativo) Il numero massimo di token da considerare durante il campionamento.
I modelli Gemini utilizzano il campionamento Top-p (nucleo) o una combinazione di campionamento Top-k e nucleo. Il campionamento Top-k prende in considerazione l'insieme di topK
token più probabili. I modelli in esecuzione con il campionamento del nucleo non consentono l'impostazione di topK.
Nota: il valore predefinito varia in base a Model
ed è specificato dall'attributo Model.top_p
restituito dalla funzione getModel
. Un attributo topK
vuoto indica che il modello non applica il campionamento top-k e non consente di impostare topK
sulle richieste.
Rappresentazione JSON |
---|
{
"stopSequences": [
string
],
"responseMimeType": string,
"responseSchema": {
object ( |
HarmCategory
La categoria di una classificazione.
Queste categorie coprono vari tipi di danni che gli sviluppatori potrebbero voler adeguare.
Enum | |
---|---|
HARM_CATEGORY_UNSPECIFIED |
La categoria non è specificata. |
HARM_CATEGORY_DEROGATORY |
Commenti negativi o dannosi che hanno come target l'identità e/o l'attributo protetto. |
HARM_CATEGORY_TOXICITY |
Contenuti scurrili, irrispettosi o volgari. |
HARM_CATEGORY_VIOLENCE |
Descrive gli scenari di violenza contro un individuo o un gruppo oppure descrizioni generali di spargimenti di sangue. |
HARM_CATEGORY_SEXUAL |
Riferimenti ad atti sessuali o ad altri contenuti osceni. |
HARM_CATEGORY_MEDICAL |
Promuove una consulenza medica non verificata. |
HARM_CATEGORY_DANGEROUS |
Contenuti pericolosi che promuovono, favoriscono o incoraggiano azioni dannose. |
HARM_CATEGORY_HARASSMENT |
Contenuti molesti. |
HARM_CATEGORY_HATE_SPEECH |
Contenuti e incitamento all'odio. |
HARM_CATEGORY_SEXUALLY_EXPLICIT |
Contenuti sessualmente espliciti. |
HARM_CATEGORY_DANGEROUS_CONTENT |
Contenuti pericolosi. |
SafetyRating
Valutazione della sicurezza di alcuni contenuti.
La valutazione di sicurezza contiene la categoria di danno e il livello di probabilità di danno in quella categoria per un determinato contenuto. I contenuti sono classificati per sicurezza in base a diverse categorie di danni e la probabilità della classificazione dei contenuti è inclusa qui.
category
enum (HarmCategory
)
Obbligatorio. La categoria di questa classificazione.
probability
enum (HarmProbability
)
Obbligatorio. La probabilità di danni per questi contenuti.
blocked
boolean
I contenuti sono stati bloccati a causa della classificazione?
Rappresentazione JSON |
---|
{ "category": enum ( |
HarmProbability
La probabilità che un determinato contenuto sia dannoso.
Il sistema di classificazione dà la probabilità che i contenuti non siano sicuri. Ciò non indica la gravità del danno per un determinato contenuto.
Enum | |
---|---|
HARM_PROBABILITY_UNSPECIFIED |
La probabilità non è specificata. |
NEGLIGIBLE |
I contenuti hanno una probabilità trascurabile di non essere sicuri. |
LOW |
I contenuti hanno una bassa probabilità di non essere sicuri. |
MEDIUM |
I contenuti hanno una media probabilità di non essere sicuri. |
HIGH |
I contenuti hanno un'alta probabilità di non essere sicuri. |
SafetySetting
Impostazione di sicurezza, che influisce sul comportamento di blocco di sicurezza.
Il superamento di un'impostazione di sicurezza per una categoria cambia la probabilità consentita che i contenuti vengano bloccati.
category
enum (HarmCategory
)
Obbligatorio. La categoria per questa impostazione.
threshold
enum (HarmBlockThreshold
)
Obbligatorio. Controlla la soglia di probabilità in cui il danno è bloccato.
Rappresentazione JSON |
---|
{ "category": enum ( |
HarmBlockThreshold
Blocco in base alla probabilità di danno specificata e oltre.
Enum | |
---|---|
HARM_BLOCK_THRESHOLD_UNSPECIFIED |
La soglia non è specificata. |
BLOCK_LOW_AND_ABOVE |
I contenuti con NEGLIGIBLE saranno consentiti. |
BLOCK_MEDIUM_AND_ABOVE |
I contenuti con valori NEGLIGIBLE e LOW saranno consentiti. |
BLOCK_ONLY_HIGH |
Saranno consentiti i contenuti di tipo NEGLIGIBLE, LOW e MEDIUM. |
BLOCK_NONE |
Saranno consentiti tutti i contenuti. |