L'API Gemini Interactions è un'API sperimentale che consente agli sviluppatori di creare applicazioni di AI generativa utilizzando i modelli Gemini. Gemini è il nostro modello più potente, sviluppato da zero per essere multimodale. È in grado di generalizzare e di comprendere, gestire e combinare senza problemi diversi tipi di informazioni, tra cui linguaggio, immagini, audio, video e codice. Puoi utilizzare l'API Gemini per casi d'uso come il ragionamento su testo e immagini, la generazione di contenuti, gli agenti di dialogo, i sistemi di riepilogo e classificazione e altro ancora.
Creare un'interazione
Crea una nuova interazione.
Corpo della richiesta
Il corpo della richiesta contiene dati con la seguente struttura:
model ModelOption (facoltativo)
Il nome del modello utilizzato per generare l'interazione.
Obbligatorio se non viene fornito "agent".
Valori possibili:
-
gemini-2.5-computer-use-preview-10-2025Un modello di funzionalità agentiche progettato per l'interazione diretta con l'interfaccia, che consente a Gemini di percepire e navigare negli ambienti digitali.
-
gemini-2.5-flashIl nostro primo modello di ragionamento ibrido che supporta una finestra contestuale da 1 milione di token e dispone di budget di pensiero.
-
gemini-2.5-flash-imageIl nostro modello nativo di generazione di immagini, ottimizzato per velocità, flessibilità e comprensione contestuale. L'input e l'output di testo hanno lo stesso prezzo di 2,5 Flash.
-
gemini-2.5-flash-liteIl nostro modello più piccolo ed economico, creato per l'utilizzo su larga scala.
-
gemini-2.5-flash-lite-preview-09-2025L'ultimo modello basato su Gemini 2.5 Flash Lite ottimizzato per costi contenuti, throughput elevato e alta qualità.
-
gemini-2.5-flash-native-audio-preview-12-2025I nostri modelli audio nativi ottimizzati per output audio di qualità superiore con un ritmo, una naturalezza della voce, un livello di dettaglio e un tono migliori.
-
gemini-2.5-flash-preview-09-2025L'ultimo modello basato sul modello 2.5 Flash. 2.5 Flash Preview è ideale per l'elaborazione su larga scala, la bassa latenza, le attività ad alto volume che richiedono ragionamento e i casi d'uso con agenti.
-
gemini-2.5-flash-preview-ttsIl nostro modello Text-to-Speech 2.5 Flash è ottimizzato per la generazione di sintesi vocale potente, controllabile e a bassa latenza.
-
gemini-2.5-proIl nostro modello multiuso all'avanguardia, che eccelle nella programmazione e nelle attività di ragionamento complesse.
-
gemini-2.5-pro-preview-ttsIl nostro modello audio Text-to-Speech 2.5 Pro ottimizzato per una generazione di voce potente e a bassa latenza per output più naturali e prompt più facili da gestire.
-
gemini-3-flash-previewIl nostro modello più intelligente, creato per la velocità, che combina intelligenza all'avanguardia con ricerca e grounding superiori.
-
gemini-3-pro-image-previewModello all'avanguardia per la generazione e la modifica di immagini.
-
gemini-3-pro-previewIl nostro modello più intelligente con ragionamento e comprensione multimodale all'avanguardia, nonché potenti funzionalità di codifica di agenti e vibe coding.
-
gemini-3.1-pro-previewIl nostro ultimo modello di ragionamento SOTA con una profondità e una sfumatura senza precedenti, nonché potenti funzionalità di comprensione multimodale e programmazione.
-
gemini-3.1-flash-image-previewIntelligenza visiva di livello professionale con efficienza alla velocità di Flash e funzionalità di generazione basate sulla realtà.
-
gemini-3.1-flash-lite-previewIl nostro modello più conveniente, ottimizzato per attività agentiche ad alto volume, traduzione ed elaborazione di dati semplici.
-
gemini-3.1-flash-tts-previewGemini 3.1 Flash TTS: generazione di sintesi vocale potente e a bassa latenza. Goditi output naturali, prompt orientabili e nuovi tag audio espressivi per un controllo preciso della narrazione.
-
lyria-3-clip-previewIl nostro modello di generazione musicale a bassa latenza ottimizzato per clip audio ad alta fedeltà e un controllo ritmico preciso.
-
lyria-3-pro-previewIl nostro modello generativo avanzato per brani completi con una profonda comprensione della composizione, ottimizzato per un controllo strutturale preciso e transizioni complesse in diversi stili musicali.
agent AgentOption (facoltativo)
Il nome dell'agente utilizzato per generare l'interazione.
Obbligatorio se non viene fornito "model".
Valori possibili:
-
deep-research-pro-preview-12-2025Agente Gemini Deep Research
-
deep-research-preview-04-2026Agente Gemini Deep Research
-
deep-research-max-preview-04-2026Gemini Deep Research Max Agent
Gli input per l'interazione (comuni sia al modello che all'agente).
Istruzione di sistema per l'interazione.
Un elenco di dichiarazioni di strumenti che il modello può chiamare durante l'interazione.
Impone che la risposta generata sia un oggetto JSON conforme allo schema JSON specificato in questo campo.
Il tipo MIME della risposta. Questo campo è obbligatorio se è impostato response_format.
Solo input. Se l'interazione verrà trasmessa in streaming.
Solo input. Se memorizzare la risposta e la richiesta per il recupero successivo.
Solo input. Indica se eseguire l'interazione del modello in background.
generation_config GenerationConfig (facoltativo)
Configurazione modello
Parametri di configurazione per l'interazione del modello.
Alternativa a "agent_config". Applicabile solo quando è impostato "model".
Campi
Controlla la casualità dell'output.
La probabilità cumulativa massima dei token da considerare durante il campionamento.
Seed utilizzato nella decodifica per la riproducibilità.
Un elenco di sequenze di caratteri che interromperanno l'interazione di output.
thinking_level ThinkingLevel (facoltativo)
Il livello di token di pensiero che il modello deve generare.
Valori possibili:
-
minimal -
low -
medium -
high
thinking_summaries ThinkingSummaries (facoltativo)
Se includere i riepiloghi del pensiero nella risposta.
Valori possibili:
-
auto -
none
Il numero massimo di token da includere nella risposta.
speech_config SpeechConfig (facoltativo)
Configurazione per l'interazione vocale.
Campi
La voce dell'oratore.
La lingua del discorso.
Il nome dell'oratore, che deve corrispondere a quello indicato nel prompt.
image_config ImageConfig (facoltativo)
Configurazione per l'interazione con le immagini.
Campi
Nessuna descrizione fornita.
Valori possibili:
-
1:1 -
2:3 -
3:2 -
3:4 -
4:3 -
4:5 -
5:4 -
9:16 -
16:9 -
21:9 -
1:8 -
8:1 -
1:4 -
4:1
Nessuna descrizione fornita.
Valori possibili:
-
1K -
2K -
4K -
512
La configurazione della scelta dello strumento.
agent_config object (facoltativo)
Configurazione dell'agente
Configurazione dell'agente.
Alternativa a `generation_config`. Applicabile solo quando è impostato `agent`.
Tipi possibili
Discriminatore polimorfico: type
DynamicAgentConfig
Configurazione per gli agenti dinamici.
Nessuna descrizione fornita.
Sempre impostato su "dynamic".
DeepResearchAgentConfig
Configurazione dell'agente Deep Research.
Nessuna descrizione fornita.
Sempre impostato su "deep-research".
thinking_summaries ThinkingSummaries (facoltativo)
Se includere i riepiloghi del pensiero nella risposta.
Valori possibili:
-
auto -
none
Indica se includere le visualizzazioni nella risposta.
Valori possibili:
-
off -
auto
Consente la pianificazione human-in-the-loop per l'agente Deep Research. Se impostato su true, l'agente Deep Research fornirà un piano di ricerca nella sua risposta. L'agente procederà solo se l'utente conferma il piano nel turno successivo.
L'ID dell'interazione precedente, se presente.
response_modalities ResponseModality (facoltativo)
Le modalità richieste della risposta (TEXT, IMAGE, AUDIO).
Valori possibili:
-
text -
image -
audio -
video -
document
Il livello di servizio per l'interazione.
Valori possibili:
-
flex -
standard -
priority
Risposta
Restituisce una risorsa Interaction.
Richiesta semplice
Esempio di risposta
{ "created": "2025-11-26T12:25:15Z", "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "object": "interaction", "outputs": [ { "text": "Hello! I'm functioning perfectly and ready to assist you.\n\nHow are you doing today?", "type": "text" } ], "role": "model", "status": "completed", "updated": "2025-11-26T12:25:15Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 7 } ], "total_cached_tokens": 0, "total_input_tokens": 7, "total_output_tokens": 20, "total_thought_tokens": 22, "total_tokens": 49, "total_tool_use_tokens": 0 } }
In più passaggi
Esempio di risposta
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "role": "model", "outputs": [ { "type": "text", "text": "The capital of France is Paris." } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 50 } ], "total_cached_tokens": 0, "total_input_tokens": 50, "total_output_tokens": 10, "total_thought_tokens": 0, "total_tokens": 60, "total_tool_use_tokens": 0 } }
Input immagine
Esempio di risposta
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "role": "model", "outputs": [ { "type": "text", "text": "A white humanoid robot with glowing blue eyes stands holding a red skateboard." } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 10 }, { "modality": "image", "tokens": 258 } ], "total_cached_tokens": 0, "total_input_tokens": 268, "total_output_tokens": 20, "total_thought_tokens": 0, "total_tokens": 288, "total_tool_use_tokens": 0 } }
Chiamata di funzione
Esempio di risposta
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "requires_action", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "role": "model", "outputs": [ { "type": "function_call", "id": "gth23981", "name": "get_weather", "arguments": { "location": "Boston, MA" } } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 100 } ], "total_cached_tokens": 0, "total_input_tokens": 100, "total_output_tokens": 25, "total_thought_tokens": 0, "total_tokens": 125, "total_tool_use_tokens": 50 } }
Deep Research
Esempio di risposta
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "agent": "deep-research-pro-preview-12-2025", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "role": "agent", "outputs": [ { "type": "text", "text": "Here is a comprehensive research report on the current state of cancer research..." } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 20 } ], "total_cached_tokens": 0, "total_input_tokens": 20, "total_output_tokens": 1000, "total_thought_tokens": 500, "total_tokens": 1520, "total_tool_use_tokens": 0 } }
Recuperare un'interazione
Recupera i dettagli completi di una singola interazione in base al relativo `Interaction.id`.
Parametri percorso / query
L'identificatore univoco dell'interazione da recuperare.
Se è impostato su true, i contenuti generati verranno trasmessi in streaming in modo incrementale.
Valore predefinito: False
Facoltativo. Se impostato, riprende il flusso di interazione dal blocco successivo all'evento contrassegnato dall'ID evento. Può essere utilizzato solo se "stream" è true.
Se è impostata su true, include l'input nella risposta.
Valore predefinito: False
Quale versione dell'API utilizzare.
Risposta
Restituisce una risorsa Interaction.
Recupero interazione
Esempio di risposta
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:25:15Z", "updated": "2025-11-26T12:25:15Z", "role": "model", "outputs": [ { "type": "text", "text": "I'm doing great, thank you for asking! How can I help you today?" } ] }
Eliminazione di un'interazione
Elimina l'interazione in base all'ID.
Parametri percorso / query
L'identificatore univoco dell'interazione da eliminare.
Quale versione dell'API utilizzare.
Risposta
In caso di esito positivo, la risposta è vuota.
Elimina interazione
Annullare un'interazione
Annulla un'interazione in base all'ID. Questo vale solo per le interazioni in background ancora in esecuzione.
Parametri percorso / query
L'identificatore univoco dell'interazione da annullare.
Quale versione dell'API utilizzare.
Risposta
Restituisce una risorsa Interaction.
Annulla interazione
Esempio di risposta
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "agent": "deep-research-pro-preview-12-2025", "status": "cancelled", "object": "interaction", "created": "2025-11-26T12:25:15Z", "updated": "2025-11-26T12:25:15Z", "role": "agent" }
Risorse
Interazione
La risorsa Interaction.
Campi
model ModelOption (facoltativo)
Il nome del modello utilizzato per generare l'interazione.
Valori possibili:
-
gemini-2.5-computer-use-preview-10-2025Un modello di funzionalità agentiche progettato per l'interazione diretta con l'interfaccia, che consente a Gemini di percepire e navigare negli ambienti digitali.
-
gemini-2.5-flashIl nostro primo modello di ragionamento ibrido che supporta una finestra contestuale da 1 milione di token e dispone di budget di pensiero.
-
gemini-2.5-flash-imageIl nostro modello nativo di generazione di immagini, ottimizzato per velocità, flessibilità e comprensione contestuale. L'input e l'output di testo hanno lo stesso prezzo di 2,5 Flash.
-
gemini-2.5-flash-liteIl nostro modello più piccolo ed economico, creato per l'utilizzo su larga scala.
-
gemini-2.5-flash-lite-preview-09-2025L'ultimo modello basato su Gemini 2.5 Flash Lite ottimizzato per costi contenuti, throughput elevato e alta qualità.
-
gemini-2.5-flash-native-audio-preview-12-2025I nostri modelli audio nativi ottimizzati per output audio di qualità superiore con un ritmo, una naturalezza della voce, un livello di dettaglio e un tono migliori.
-
gemini-2.5-flash-preview-09-2025L'ultimo modello basato sul modello 2.5 Flash. 2.5 Flash Preview è ideale per l'elaborazione su larga scala, la bassa latenza, le attività ad alto volume che richiedono ragionamento e i casi d'uso con agenti.
-
gemini-2.5-flash-preview-ttsIl nostro modello Text-to-Speech 2.5 Flash è ottimizzato per la generazione di sintesi vocale potente, controllabile e a bassa latenza.
-
gemini-2.5-proIl nostro modello multiuso all'avanguardia, che eccelle nella programmazione e nelle attività di ragionamento complesse.
-
gemini-2.5-pro-preview-ttsIl nostro modello audio Text-to-Speech 2.5 Pro ottimizzato per una generazione di voce potente e a bassa latenza per output più naturali e prompt più facili da gestire.
-
gemini-3-flash-previewIl nostro modello più intelligente, creato per la velocità, che combina intelligenza all'avanguardia con ricerca e grounding superiori.
-
gemini-3-pro-image-previewModello all'avanguardia per la generazione e la modifica di immagini.
-
gemini-3-pro-previewIl nostro modello più intelligente con ragionamento e comprensione multimodale all'avanguardia, nonché potenti funzionalità di codifica di agenti e vibe coding.
-
gemini-3.1-pro-previewIl nostro ultimo modello di ragionamento SOTA con una profondità e una sfumatura senza precedenti, nonché potenti funzionalità di comprensione multimodale e programmazione.
-
gemini-3.1-flash-image-previewIntelligenza visiva di livello professionale con efficienza alla velocità di Flash e funzionalità di generazione basate sulla realtà.
-
gemini-3.1-flash-lite-previewIl nostro modello più conveniente, ottimizzato per attività agentiche ad alto volume, traduzione ed elaborazione di dati semplici.
-
gemini-3.1-flash-tts-previewGemini 3.1 Flash TTS: generazione di sintesi vocale potente e a bassa latenza. Goditi output naturali, prompt orientabili e nuovi tag audio espressivi per un controllo preciso della narrazione.
-
lyria-3-clip-previewIl nostro modello di generazione musicale a bassa latenza ottimizzato per clip audio ad alta fedeltà e un controllo ritmico preciso.
-
lyria-3-pro-previewIl nostro modello generativo avanzato per brani completi con una profonda comprensione della composizione, ottimizzato per un controllo strutturale preciso e transizioni complesse in diversi stili musicali.
agent AgentOption (facoltativo)
Il nome dell'agente utilizzato per generare l'interazione.
Valori possibili:
-
deep-research-pro-preview-12-2025Agente Gemini Deep Research
-
deep-research-preview-04-2026Agente Gemini Deep Research
-
deep-research-max-preview-04-2026Gemini Deep Research Max Agent
Obbligatorio. Solo output. Un identificatore univoco per il completamento dell'interazione.
Obbligatorio. Solo output. Lo stato dell'interazione.
Valori possibili:
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
Obbligatorio. Solo output. L'ora in cui è stata creata la risposta nel formato ISO 8601 (AAAA-MM-GGThh:mm:ssZ).
Obbligatorio. Solo output. L'ora in cui la risposta è stata aggiornata l'ultima volta nel formato ISO 8601 (AAAA-MM-GGThh:mm:ssZ).
Solo output. Il ruolo dell'interazione.
Solo output. Risposte del modello.
Istruzione di sistema per l'interazione.
Un elenco di dichiarazioni di strumenti che il modello può chiamare durante l'interazione.
usage Utilizzo (facoltativo)
Solo output. Statistiche sull'utilizzo dei token della richiesta di interazione.
Campi
Numero di token nel prompt (contesto).
input_tokens_by_modality ModalityTokens (facoltativo)
Una suddivisione dell'utilizzo dei token di input per modalità.
Campi
modalità ResponseModality (facoltativo)
La modalità associata al conteggio dei token.
Valori possibili:
-
text -
image -
audio -
video -
document
Numero di token per la modalità.
Numero di token nella parte memorizzata nella cache del prompt (i contenuti memorizzati nella cache).
cached_tokens_by_modality ModalityTokens (facoltativo)
Una suddivisione dell'utilizzo dei token memorizzati nella cache per modalità.
Campi
modalità ResponseModality (facoltativo)
La modalità associata al conteggio dei token.
Valori possibili:
-
text -
image -
audio -
video -
document
Numero di token per la modalità.
Numero totale di token in tutte le risposte generate.
output_tokens_by_modality ModalityTokens (facoltativo)
Una suddivisione dell'utilizzo dei token di output per modalità.
Campi
modalità ResponseModality (facoltativo)
La modalità associata al conteggio dei token.
Valori possibili:
-
text -
image -
audio -
video -
document
Numero di token per la modalità.
Numero di token presenti nei prompt di utilizzo degli strumenti.
tool_use_tokens_by_modality ModalityTokens (facoltativo)
Una suddivisione dell'utilizzo dei token di utilizzo degli strumenti per modalità.
Campi
modalità ResponseModality (facoltativo)
La modalità associata al conteggio dei token.
Valori possibili:
-
text -
image -
audio -
video -
document
Numero di token per la modalità.
Numero di token di pensieri per i modelli di ragionamento.
Conteggio totale dei token per la richiesta di interazione (prompt + risposte + altri token interni).
response_modalities ResponseModality (facoltativo)
Le modalità richieste della risposta (TEXT, IMAGE, AUDIO).
Valori possibili:
-
text -
image -
audio -
video -
document
Impone che la risposta generata sia un oggetto JSON conforme allo schema JSON specificato in questo campo.
Il tipo MIME della risposta. Questo campo è obbligatorio se è impostato response_format.
L'ID dell'interazione precedente, se presente.
Il livello di servizio per l'interazione.
Valori possibili:
-
flex -
standard -
priority
agent_config object (facoltativo)
Parametri di configurazione per l'interazione con l'agente.
Tipi possibili
Discriminatore polimorfico: type
DynamicAgentConfig
Configurazione per gli agenti dinamici.
Nessuna descrizione fornita.
Sempre impostato su "dynamic".
DeepResearchAgentConfig
Configurazione dell'agente Deep Research.
Nessuna descrizione fornita.
Sempre impostato su "deep-research".
thinking_summaries ThinkingSummaries (facoltativo)
Se includere i riepiloghi del pensiero nella risposta.
Valori possibili:
-
auto -
none
Indica se includere le visualizzazioni nella risposta.
Valori possibili:
-
off -
auto
Consente la pianificazione human-in-the-loop per l'agente Deep Research. Se impostato su true, l'agente Deep Research fornirà un piano di ricerca nella sua risposta. L'agente procederà solo se l'utente conferma il piano nel turno successivo.
Esempi
Esempio
{ "created": "2025-12-04T15:01:45Z", "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg", "model": "gemini-3-flash-preview", "object": "interaction", "outputs": [ { "text": "Hello! I'm doing well, functioning as expected. Thank you for asking! How are you doing today?", "type": "text" } ], "role": "model", "status": "completed", "updated": "2025-12-04T15:01:45Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 7 } ], "total_cached_tokens": 0, "total_input_tokens": 7, "total_output_tokens": 23, "total_thought_tokens": 49, "total_tokens": 79, "total_tool_use_tokens": 0 } }
Modelli di dati
Contenuti
Il contenuto della risposta.
Tipi possibili
Discriminatore polimorfico: type
TextContent
Un blocco di contenuti testuali.
Nessuna descrizione fornita.
Sempre impostato su "text".
Obbligatorio. Il contenuto testuale.
annotazioni Annotazione (facoltativo)
Informazioni sulle citazioni per i contenuti generati dal modello.
Tipi possibili
Discriminatore polimorfico: type
UrlCitation
Un'annotazione di citazione di URL.
Nessuna descrizione fornita.
Sempre impostato su "url_citation".
L'URL.
Il titolo dell'URL.
Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.
Fine del segmento attribuito, esclusa.
FileCitation
Un'annotazione di citazione di un file.
Nessuna descrizione fornita.
Sempre impostato su "file_citation".
L'URI del file.
Il nome del file.
Fonte attribuita a una parte del testo.
Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.
Fine del segmento attribuito, esclusa.
PlaceCitation
Un'annotazione di citazione di un luogo.
Nessuna descrizione fornita.
Sempre impostato su "place_citation".
L'ID del luogo, nel formato `places/{place_id}`.
Titolo del luogo.
Riferimento URI del luogo.
review_snippets ReviewSnippet (facoltativo)
Snippet di recensioni utilizzati per generare risposte sulle caratteristiche di un determinato luogo in Google Maps.
Campi
Titolo della recensione.
Un link che corrisponde alla recensione dell'utente su Google Maps.
L'ID dello snippet recensione.
Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.
Fine del segmento attribuito, esclusa.
ImageContent
Un blocco di contenuti immagine.
Nessuna descrizione fornita.
Sempre impostato su "image".
Il contenuto dell'immagine.
L'URI dell'immagine.
Il tipo MIME dell'immagine.
Valori possibili:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
risoluzione MediaResolution (facoltativo)
La risoluzione dei contenuti multimediali.
Valori possibili:
-
low -
medium -
high -
ultra_high
AudioContent
Un blocco di contenuti audio.
Nessuna descrizione fornita.
Sempre impostato su "audio".
I contenuti audio.
L'URI dell'audio.
Il tipo MIME dell'audio.
Valori possibili:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
La frequenza di campionamento dell'audio.
Il numero di canali audio.
DocumentContent
Un blocco di contenuti del documento.
Nessuna descrizione fornita.
Sempre impostato su "document".
I contenuti del documento.
L'URI del documento.
Il tipo MIME del documento.
Valori possibili:
-
application/pdf
VideoContent
Un blocco di contenuti video.
Nessuna descrizione fornita.
Sempre impostato su "video".
I contenuti video.
L'URI del video.
Il tipo MIME del video.
Valori possibili:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
risoluzione MediaResolution (facoltativo)
La risoluzione dei contenuti multimediali.
Valori possibili:
-
low -
medium -
high -
ultra_high
ThoughtContent
Un blocco di contenuti di pensiero.
Nessuna descrizione fornita.
Sempre impostato su "thought".
Firma per abbinare l'origine di backend da includere nella generazione.
summary ThoughtSummaryContent (facoltativo)
Un riepilogo del pensiero.
Tipi possibili
Discriminatore polimorfico: type
TextContent
Un blocco di contenuti testuali.
Nessuna descrizione fornita.
Sempre impostato su "text".
Obbligatorio. Il contenuto testuale.
annotazioni Annotazione (facoltativo)
Informazioni sulle citazioni per i contenuti generati dal modello.
Tipi possibili
Discriminatore polimorfico: type
UrlCitation
Un'annotazione di citazione di URL.
Nessuna descrizione fornita.
Sempre impostato su "url_citation".
L'URL.
Il titolo dell'URL.
Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.
Fine del segmento attribuito, esclusa.
FileCitation
Un'annotazione di citazione di un file.
Nessuna descrizione fornita.
Sempre impostato su "file_citation".
L'URI del file.
Il nome del file.
Fonte attribuita a una parte del testo.
Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.
Fine del segmento attribuito, esclusa.
PlaceCitation
Un'annotazione di citazione di un luogo.
Nessuna descrizione fornita.
Sempre impostato su "place_citation".
L'ID del luogo, nel formato `places/{place_id}`.
Titolo del luogo.
Riferimento URI del luogo.
review_snippets ReviewSnippet (facoltativo)
Snippet di recensioni utilizzati per generare risposte sulle caratteristiche di un determinato luogo in Google Maps.
Campi
Titolo della recensione.
Un link che corrisponde alla recensione dell'utente su Google Maps.
L'ID dello snippet recensione.
Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.
Fine del segmento attribuito, esclusa.
ImageContent
Un blocco di contenuti immagine.
Nessuna descrizione fornita.
Sempre impostato su "image".
Il contenuto dell'immagine.
L'URI dell'immagine.
Il tipo MIME dell'immagine.
Valori possibili:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
risoluzione MediaResolution (facoltativo)
La risoluzione dei contenuti multimediali.
Valori possibili:
-
low -
medium -
high -
ultra_high
FunctionCallContent
Un blocco di contenuti di chiamata dello strumento funzione.
Nessuna descrizione fornita.
Sempre impostato su "function_call".
Obbligatorio. Il nome dello strumento da chiamare.
Obbligatorio. Gli argomenti da passare alla funzione.
Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.
Un hash della firma per la convalida del backend.
CodeExecutionCallContent
Contenuti di esecuzione del codice.
Nessuna descrizione fornita.
Sempre impostato su "code_execution_call".
arguments CodeExecutionCallArguments (obbligatorio)
Obbligatorio. Gli argomenti da passare all'esecuzione del codice.
Campi
Linguaggio di programmazione di `code`.
Valori possibili:
-
python
Il codice da eseguire.
Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.
Un hash della firma per la convalida del backend.
UrlContextCallContent
Contenuti del contesto dell'URL.
Nessuna descrizione fornita.
Sempre impostato su "url_context_call".
arguments UrlContextCallArguments (obbligatorio)
Obbligatorio. Gli argomenti da passare al contesto dell'URL.
Campi
Gli URL da recuperare.
Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.
Un hash della firma per la convalida del backend.
McpServerToolCallContent
Contenuti della chiamata allo strumento MCPServer.
Nessuna descrizione fornita.
Sempre impostato su "mcp_server_tool_call".
Obbligatorio. Il nome dello strumento chiamato.
Obbligatorio. Il nome del server MCP utilizzato.
Obbligatorio. L'oggetto JSON degli argomenti della funzione.
Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.
Un hash della firma per la convalida del backend.
GoogleSearchCallContent
Contenuti della Ricerca Google.
Nessuna descrizione fornita.
Sempre impostato su "google_search_call".
arguments GoogleSearchCallArguments (obbligatorio)
Obbligatorio. Gli argomenti da passare alla Ricerca Google.
Campi
Query di ricerca web per la ricerca web successiva.
Il tipo di grounding della ricerca abilitato.
Valori possibili:
-
web_search -
image_search -
enterprise_web_search
Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.
Un hash della firma per la convalida del backend.
FileSearchCallContent
Contenuti della ricerca di file.
Nessuna descrizione fornita.
Sempre impostato su "file_search_call".
Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.
Un hash della firma per la convalida del backend.
GoogleMapsCallContent
Contenuti di Google Maps.
Nessuna descrizione fornita.
Sempre impostato su "google_maps_call".
arguments GoogleMapsCallArguments (facoltativo)
Gli argomenti da passare allo strumento Google Maps.
Campi
Le query da eseguire.
Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.
Un hash della firma per la convalida del backend.
FunctionResultContent
Un blocco di contenuti dei risultati dello strumento Funzione.
Nessuna descrizione fornita.
Sempre impostato su "function_result".
Il nome dello strumento chiamato.
Indica se la chiamata allo strumento ha generato un errore.
Obbligatorio. ID che corrisponde all'ID del blocco di chiamata di funzione.
Un hash della firma per la convalida del backend.
Il risultato della chiamata allo strumento.
CodeExecutionResultContent
Contenuti del risultato dell'esecuzione del codice.
Nessuna descrizione fornita.
Sempre impostato su "code_execution_result".
Obbligatorio. L'output dell'esecuzione del codice.
Indica se l'esecuzione del codice ha generato un errore.
Obbligatorio. ID che corrisponde all'ID del blocco di chiamata di funzione.
Un hash della firma per la convalida del backend.
UrlContextResultContent
Contenuti dei risultati del contesto URL.
Nessuna descrizione fornita.
Sempre impostato su "url_context_result".
result UrlContextResult (obbligatorio)
Obbligatorio. I risultati del contesto dell'URL.
Campi
L'URL recuperato.
Lo stato del recupero dell'URL.
Valori possibili:
-
success -
error -
paywall -
unsafe
Indica se il contesto dell'URL ha generato un errore.
Obbligatorio. ID che corrisponde all'ID del blocco di chiamata di funzione.
Un hash della firma per la convalida del backend.
GoogleSearchResultContent
Contenuti dei risultati di ricerca di Google.
Nessuna descrizione fornita.
Sempre impostato su "google_search_result".
result GoogleSearchResult (obbligatorio)
Obbligatorio. I risultati della Ricerca Google.
Campi
Snippet di contenuti web che può essere incorporato in una pagina web o in una webview di un'app.
Indica se la Ricerca Google ha generato un errore.
Obbligatorio. ID che corrisponde all'ID del blocco di chiamata di funzione.
Un hash della firma per la convalida del backend.
McpServerToolResultContent
Contenuti del risultato dello strumento MCPServer.
Nessuna descrizione fornita.
Sempre impostato su "mcp_server_tool_result".
Nome dello strumento chiamato per questa chiamata specifica.
Il nome del server MCP utilizzato.
Obbligatorio. ID che corrisponde all'ID del blocco di chiamata di funzione.
Un hash della firma per la convalida del backend.
L'output della chiamata al server MCP. Può essere un semplice testo o contenuti avanzati.
FileSearchResultContent
Contenuti dei risultati della ricerca di file.
Nessuna descrizione fornita.
Sempre impostato su "file_search_result".
result FileSearchResult (obbligatorio)
Obbligatorio. I risultati della ricerca di file.
Campi
Metadati forniti dall'utente su FileSearchResult.
Obbligatorio. ID che corrisponde all'ID del blocco di chiamata di funzione.
Un hash della firma per la convalida del backend.
GoogleMapsResultContent
Contenuti dei risultati di Google Maps.
Nessuna descrizione fornita.
Sempre impostato su "google_maps_result".
result GoogleMapsResult (obbligatorio)
Obbligatorio. I risultati di Google Maps.
Campi
luoghi Luoghi (facoltativo)
I luoghi trovati.
Campi
L'ID del luogo, nel formato `places/{place_id}`.
Titolo del luogo.
Riferimento URI del luogo.
review_snippets ReviewSnippet (facoltativo)
Snippet di recensioni utilizzati per generare risposte sulle caratteristiche di un determinato luogo in Google Maps.
Campi
Titolo della recensione.
Un link che corrisponde alla recensione dell'utente su Google Maps.
L'ID dello snippet recensione.
Nome della risorsa del token di contesto del widget di Google Maps.
Obbligatorio. ID che corrisponde all'ID del blocco di chiamata di funzione.
Un hash della firma per la convalida del backend.
Esempi
Testo
{ "type": "text", "text": "Hello, how are you?" }
Immagine
{ "type": "image", "data": "BASE64_ENCODED_IMAGE", "mime_type": "image/png" }
Audio
{ "type": "audio", "data": "BASE64_ENCODED_AUDIO", "mime_type": "audio/wav" }
Documento
{ "type": "document", "data": "BASE64_ENCODED_DOCUMENT", "mime_type": "application/pdf" }
Video
{ "type": "video", "uri": "https://www.youtube.com/watch?v=9hE5-98ZeCg" }
Pensiero
{ "type": "thought", "summary": [ { "type": "text", "text": "The user is asking about the weather. I should use the get_weather tool." } ], "signature": "CoMDAXLI2nynRYojJIy6B1Jh9os2crpWLfB0+19xcLsGG46bd8wjkF/6RNlRUdvHrXyjsHkG0BZFcuO/bPOyA6Xh5jANNgx82wPHjGExN8A4ZQn56FlMwyZoqFVQz0QyY1lfibFJ2zU3J87uw26OewzcuVX0KEcs+GIsZa3EA6WwqhbsOd3wtZB3Ua2Qf98VAWZTS5y/tWpql7jnU3/CU7pouxQr/Bwft3hwnJNesQ9/dDJTuaQ8Zprh9VRWf1aFFjpIueOjBRrlT3oW6/y/eRl/Gt9BQXCYTqg/38vHFUU4Wo/d9dUpvfCe/a3o97t2Jgxp34oFKcsVb4S5WJrykIkw+14DzVnTpCpbQNFckqvFLuqnJCkL0EQFtunBXI03FJpPu3T1XU6id8S7ojoJQZSauGUCgmaLqUGdMrd08oo81ecoJSLs51Re9N/lISGmjWFPGpqJLoGq6uo4FHz58hmeyXCgHG742BHz2P3MiH1CXHUT2J8mF6zLhf3SR9Qb3lkrobAh" }
Chiamata di funzione
{ "type": "function_call", "name": "get_weather", "id": "gth23981", "arguments": { "location": "Boston, MA" } }
Chiamata di esecuzione del codice
{ "type": "code_execution_call", "id": "call_123456", "arguments": { "language": "python", "code": "print('hello world')" } }
Chiamata al contesto URL
{ "type": "url_context_call", "id": "call_123456", "arguments": { "urls": [ "https://www.example.com" ] } }
Chiamata dello strumento del server MCP
{ "type": "mcp_server_tool_call", "id": "call_123456", "name": "get_forecast", "server_name": "weather_server", "arguments": { "city": "London" } }
Chiamata dalla Ricerca Google
{ "type": "google_search_call", "id": "call_123456", "arguments": { "queries": [ "weather in Boston" ] } }
Chiamata di ricerca file
{ "type": "file_search_call", "id": "call_123456" }
Chiamata Google Maps
{ "type": "google_maps_call", "id": "call_123456", "arguments": { "query": "best food near me" } }
Function Result
{ "type": "function_result", "name": "get_weather", "call_id": "gth23981", "result": [ { "type": "text", "text": "{\"weather\":\"sunny\"}" } ] }
Risultato dell'esecuzione del codice
{ "type": "code_execution_result", "call_id": "call_123456", "result": "hello world" }
Risultato del contesto URL
{ "type": "url_context_result", "call_id": "call_123456", "result": [ { "url": "https://www.example.com", "status": "SUCCESS" } ] }
Risultato di ricerca di Google
{ "type": "google_search_result", "call_id": "call_123456", "result": [ { "url": "https://www.google.com/search?q=weather+in+Boston", "title": "Weather in Boston" } ] }
Risultato dello strumento server MCP
{ "type": "mcp_server_tool_result", "name": "get_forecast", "server_name": "weather_server", "call_id": "call_123456", "result": "sunny" }
Risultato di ricerca di file
{ "type": "file_search_result", "call_id": "call_123456", "result": [ { "text": "search result chunk", "file_search_store": "file_search_store" } ] }
Risultato di Google Maps
{ "type": "google_maps_result", "call_id": "call_123456", "result": [ { "places": [ { "url": "https://www.google.com/maps/search/best+food+near+me", "name": "Tasty Restaurant" } ] } ] }
Strumento
Uno strumento che può essere utilizzato dal modello.
Tipi possibili
Discriminatore polimorfico: type
Funzione
Uno strumento che può essere utilizzato dal modello.
Nessuna descrizione fornita.
Sempre impostato su "function".
Il nome della funzione.
Una descrizione della funzione.
Lo schema JSON per i parametri della funzione.
CodeExecution
Uno strumento che può essere utilizzato dal modello per eseguire il codice.
Nessuna descrizione fornita.
Sempre impostato su "code_execution".
UrlContext
Uno strumento che può essere utilizzato dal modello per recuperare il contesto dell'URL.
Nessuna descrizione fornita.
Sempre impostato su "url_context".
ComputerUse
Uno strumento che può essere utilizzato dal modello per interagire con il computer.
Nessuna descrizione fornita.
Sempre impostato su "computer_use".
L'ambiente in cui viene eseguita l'operazione.
Valori possibili:
-
browser
L'elenco delle funzioni predefinite escluse dalla chiamata del modello.
McpServer
Un server MCP è un server che può essere chiamato dal modello per eseguire azioni.
Nessuna descrizione fornita.
Sempre impostato su "mcp_server".
Il nome di MCPServer.
L'URL completo dell'endpoint MCPServer. Esempio: "https://api.example.com/mcp"
(Facoltativo) Campi per intestazioni di autenticazione, timeout e così via, se necessario.
allowed_tools AllowedTools (facoltativo)
Gli strumenti consentiti.
Campi
mode ToolChoiceType (facoltativo)
La modalità di scelta dello strumento.
Valori possibili:
-
auto -
any -
none -
validated
I nomi degli strumenti consentiti.
GoogleSearch
Uno strumento che può essere utilizzato dal modello per eseguire ricerche su Google.
Nessuna descrizione fornita.
Sempre impostato su "google_search".
I tipi di grounding della ricerca da attivare.
Valori possibili:
-
web_search -
image_search -
enterprise_web_search
FileSearch
Uno strumento che può essere utilizzato dal modello per cercare i file.
Nessuna descrizione fornita.
Sempre impostato su "file_search".
I nomi dei negozi in cui cercare i file.
Il numero di blocchi di recupero semantico da recuperare.
Filtro dei metadati da applicare ai documenti e ai chunk di recupero semantico.
GoogleMaps
Uno strumento che può essere utilizzato dal modello per chiamare Google Maps.
Nessuna descrizione fornita.
Sempre impostato su "google_maps".
Indica se restituire un token di contesto del widget nel risultato della chiamata allo strumento della risposta.
La latitudine della posizione dell'utente.
La longitudine della posizione dell'utente.
Recupero
Uno strumento che può essere utilizzato dal modello per recuperare i file.
Nessuna descrizione fornita.
Sempre impostato su "retrieval".
I tipi di recupero dei file da attivare.
Valori possibili:
-
vertex_ai_search
vertex_ai_search_config VertexAISearchConfig (facoltativo)
Utilizzato per specificare la configurazione per VertexAISearch.
Campi
Facoltativo. Utilizzato per specificare Vertex AI Search.
Facoltativo. Utilizzato per specificare i datastore di Vertex AI Search.
Esempi
Funzione
CodeExecution
UrlContext
ComputerUse
McpServer
GoogleSearch
FileSearch
GoogleMaps
Recupero
Nessun esempio disponibile per questo tipo.
CANNOT TRANSLATE
Campi
L'autore di questo turno. Deve essere un utente per l'input o un modello per l'output del modello.
Nessuna descrizione fornita.
Esempi
Turno dell'utente
{ "role": "user", "content": [ { "type": "text", "text": "user turn" } ] }
Model Turn
{ "role": "model", "content": [ { "type": "text", "text": "model turn" } ] }
InteractionSseEvent
Tipi possibili
Discriminatore polimorfico: event_type
InteractionStartEvent
Nessuna descrizione fornita.
Sempre impostato su "interaction.start".
Nessuna descrizione fornita.
Il token event_id da utilizzare per riprendere lo stream di interazione da questo evento.
InteractionCompleteEvent
Nessuna descrizione fornita.
Sempre impostato su "interaction.complete".
Obbligatorio. L'interazione completata con output vuoti per ridurre le dimensioni del payload. Utilizza gli eventi ContentDelta precedenti per l'output effettivo.
Il token event_id da utilizzare per riprendere lo stream di interazione da questo evento.
InteractionStatusUpdate
Nessuna descrizione fornita.
Sempre impostato su "interaction.status_update".
Nessuna descrizione fornita.
Nessuna descrizione fornita.
Valori possibili:
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
Il token event_id da utilizzare per riprendere lo stream di interazione da questo evento.
ContentStart
Nessuna descrizione fornita.
Sempre impostato su "content.start".
Nessuna descrizione fornita.
Nessuna descrizione fornita.
Il token event_id da utilizzare per riprendere lo stream di interazione da questo evento.
ContentDelta
Nessuna descrizione fornita.
Sempre impostato su "content.delta".
Nessuna descrizione fornita.
delta ContentDeltaData (obbligatorio)
Nessuna descrizione fornita.
Tipi possibili
Discriminatore polimorfico: type
TextDelta
Nessuna descrizione fornita.
Sempre impostato su "text".
Nessuna descrizione fornita.
ImageDelta
Nessuna descrizione fornita.
Sempre impostato su "image".
Nessuna descrizione fornita.
Nessuna descrizione fornita.
Nessuna descrizione fornita.
Valori possibili:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
risoluzione MediaResolution (facoltativo)
La risoluzione dei contenuti multimediali.
Valori possibili:
-
low -
medium -
high -
ultra_high
AudioDelta
Nessuna descrizione fornita.
Sempre impostato su "audio".
Nessuna descrizione fornita.
Nessuna descrizione fornita.
Nessuna descrizione fornita.
Valori possibili:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
La frequenza di campionamento dell'audio.
Il numero di canali audio.
DocumentDelta
Nessuna descrizione fornita.
Sempre impostato su "document".
Nessuna descrizione fornita.
Nessuna descrizione fornita.
Nessuna descrizione fornita.
Valori possibili:
-
application/pdf
VideoDelta
Nessuna descrizione fornita.
Sempre impostato su "video".
Nessuna descrizione fornita.
Nessuna descrizione fornita.
Nessuna descrizione fornita.
Valori possibili:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
risoluzione MediaResolution (facoltativo)
La risoluzione dei contenuti multimediali.
Valori possibili:
-
low -
medium -
high -
ultra_high
ThoughtSummaryDelta
Nessuna descrizione fornita.
Sempre impostato su "thought_summary".
content ThoughtSummaryContent (facoltativo)
Un nuovo elemento di riepilogo da aggiungere al pensiero.
Tipi possibili
Discriminatore polimorfico: type
TextContent
Un blocco di contenuti testuali.
Nessuna descrizione fornita.
Sempre impostato su "text".
Obbligatorio. Il contenuto testuale.
annotazioni Annotazione (facoltativo)
Informazioni sulle citazioni per i contenuti generati dal modello.
Tipi possibili
Discriminatore polimorfico: type
UrlCitation
Un'annotazione di citazione di URL.
Nessuna descrizione fornita.
Sempre impostato su "url_citation".
L'URL.
Il titolo dell'URL.
Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.
Fine del segmento attribuito, esclusa.
FileCitation
Un'annotazione di citazione di un file.
Nessuna descrizione fornita.
Sempre impostato su "file_citation".
L'URI del file.
Il nome del file.
Fonte attribuita a una parte del testo.
Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.
Fine del segmento attribuito, esclusa.
PlaceCitation
Un'annotazione di citazione di un luogo.
Nessuna descrizione fornita.
Sempre impostato su "place_citation".
L'ID del luogo, nel formato `places/{place_id}`.
Titolo del luogo.
Riferimento URI del luogo.
review_snippets ReviewSnippet (facoltativo)
Snippet di recensioni utilizzati per generare risposte sulle caratteristiche di un determinato luogo in Google Maps.
Campi
Titolo della recensione.
Un link che corrisponde alla recensione dell'utente su Google Maps.
L'ID dello snippet recensione.
Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.
Fine del segmento attribuito, esclusa.
ImageContent
Un blocco di contenuti immagine.
Nessuna descrizione fornita.
Sempre impostato su "image".
Il contenuto dell'immagine.
L'URI dell'immagine.
Il tipo MIME dell'immagine.
Valori possibili:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
risoluzione MediaResolution (facoltativo)
La risoluzione dei contenuti multimediali.
Valori possibili:
-
low -
medium -
high -
ultra_high
ThoughtSignatureDelta
Nessuna descrizione fornita.
Sempre impostato su "thought_signature".
Firma per abbinare l'origine di backend da includere nella generazione.
FunctionCallDelta
Nessuna descrizione fornita.
Sempre impostato su "function_call".
Nessuna descrizione fornita.
Nessuna descrizione fornita.
Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.
Un hash della firma per la convalida del backend.
CodeExecutionCallDelta
Nessuna descrizione fornita.
Sempre impostato su "code_execution_call".
arguments CodeExecutionCallArguments (obbligatorio)
Nessuna descrizione fornita.
Campi
Linguaggio di programmazione di `code`.
Valori possibili:
-
python
Il codice da eseguire.
Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.
Un hash della firma per la convalida del backend.
UrlContextCallDelta
Nessuna descrizione fornita.
Sempre impostato su "url_context_call".
arguments UrlContextCallArguments (obbligatorio)
Nessuna descrizione fornita.
Campi
Gli URL da recuperare.
Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.
Un hash della firma per la convalida del backend.
GoogleSearchCallDelta
Nessuna descrizione fornita.
Sempre impostato su "google_search_call".
arguments GoogleSearchCallArguments (obbligatorio)
Nessuna descrizione fornita.
Campi
Query di ricerca web per la ricerca web successiva.
Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.
Un hash della firma per la convalida del backend.
McpServerToolCallDelta
Nessuna descrizione fornita.
Sempre impostato su "mcp_server_tool_call".
Nessuna descrizione fornita.
Nessuna descrizione fornita.
Nessuna descrizione fornita.
Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.
Un hash della firma per la convalida del backend.
FileSearchCallDelta
Nessuna descrizione fornita.
Sempre impostato su "file_search_call".
Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.
Un hash della firma per la convalida del backend.
GoogleMapsCallDelta
Nessuna descrizione fornita.
Sempre impostato su "google_maps_call".
arguments GoogleMapsCallArguments (facoltativo)
Gli argomenti da passare allo strumento Google Maps.
Campi
Le query da eseguire.
Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.
Un hash della firma per la convalida del backend.
FunctionResultDelta
Nessuna descrizione fornita.
Sempre impostato su "function_result".
Nessuna descrizione fornita.
Nessuna descrizione fornita.
Obbligatorio. ID che corrisponde all'ID del blocco di chiamata di funzione.
Un hash della firma per la convalida del backend.
Nessuna descrizione fornita.
CodeExecutionResultDelta
Nessuna descrizione fornita.
Sempre impostato su "code_execution_result".
Nessuna descrizione fornita.
Nessuna descrizione fornita.
Obbligatorio. ID che corrisponde all'ID del blocco di chiamata di funzione.
Un hash della firma per la convalida del backend.
UrlContextResultDelta
Nessuna descrizione fornita.
Sempre impostato su "url_context_result".
result UrlContextResult (obbligatorio)
Nessuna descrizione fornita.
Campi
L'URL recuperato.
Lo stato del recupero dell'URL.
Valori possibili:
-
success -
error -
paywall -
unsafe
Nessuna descrizione fornita.
Obbligatorio. ID che corrisponde all'ID del blocco di chiamata di funzione.
Un hash della firma per la convalida del backend.
GoogleSearchResultDelta
Nessuna descrizione fornita.
Sempre impostato su "google_search_result".
result GoogleSearchResult (obbligatorio)
Nessuna descrizione fornita.
Campi
Snippet di contenuti web che può essere incorporato in una pagina web o in una webview di un'app.
Nessuna descrizione fornita.
Obbligatorio. ID che corrisponde all'ID del blocco di chiamata di funzione.
Un hash della firma per la convalida del backend.
McpServerToolResultDelta
Nessuna descrizione fornita.
Sempre impostato su "mcp_server_tool_result".
Nessuna descrizione fornita.
Nessuna descrizione fornita.
Obbligatorio. ID che corrisponde all'ID del blocco di chiamata di funzione.
Un hash della firma per la convalida del backend.
Nessuna descrizione fornita.
FileSearchResultDelta
Nessuna descrizione fornita.
Sempre impostato su "file_search_result".
result FileSearchResult (obbligatorio)
Nessuna descrizione fornita.
Campi
Metadati forniti dall'utente su FileSearchResult.
Obbligatorio. ID che corrisponde all'ID del blocco di chiamata di funzione.
Un hash della firma per la convalida del backend.
GoogleMapsResultDelta
Nessuna descrizione fornita.
Sempre impostato su "google_maps_result".
result GoogleMapsResult (facoltativo)
I risultati di Google Maps.
Campi
luoghi Luoghi (facoltativo)
I luoghi trovati.
Campi
L'ID del luogo, nel formato `places/{place_id}`.
Titolo del luogo.
Riferimento URI del luogo.
review_snippets ReviewSnippet (facoltativo)
Snippet di recensioni utilizzati per generare risposte sulle caratteristiche di un determinato luogo in Google Maps.
Campi
Titolo della recensione.
Un link che corrisponde alla recensione dell'utente su Google Maps.
L'ID dello snippet recensione.
Nome della risorsa del token di contesto del widget di Google Maps.
Obbligatorio. ID che corrisponde all'ID del blocco di chiamata di funzione.
Un hash della firma per la convalida del backend.
TextAnnotationDelta
Nessuna descrizione fornita.
Sempre impostato su "text_annotation".
annotazioni Annotazione (facoltativo)
Informazioni sulle citazioni per i contenuti generati dal modello.
Tipi possibili
Discriminatore polimorfico: type
UrlCitation
Un'annotazione di citazione di URL.
Nessuna descrizione fornita.
Sempre impostato su "url_citation".
L'URL.
Il titolo dell'URL.
Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.
Fine del segmento attribuito, esclusa.
FileCitation
Un'annotazione di citazione di un file.
Nessuna descrizione fornita.
Sempre impostato su "file_citation".
L'URI del file.
Il nome del file.
Fonte attribuita a una parte del testo.
Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.
Fine del segmento attribuito, esclusa.
PlaceCitation
Un'annotazione di citazione di un luogo.
Nessuna descrizione fornita.
Sempre impostato su "place_citation".
L'ID del luogo, nel formato `places/{place_id}`.
Titolo del luogo.
Riferimento URI del luogo.
review_snippets ReviewSnippet (facoltativo)
Snippet di recensioni utilizzati per generare risposte sulle caratteristiche di un determinato luogo in Google Maps.
Campi
Titolo della recensione.
Un link che corrisponde alla recensione dell'utente su Google Maps.
L'ID dello snippet recensione.
Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.
Fine del segmento attribuito, esclusa.
Il token event_id da utilizzare per riprendere lo stream di interazione da questo evento.
ContentStop
Nessuna descrizione fornita.
Sempre impostato su "content.stop".
Nessuna descrizione fornita.
Il token event_id da utilizzare per riprendere lo stream di interazione da questo evento.
ErrorEvent
Nessuna descrizione fornita.
Sempre impostato su "error".
error Error (facoltativo)
Nessuna descrizione fornita.
Campi
Un URI che identifica il tipo di errore.
Un messaggio di errore leggibile.
Il token event_id da utilizzare per riprendere lo stream di interazione da questo evento.
Esempi
Inizio interazione
{ "event_type": "interaction.start", "interaction": { "id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM", "model": "gemini-3-flash-preview", "object": "interaction", "status": "in_progress" } }
Interazione completata
{ "event_type": "interaction.complete", "interaction": { "created": "2025-12-09T18:45:40Z", "id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM", "model": "gemini-3-flash-preview", "object": "interaction", "role": "model", "status": "completed", "updated": "2025-12-09T18:45:40Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 11 } ], "total_cached_tokens": 0, "total_input_tokens": 11, "total_output_tokens": 364, "total_thought_tokens": 1120, "total_tokens": 1495, "total_tool_use_tokens": 0 } } }
Aggiornamento dello stato dell'interazione
{ "event_type": "interaction.status_update", "interaction_id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM", "status": "in_progress" }
Inizio dei contenuti
{ "event_type": "content.start", "content": { "type": "text" }, "index": 1 }
Delta dei contenuti
{ "event_type": "content.delta", "delta": { "type": "text", "text": "Elara\u2019s life was a symphony of quiet moments. A librarian, she found solace in the hushed aisles, the scent of aged paper, and the predictable rhythm of her days. Her small apartment, meticulously ordered, reflected this internal calm, save" }, "index": 1 }
Interruzione dei contenuti
{ "event_type": "content.stop", "index": 1 }
Evento di errore
{ "event_type": "error", "error": { "message": "Failed to get completed interaction: Result not found.", "code": "not_found" } }