Gemini API

L'API Gemini Interactions è un'API sperimentale che consente agli sviluppatori di creare applicazioni di AI generativa utilizzando i modelli Gemini. Gemini è il nostro modello più potente, sviluppato da zero per essere multimodale. È in grado di generalizzare e di comprendere, gestire e combinare senza problemi diversi tipi di informazioni, tra cui linguaggio, immagini, audio, video e codice. Puoi utilizzare l'API Gemini per casi d'uso come il ragionamento su testo e immagini, la generazione di contenuti, gli agenti di dialogo, i sistemi di riepilogo e classificazione e altro ancora.

Creare un'interazione

post https://generativelanguage.googleapis.com/v1beta/interactions

Crea una nuova interazione.

Corpo della richiesta

Il corpo della richiesta contiene dati con la seguente struttura:

model ModelOption  (facoltativo)

Il nome del modello utilizzato per generare l'interazione.
Obbligatorio se non viene fornito "agent".

Valori possibili:

  • gemini-2.5-flash

    Il nostro primo modello di ragionamento ibrido che supporta una finestra contestuale da 1 milione di token e dispone di budget di pensiero.

  • gemini-2.5-flash-image

    Il nostro modello nativo di generazione di immagini, ottimizzato per velocità, flessibilità e comprensione contestuale. L'input e l'output di testo hanno lo stesso prezzo di 2.5 Flash.

  • gemini-2.5-flash-lite

    Il nostro modello più piccolo ed economico, creato per l'utilizzo su larga scala.

  • gemini-2.5-flash-lite-preview-09-2025

    L'ultimo modello basato su Gemini 2.5 Flash Lite ottimizzato per costi contenuti, velocità effettiva elevata e alta qualità.

  • gemini-2.5-flash-native-audio-preview-12-2025

    I nostri modelli audio nativi ottimizzati per output audio di qualità superiore con un ritmo, una naturalezza della voce, un livello di dettaglio e un tono migliori.

  • gemini-2.5-flash-preview-09-2025

    L'ultimo modello basato sul modello 2.5 Flash. 2.5 Flash Preview è ideale per l'elaborazione su larga scala, la bassa latenza, le attività ad alto volume che richiedono ragionamento e i casi d'uso con agenti.

  • gemini-2.5-flash-preview-tts

    Il nostro modello Text-to-Speech 2.5 Flash è ottimizzato per la generazione di sintesi vocale potente, controllabile e a bassa latenza.

  • gemini-2.5-pro

    Il nostro modello multiuso all'avanguardia, che eccelle nella programmazione e in attività di ragionamento complesse.

  • gemini-2.5-pro-preview-tts

    Il nostro modello audio Text-to-Speech 2.5 Pro ottimizzato per una generazione di voce potente e a bassa latenza per output più naturali e prompt più facili da gestire.

  • gemini-3-flash-preview

    Il nostro modello più intelligente, creato per la velocità, che combina intelligenza all'avanguardia con ricerca e grounding superiori.

  • gemini-3-pro-image-preview

    Modello all'avanguardia per la generazione e la modifica di immagini.

  • gemini-3-pro-preview

    Il nostro modello più intelligente con ragionamento e comprensione multimodale all'avanguardia, nonché potenti funzionalità di codifica di agenti e vibe coding.

  • gemini-3.1-pro-preview

    Il nostro ultimo modello di ragionamento SOTA con una profondità e una sfumatura senza precedenti, nonché potenti funzionalità di comprensione multimodale e programmazione.

  • gemini-3.1-flash-image-preview

    Intelligenza visiva di livello professionale con efficienza alla velocità di Flash e funzionalità di generazione basate sulla realtà.

Il modello che completerà il prompt.\n\nPer ulteriori dettagli, consulta [modelli](https://ai.google.dev/gemini-api/docs/models).

agent AgentOption  (facoltativo)

Il nome dell'agente utilizzato per generare l'interazione.
Obbligatorio se non viene fornito "model".

Valori possibili:

  • deep-research-pro-preview-12-2025

    Agente Gemini Deep Research

L'agente con cui interagire.

input Contenuti o array (Contenuti) o array (Turn) o stringa  (obbligatorio)

Gli input per l'interazione (comuni sia al modello che all'agente).

system_instruction string  (facoltativo)

Istruzione di sistema per l'interazione.

tools array (Tool)  (facoltativo)

Un elenco di dichiarazioni di strumenti che il modello può chiamare durante l'interazione.

response_format object  (facoltativo)

Impone che la risposta generata sia un oggetto JSON conforme allo schema JSON specificato in questo campo.

response_mime_type stringa  (facoltativo)

Il tipo MIME della risposta. Questo campo è obbligatorio se è impostato response_format.

stream boolean  (facoltativo)

Solo input. Se l'interazione verrà trasmessa in streaming.

store boolean  (facoltativo)

Solo input. Se memorizzare la risposta e la richiesta per il recupero successivo.

background boolean  (facoltativo)

Solo input. Indica se eseguire l'interazione del modello in background.

generation_config GenerationConfig  (facoltativo)

Configurazione modello
Parametri di configurazione per l'interazione del modello.
Alternativa a "agent_config". Applicabile solo quando è impostato "model".

Parametri di configurazione per le interazioni del modello.

Campi

temperature number  (facoltativo)

Controlla la casualità dell'output.

top_p number  (facoltativo)

La probabilità cumulativa massima dei token da considerare durante il campionamento.

seed integer  (facoltativo)

Seed utilizzato nella decodifica per la riproducibilità.

stop_sequences array (string)  (facoltativo)

Un elenco di sequenze di caratteri che interromperanno l'interazione con l'output.

thinking_level ThinkingLevel  (facoltativo)

Il livello di token di pensiero che il modello deve generare.

Valori possibili:

  • minimal
  • low
  • medium
  • high

thinking_summaries ThinkingSummaries  (facoltativo)

Se includere i riepiloghi del pensiero nella risposta.

Valori possibili:

  • auto
  • none

max_output_tokens integer  (facoltativo)

Il numero massimo di token da includere nella risposta.

speech_config SpeechConfig  (facoltativo)

Configurazione per l'interazione vocale.

La configurazione per l'interazione vocale.

Campi

voice string  (facoltativo)

La voce dell'oratore.

language string  (facoltativo)

La lingua del discorso.

speaker string  (facoltativo)

Il nome dell'oratore, che deve corrispondere a quello indicato nel prompt.

image_config ImageConfig  (facoltativo)

Configurazione per l'interazione con le immagini.

La configurazione per l'interazione con le immagini.

Campi

aspect_ratio enum (string)  (facoltativo)

Nessuna descrizione fornita.

Valori possibili:

  • 1:1
  • 2:3
  • 3:2
  • 3:4
  • 4:3
  • 4:5
  • 5:4
  • 9:16
  • 16:9
  • 21:9
  • 1:8
  • 8:1
  • 1:4
  • 4:1
image_size enum (string)  (facoltativo)

Nessuna descrizione fornita.

Valori possibili:

  • 1K
  • 2K
  • 4K
  • 512
tool_choice ToolChoiceConfig o ToolChoiceType  (facoltativo)

Lo strumento scelto per l'interazione.

agent_config object  (facoltativo)

Configurazione dell'agente
Configurazione dell'agente.
Alternativa a `generation_config`. Applicabile solo quando è impostato `agent`.

Tipi possibili

Discriminatore polimorfico: type

DynamicAgentConfig

Configurazione per gli agenti dinamici.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "dynamic".

DeepResearchAgentConfig

Configurazione dell'agente Deep Research.

thinking_summaries ThinkingSummaries  (facoltativo)

Se includere i riepiloghi del pensiero nella risposta.

Valori possibili:

  • auto
  • none

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "deep-research".

previous_interaction_id stringa  (facoltativo)

L'ID dell'interazione precedente, se presente.

response_modalities ResponseModality  (facoltativo)

Le modalità richieste della risposta (TEXT, IMAGE, AUDIO).

Valori possibili:

  • text
  • image
  • audio

Risposta

Restituisce una risorsa Interaction.

Richiesta semplice

Esempio di risposta

{
  "created": "2025-11-26T12:25:15Z",
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "object": "interaction",
  "outputs": [
    {
      "text": "Hello! I'm functioning perfectly and ready to assist you.\n\nHow are you doing today?",
      "type": "text"
    }
  ],
  "role": "model",
  "status": "completed",
  "updated": "2025-11-26T12:25:15Z",
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 7
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 7,
    "total_output_tokens": 20,
    "total_thought_tokens": 22,
    "total_tokens": 49,
    "total_tool_use_tokens": 0
  }
}

In più passaggi

Esempio di risposta

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "role": "model",
  "outputs": [
    {
      "type": "text",
      "text": "The capital of France is Paris."
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 50
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 50,
    "total_output_tokens": 10,
    "total_thought_tokens": 0,
    "total_tokens": 60,
    "total_tool_use_tokens": 0
  }
}

Input immagine

Esempio di risposta

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "role": "model",
  "outputs": [
    {
      "type": "text",
      "text": "A white humanoid robot with glowing blue eyes stands holding a red skateboard."
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 10
      },
      {
        "modality": "image",
        "tokens": 258
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 268,
    "total_output_tokens": 20,
    "total_thought_tokens": 0,
    "total_tokens": 288,
    "total_tool_use_tokens": 0
  }
}

Chiamata di funzione

Esempio di risposta

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "requires_action",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "role": "model",
  "outputs": [
    {
      "type": "function_call",
      "id": "gth23981",
      "name": "get_weather",
      "arguments": {
        "location": "Boston, MA"
      }
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 100
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 100,
    "total_output_tokens": 25,
    "total_thought_tokens": 0,
    "total_tokens": 125,
    "total_tool_use_tokens": 50
  }
}

Deep Research

Esempio di risposta

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "agent": "deep-research-pro-preview-12-2025",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "role": "agent",
  "outputs": [
    {
      "type": "text",
      "text": "Here is a comprehensive research report on the current state of cancer research..."
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 20
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 20,
    "total_output_tokens": 1000,
    "total_thought_tokens": 500,
    "total_tokens": 1520,
    "total_tool_use_tokens": 0
  }
}

Recuperare un'interazione

get https://generativelanguage.googleapis.com/v1beta/interactions/{id}

Recupera i dettagli completi di una singola interazione in base al relativo `Interaction.id`.

Parametri percorso / query

id stringa  (obbligatorio)

L'identificatore univoco dell'interazione da recuperare.

stream boolean  (facoltativo)

Se è impostato su true, i contenuti generati verranno trasmessi in streaming in modo incrementale.

Valore predefinito: False

last_event_id string  (facoltativo)

Facoltativo. Se impostato, riprende il flusso di interazione dal blocco successivo all'evento contrassegnato dall'ID evento. Può essere utilizzato solo se "stream" è true.

include_input boolean  (facoltativo)

Se è impostata su true, include l'input nella risposta.

Valore predefinito: False

api_version string  (facoltativo)

Quale versione dell'API utilizzare.

Risposta

Restituisce una risorsa Interaction.

Recupero interazione

Esempio di risposta

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:25:15Z",
  "updated": "2025-11-26T12:25:15Z",
  "role": "model",
  "outputs": [
    {
      "type": "text",
      "text": "I'm doing great, thank you for asking! How can I help you today?"
    }
  ]
}

Eliminazione di un'interazione

delete https://generativelanguage.googleapis.com/v1beta/interactions/{id}

Elimina l'interazione in base all'ID.

Parametri percorso / query

id stringa  (obbligatorio)

L'identificatore univoco dell'interazione da eliminare.

api_version string  (facoltativo)

Quale versione dell'API utilizzare.

Risposta

In caso di esito positivo, la risposta è vuota.

Elimina interazione

Annullare un'interazione

post https://generativelanguage.googleapis.com/v1beta/interactions/{id}/cancel

Annulla un'interazione in base all'ID. Questo vale solo per le interazioni in background ancora in esecuzione.

Parametri percorso / query

id stringa  (obbligatorio)

L'identificatore univoco dell'interazione da annullare.

api_version string  (facoltativo)

Quale versione dell'API utilizzare.

Risposta

Restituisce una risorsa Interaction.

Annulla interazione

Esempio di risposta

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "agent": "deep-research-pro-preview-12-2025",
  "status": "cancelled",
  "object": "interaction",
  "created": "2025-11-26T12:25:15Z",
  "updated": "2025-11-26T12:25:15Z",
  "role": "agent"
}

Risorse

Interazione

La risorsa Interaction.

Campi

model ModelOption  (facoltativo)

Il nome del modello utilizzato per generare l'interazione.

Valori possibili:

  • gemini-2.5-flash

    Il nostro primo modello di ragionamento ibrido che supporta una finestra contestuale da 1 milione di token e dispone di budget di pensiero.

  • gemini-2.5-flash-image

    Il nostro modello nativo di generazione di immagini, ottimizzato per velocità, flessibilità e comprensione contestuale. L'input e l'output di testo hanno lo stesso prezzo di 2.5 Flash.

  • gemini-2.5-flash-lite

    Il nostro modello più piccolo ed economico, creato per l'utilizzo su larga scala.

  • gemini-2.5-flash-lite-preview-09-2025

    L'ultimo modello basato su Gemini 2.5 Flash Lite ottimizzato per costi contenuti, velocità effettiva elevata e alta qualità.

  • gemini-2.5-flash-native-audio-preview-12-2025

    I nostri modelli audio nativi ottimizzati per output audio di qualità superiore con un ritmo, una naturalezza della voce, un livello di dettaglio e un tono migliori.

  • gemini-2.5-flash-preview-09-2025

    L'ultimo modello basato sul modello 2.5 Flash. 2.5 Flash Preview è ideale per l'elaborazione su larga scala, la bassa latenza, le attività ad alto volume che richiedono ragionamento e i casi d'uso con agenti.

  • gemini-2.5-flash-preview-tts

    Il nostro modello Text-to-Speech 2.5 Flash è ottimizzato per la generazione di sintesi vocale potente, controllabile e a bassa latenza.

  • gemini-2.5-pro

    Il nostro modello multiuso all'avanguardia, che eccelle nella programmazione e in attività di ragionamento complesse.

  • gemini-2.5-pro-preview-tts

    Il nostro modello audio Text-to-Speech 2.5 Pro ottimizzato per una generazione di voce potente e a bassa latenza per output più naturali e prompt più facili da gestire.

  • gemini-3-flash-preview

    Il nostro modello più intelligente, creato per la velocità, che combina intelligenza all'avanguardia con ricerca e grounding superiori.

  • gemini-3-pro-image-preview

    Modello all'avanguardia per la generazione e la modifica di immagini.

  • gemini-3-pro-preview

    Il nostro modello più intelligente con ragionamento e comprensione multimodale all'avanguardia, nonché potenti funzionalità di codifica di agenti e vibe coding.

  • gemini-3.1-pro-preview

    Il nostro ultimo modello di ragionamento SOTA con una profondità e una sfumatura senza precedenti, nonché potenti funzionalità di comprensione multimodale e programmazione.

  • gemini-3.1-flash-image-preview

    Intelligenza visiva di livello professionale con efficienza alla velocità di Flash e funzionalità di generazione basate sulla realtà.

Il modello che completerà il prompt.\n\nPer ulteriori dettagli, consulta [modelli](https://ai.google.dev/gemini-api/docs/models).

agent AgentOption  (facoltativo)

Il nome dell'agente utilizzato per generare l'interazione.

Valori possibili:

  • deep-research-pro-preview-12-2025

    Agente Gemini Deep Research

L'agente con cui interagire.

id string  (facoltativo)

Solo output. Un identificatore univoco per il completamento dell'interazione.

status enum (string)  (facoltativo)

Solo output. Lo stato dell'interazione.

Valori possibili:

  • in_progress
  • requires_action
  • completed
  • failed
  • cancelled
  • incomplete
created stringa  (facoltativo)

Solo output. L'ora in cui è stata creata la risposta nel formato ISO 8601 (AAAA-MM-GGThh:mm:ssZ).

updated string  (facoltativo)

Solo output. L'ora in cui la risposta è stata aggiornata l'ultima volta nel formato ISO 8601 (AAAA-MM-GGThh:mm:ssZ).

role string  (facoltativo)

Solo output. Il ruolo dell'interazione.

outputs array (Content)  (facoltativo)

Solo output. Risposte del modello.

system_instruction string  (facoltativo)

Istruzione di sistema per l'interazione.

tools array (Tool)  (facoltativo)

Un elenco di dichiarazioni di strumenti che il modello può chiamare durante l'interazione.

usage Utilizzo  (facoltativo)

Solo output. Statistiche sull'utilizzo dei token della richiesta di interazione.

Statistiche sull'utilizzo dei token della richiesta di interazione.

Campi

total_input_tokens integer  (facoltativo)

Numero di token nel prompt (contesto).

input_tokens_by_modality ModalityTokens  (facoltativo)

Una suddivisione dell'utilizzo dei token di input per modalità.

Il conteggio dei token per una singola modalità di risposta.

Campi

modalità ResponseModality  (facoltativo)

La modalità associata al conteggio dei token.

Valori possibili:

  • text
  • image
  • audio

token integer  (facoltativo)

Numero di token per la modalità.

total_cached_tokens integer  (facoltativo)

Numero di token nella parte memorizzata nella cache del prompt (i contenuti memorizzati nella cache).

cached_tokens_by_modality ModalityTokens  (facoltativo)

Una suddivisione dell'utilizzo dei token memorizzati nella cache per modalità.

Il conteggio dei token per una singola modalità di risposta.

Campi

modalità ResponseModality  (facoltativo)

La modalità associata al conteggio dei token.

Valori possibili:

  • text
  • image
  • audio

token integer  (facoltativo)

Numero di token per la modalità.

total_output_tokens integer  (facoltativo)

Numero totale di token in tutte le risposte generate.

output_tokens_by_modality ModalityTokens  (facoltativo)

Una suddivisione dell'utilizzo dei token di output per modalità.

Il conteggio dei token per una singola modalità di risposta.

Campi

modalità ResponseModality  (facoltativo)

La modalità associata al conteggio dei token.

Valori possibili:

  • text
  • image
  • audio

token integer  (facoltativo)

Numero di token per la modalità.

total_tool_use_tokens integer  (facoltativo)

Numero di token presenti nei prompt di utilizzo degli strumenti.

tool_use_tokens_by_modality ModalityTokens  (facoltativo)

Una suddivisione dell'utilizzo dei token di utilizzo degli strumenti per modalità.

Il conteggio dei token per una singola modalità di risposta.

Campi

modalità ResponseModality  (facoltativo)

La modalità associata al conteggio dei token.

Valori possibili:

  • text
  • image
  • audio

token integer  (facoltativo)

Numero di token per la modalità.

total_thought_tokens integer  (facoltativo)

Numero di token di pensieri per i modelli di ragionamento.

total_tokens integer  (facoltativo)

Conteggio totale dei token per la richiesta di interazione (prompt + risposte + altri token interni).

response_modalities ResponseModality  (facoltativo)

Le modalità richieste della risposta (TEXT, IMAGE, AUDIO).

Valori possibili:

  • text
  • image
  • audio

response_format object  (facoltativo)

Impone che la risposta generata sia un oggetto JSON conforme allo schema JSON specificato in questo campo.

response_mime_type stringa  (facoltativo)

Il tipo MIME della risposta. Questo campo è obbligatorio se è impostato response_format.

previous_interaction_id stringa  (facoltativo)

L'ID dell'interazione precedente, se presente.

input Contenuti o array (Contenuti) o array (Turn) o stringa  (obbligatorio)

Gli input per l'interazione (comuni sia al modello che all'agente).

agent_config object  (facoltativo)

Parametri di configurazione per l'interazione con l'agente.

Tipi possibili

Discriminatore polimorfico: type

DynamicAgentConfig

Configurazione per gli agenti dinamici.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "dynamic".

DeepResearchAgentConfig

Configurazione dell'agente Deep Research.

thinking_summaries ThinkingSummaries  (facoltativo)

Se includere i riepiloghi del pensiero nella risposta.

Valori possibili:

  • auto
  • none

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "deep-research".

Esempi

Esempio

{
  "created": "2025-12-04T15:01:45Z",
  "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg",
  "model": "gemini-3-flash-preview",
  "object": "interaction",
  "outputs": [
    {
      "text": "Hello! I'm doing well, functioning as expected. Thank you for asking! How are you doing today?",
      "type": "text"
    }
  ],
  "role": "model",
  "status": "completed",
  "updated": "2025-12-04T15:01:45Z",
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 7
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 7,
    "total_output_tokens": 23,
    "total_thought_tokens": 49,
    "total_tokens": 79,
    "total_tool_use_tokens": 0
  }
}

Modelli di dati

Contenuti

Il contenuto della risposta.

Tipi possibili

Discriminatore polimorfico: type

TextContent

Un blocco di contenuti testuali.

text string  (obbligatorio)

Il contenuto testuale.

annotazioni Annotazione  (facoltativo)

Informazioni sulle citazioni per i contenuti generati dal modello.

Informazioni sulle citazioni per i contenuti generati dal modello.

Tipi possibili

Discriminatore polimorfico: type

UrlCitation

Un'annotazione di citazione di URL.

url string  (facoltativo)

L'URL.

title string  (facoltativo)

Il titolo dell'URL.

type string  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "url_citation".

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

FileCitation

Un'annotazione di citazione di un file.

document_uri string  (facoltativo)

L'URI del file.

file_name stringa  (facoltativo)

Il nome del file.

source string  (facoltativo)

Fonte attribuita a una parte del testo.

type string  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "file_citation".

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

PlaceCitation

Un'annotazione di citazione di un luogo.

place_id stringa  (facoltativo)

L'ID del luogo, nel formato `places/{place_id}`.

name string  (facoltativo)

Titolo del luogo.

url string  (facoltativo)

Riferimento URI del luogo.

review_snippets ReviewSnippet  (facoltativo)

Snippet di recensioni utilizzati per generare risposte sulle caratteristiche di un determinato luogo in Google Maps.

Contiene un estratto di una recensione utente che risponde a una domanda sulle caratteristiche di un luogo specifico in Google Maps.

Campi

title string  (facoltativo)

Titolo della recensione.

url string  (facoltativo)

Un link che corrisponde alla recensione dell'utente su Google Maps.

review_id stringa  (facoltativo)

L'ID dello snippet recensione.

type string  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "place_citation".

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "text".

ImageContent

Un blocco di contenuti immagine.

data string  (facoltativo)

Il contenuto dell'immagine.

uri string  (facoltativo)

L'URI dell'immagine.

mime_type enum (string)  (facoltativo)

Il tipo MIME dell'immagine.

Valori possibili:

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
risoluzione MediaResolution  (facoltativo)

La risoluzione dei contenuti multimediali.

Valori possibili:

  • low
  • medium
  • high
  • ultra_high

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "image".

AudioContent

Un blocco di contenuti audio.

data string  (facoltativo)

I contenuti audio.

uri string  (facoltativo)

L'URI dell'audio.

mime_type enum (string)  (facoltativo)

Il tipo MIME dell'audio.

Valori possibili:

  • audio/wav
  • audio/mp3
  • audio/aiff
  • audio/aac
  • audio/ogg
  • audio/flac
type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "audio".

DocumentContent

Un blocco di contenuti del documento.

data string  (facoltativo)

I contenuti del documento.

uri string  (facoltativo)

L'URI del documento.

mime_type enum (string)  (facoltativo)

Il tipo MIME del documento.

Valori possibili:

  • application/pdf
type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "document".

VideoContent

Un blocco di contenuti video.

data string  (facoltativo)

I contenuti video.

uri string  (facoltativo)

L'URI del video.

mime_type enum (string)  (facoltativo)

Il tipo MIME del video.

Valori possibili:

  • video/mp4
  • video/mpeg
  • video/mpg
  • video/mov
  • video/avi
  • video/x-flv
  • video/webm
  • video/wmv
  • video/3gpp
risoluzione MediaResolution  (facoltativo)

La risoluzione dei contenuti multimediali.

Valori possibili:

  • low
  • medium
  • high
  • ultra_high

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "video".

ThoughtContent

Un blocco di contenuti di pensiero.

signature string  (facoltativo)

Firma per abbinare l'origine del backend da includere nella generazione.

summary ThoughtSummaryContent  (facoltativo)

Un riepilogo del pensiero.

Tipi possibili

Discriminatore polimorfico: type

TextContent

Un blocco di contenuti testuali.

text string  (obbligatorio)

Il contenuto testuale.

annotazioni Annotazione  (facoltativo)

Informazioni sulle citazioni per i contenuti generati dal modello.

Informazioni sulle citazioni per i contenuti generati dal modello.

Tipi possibili

Discriminatore polimorfico: type

UrlCitation

Un'annotazione di citazione di URL.

url string  (facoltativo)

L'URL.

title string  (facoltativo)

Il titolo dell'URL.

type string  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "url_citation".

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

FileCitation

Un'annotazione di citazione di un file.

document_uri string  (facoltativo)

L'URI del file.

file_name stringa  (facoltativo)

Il nome del file.

source string  (facoltativo)

Fonte attribuita a una parte del testo.

type string  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "file_citation".

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

PlaceCitation

Un'annotazione di citazione di un luogo.

place_id stringa  (facoltativo)

L'ID del luogo, nel formato `places/{place_id}`.

name string  (facoltativo)

Titolo del luogo.

url string  (facoltativo)

Riferimento URI del luogo.

review_snippets ReviewSnippet  (facoltativo)

Snippet di recensioni utilizzati per generare risposte sulle caratteristiche di un determinato luogo in Google Maps.

Contiene un estratto di una recensione utente che risponde a una domanda sulle caratteristiche di un luogo specifico in Google Maps.

Campi

title string  (facoltativo)

Titolo della recensione.

url string  (facoltativo)

Un link che corrisponde alla recensione dell'utente su Google Maps.

review_id stringa  (facoltativo)

L'ID dello snippet recensione.

type string  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "place_citation".

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "text".

ImageContent

Un blocco di contenuti immagine.

data string  (facoltativo)

Il contenuto dell'immagine.

uri string  (facoltativo)

L'URI dell'immagine.

mime_type enum (string)  (facoltativo)

Il tipo MIME dell'immagine.

Valori possibili:

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
risoluzione MediaResolution  (facoltativo)

La risoluzione dei contenuti multimediali.

Valori possibili:

  • low
  • medium
  • high
  • ultra_high

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "image".

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "thought".

FunctionCallContent

Un blocco di contenuti di chiamata dello strumento funzione.

name string  (obbligatorio)

Il nome dello strumento da chiamare.

arguments object  (obbligatorio)

Gli argomenti da passare alla funzione.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "function_call".

id stringa  (obbligatorio)

Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

FunctionResultContent

Un blocco di contenuti dei risultati dello strumento Funzione.

name string  (facoltativo)

Il nome dello strumento chiamato.

is_error boolean  (facoltativo)

Indica se la chiamata allo strumento ha generato un errore.

result array (FunctionResultSubcontent) or string  (obbligatorio)

Il risultato della chiamata allo strumento.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "function_result".

call_id string  (obbligatorio)

ID che corrisponde all'ID del blocco di chiamata di funzione.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

CodeExecutionCallContent

Contenuti di esecuzione del codice.

arguments CodeExecutionCallArguments  (obbligatorio)

Gli argomenti da passare all'esecuzione del codice.

Gli argomenti da passare all'esecuzione del codice.

Campi

language enum (string)  (facoltativo)

Linguaggio di programmazione del codice.

Valori possibili:

  • python
code string  (facoltativo)

Il codice da eseguire.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "code_execution_call".

id stringa  (obbligatorio)

Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

CodeExecutionResultContent

Contenuti del risultato dell'esecuzione del codice.

result string  (obbligatorio)

L'output dell'esecuzione del codice.

is_error boolean  (facoltativo)

Indica se l'esecuzione del codice ha generato un errore.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "code_execution_result".

call_id string  (obbligatorio)

ID che corrisponde all'ID del blocco di chiamate di esecuzione del codice.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

UrlContextCallContent

Contenuti del contesto dell'URL.

arguments UrlContextCallArguments  (obbligatorio)

Gli argomenti da passare al contesto dell'URL.

Gli argomenti da passare al contesto dell'URL.

Campi

urls array (string)  (facoltativo)

Gli URL da recuperare.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "url_context_call".

id stringa  (obbligatorio)

Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

UrlContextResultContent

Contenuti dei risultati del contesto URL.

result UrlContextResult  (obbligatorio)

I risultati del contesto dell'URL.

Il risultato del contesto dell'URL.

Campi

url string  (facoltativo)

L'URL recuperato.

status enum (string)  (facoltativo)

Lo stato del recupero dell'URL.

Valori possibili:

  • success
  • error
  • paywall
  • unsafe
is_error boolean  (facoltativo)

Indica se il contesto dell'URL ha generato un errore.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "url_context_result".

call_id string  (obbligatorio)

ID che corrisponda all'ID del blocco di chiamata del contesto dell'URL.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

GoogleSearchCallContent

Contenuti della Ricerca Google.

arguments GoogleSearchCallArguments  (obbligatorio)

Gli argomenti da passare alla Ricerca Google.

Gli argomenti da passare alla Ricerca Google.

Campi

queries array (string)  (facoltativo)

Query di ricerca web per la ricerca web successiva.

search_type enum (string)  (facoltativo)

Il tipo di grounding della ricerca abilitato.

Valori possibili:

  • web_search
  • image_search
type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "google_search_call".

id stringa  (obbligatorio)

Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

GoogleSearchResultContent

Contenuti dei risultati di ricerca di Google.

result GoogleSearchResult  (obbligatorio)

I risultati della Ricerca Google.

Il risultato della Ricerca Google.

Campi

search_suggestions stringa  (facoltativo)

Snippet di contenuti web che può essere incorporato in una pagina web o in una webview di un'app.

is_error boolean  (facoltativo)

Indica se la Ricerca Google ha generato un errore.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "google_search_result".

call_id string  (obbligatorio)

ID che corrisponde all'ID del blocco delle chiamate della Ricerca Google.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

McpServerToolCallContent

Contenuti della chiamata allo strumento MCPServer.

name string  (obbligatorio)

Il nome dello strumento chiamato.

server_name string  (obbligatorio)

Il nome del server MCP utilizzato.

arguments object  (obbligatorio)

L'oggetto JSON degli argomenti della funzione.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "mcp_server_tool_call".

id stringa  (obbligatorio)

Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

McpServerToolResultContent

Contenuti del risultato dello strumento MCPServer.

name string  (facoltativo)

Nome dello strumento chiamato per questa chiamata specifica.

server_name string  (facoltativo)

Il nome del server MCP utilizzato.

result array (FunctionResultSubcontent) or string  (obbligatorio)

L'output della chiamata al server MCP. Può essere un semplice testo o contenuti avanzati.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "mcp_server_tool_result".

call_id string  (obbligatorio)

ID che corrisponde all'ID del blocco di chiamata dello strumento del server MCP.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

FileSearchCallContent

Contenuti della ricerca di file.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "file_search_call".

id stringa  (obbligatorio)

Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

FileSearchResultContent

Contenuti dei risultati della ricerca di file.

result FileSearchResult  (facoltativo)

I risultati della ricerca di file.

Il risultato della ricerca di file.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "file_search_result".

call_id string  (obbligatorio)

ID che corrisponda all'ID del blocco di chiamata di ricerca file.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

GoogleMapsCallContent

Contenuti di Google Maps.

arguments GoogleMapsCallArguments  (facoltativo)

Gli argomenti da passare allo strumento Google Maps.

Gli argomenti da passare allo strumento Google Maps.

Campi

queries array (string)  (facoltativo)

Le query da eseguire.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "google_maps_call".

id stringa  (obbligatorio)

Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

GoogleMapsResultContent

Contenuti dei risultati di Google Maps.

result GoogleMapsResult  (obbligatorio)

I risultati di Google Maps.

Il risultato di Google Maps.

Campi

luoghi Luoghi  (facoltativo)

I luoghi trovati.

Campi

place_id stringa  (facoltativo)

L'ID del luogo, nel formato `places/{place_id}`.

name string  (facoltativo)

Titolo del luogo.

url string  (facoltativo)

Riferimento URI del luogo.

review_snippets ReviewSnippet  (facoltativo)

Snippet di recensioni utilizzati per generare risposte sulle caratteristiche di un determinato luogo in Google Maps.

Contiene un estratto di una recensione utente che risponde a una domanda sulle caratteristiche di un luogo specifico in Google Maps.

Campi

title string  (facoltativo)

Titolo della recensione.

url string  (facoltativo)

Un link che corrisponde alla recensione dell'utente su Google Maps.

review_id stringa  (facoltativo)

L'ID dello snippet recensione.

widget_context_token string  (facoltativo)

Nome della risorsa del token di contesto del widget di Google Maps.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "google_maps_result".

call_id string  (obbligatorio)

ID che corrisponda all'ID del blocco di chiamate di Google Maps.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

Esempi

Testo

{
  "type": "text",
  "text": "Hello, how are you?"
}

Immagine

{
  "type": "image",
  "data": "BASE64_ENCODED_IMAGE",
  "mime_type": "image/png"
}

Audio

{
  "type": "audio",
  "data": "BASE64_ENCODED_AUDIO",
  "mime_type": "audio/wav"
}

Documento

{
  "type": "document",
  "data": "BASE64_ENCODED_DOCUMENT",
  "mime_type": "application/pdf"
}

Video

{
  "type": "video",
  "uri": "https://www.youtube.com/watch?v=9hE5-98ZeCg"
}

Pensiero

{
  "type": "thought",
  "summary": [
    {
      "type": "text",
      "text": "The user is asking about the weather. I should use the get_weather tool."
    }
  ],
  "signature": "CoMDAXLI2nynRYojJIy6B1Jh9os2crpWLfB0+19xcLsGG46bd8wjkF/6RNlRUdvHrXyjsHkG0BZFcuO/bPOyA6Xh5jANNgx82wPHjGExN8A4ZQn56FlMwyZoqFVQz0QyY1lfibFJ2zU3J87uw26OewzcuVX0KEcs+GIsZa3EA6WwqhbsOd3wtZB3Ua2Qf98VAWZTS5y/tWpql7jnU3/CU7pouxQr/Bwft3hwnJNesQ9/dDJTuaQ8Zprh9VRWf1aFFjpIueOjBRrlT3oW6/y/eRl/Gt9BQXCYTqg/38vHFUU4Wo/d9dUpvfCe/a3o97t2Jgxp34oFKcsVb4S5WJrykIkw+14DzVnTpCpbQNFckqvFLuqnJCkL0EQFtunBXI03FJpPu3T1XU6id8S7ojoJQZSauGUCgmaLqUGdMrd08oo81ecoJSLs51Re9N/lISGmjWFPGpqJLoGq6uo4FHz58hmeyXCgHG742BHz2P3MiH1CXHUT2J8mF6zLhf3SR9Qb3lkrobAh"
}

Chiamata di funzione

{
  "type": "function_call",
  "name": "get_weather",
  "id": "gth23981",
  "arguments": {
    "location": "Boston, MA"
  }
}

Risultato della funzione

{
  "type": "function_result",
  "name": "get_weather",
  "call_id": "gth23981",
  "result": [
    {
      "type": "text",
      "text": "{\"weather\":\"sunny\"}"
    }
  ]
}

Chiamata di esecuzione del codice

{
  "type": "code_execution_call",
  "id": "call_123456",
  "arguments": {
    "language": "python",
    "code": "print('hello world')"
  }
}

Risultato dell'esecuzione del codice

{
  "type": "code_execution_result",
  "call_id": "call_123456",
  "result": "hello world"
}

Chiamata al contesto URL

{
  "type": "url_context_call",
  "id": "call_123456",
  "arguments": {
    "urls": [
      "https://www.example.com"
    ]
  }
}

Risultato del contesto URL

{
  "type": "url_context_result",
  "call_id": "call_123456",
  "result": [
    {
      "url": "https://www.example.com",
      "status": "SUCCESS"
    }
  ]
}

Chiamata dalla Ricerca Google

{
  "type": "google_search_call",
  "id": "call_123456",
  "arguments": {
    "queries": [
      "weather in Boston"
    ]
  }
}

Risultato della Ricerca Google

{
  "type": "google_search_result",
  "call_id": "call_123456",
  "result": [
    {
      "url": "https://www.google.com/search?q=weather+in+Boston",
      "title": "Weather in Boston"
    }
  ]
}

Chiamata allo strumento del server MCP

{
  "type": "mcp_server_tool_call",
  "id": "call_123456",
  "name": "get_forecast",
  "server_name": "weather_server",
  "arguments": {
    "city": "London"
  }
}

Risultato dello strumento server MCP

{
  "type": "mcp_server_tool_result",
  "name": "get_forecast",
  "server_name": "weather_server",
  "call_id": "call_123456",
  "result": "sunny"
}

Chiamata di ricerca file

{
  "type": "file_search_call",
  "id": "call_123456"
}

Risultato di ricerca di file

{
  "type": "file_search_result",
  "call_id": "call_123456",
  "result": [
    {
      "text": "search result chunk",
      "file_search_store": "file_search_store"
    }
  ]
}

Chiamata Google Maps

{
  "type": "google_maps_call",
  "id": "call_123456",
  "arguments": {
    "query": "best food near me"
  }
}

Risultato di Google Maps

{
  "type": "google_maps_result",
  "call_id": "call_123456",
  "result": [
    {
      "places": [
        {
          "url": "https://www.google.com/maps/search/best+food+near+me",
          "name": "Tasty Restaurant"
        }
      ]
    }
  ]
}

Strumento

Tipi possibili

Discriminatore polimorfico: type

Funzione

Uno strumento che può essere utilizzato dal modello.

name string  (facoltativo)

Il nome della funzione.

description stringa  (facoltativo)

Una descrizione della funzione.

parameters object  (facoltativo)

Lo schema JSON per i parametri della funzione.

type string  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "function".

GoogleSearch

Uno strumento che può essere utilizzato dal modello per eseguire ricerche su Google.

search_types array (enum (string))  (facoltativo)

I tipi di grounding della ricerca da attivare.

Valori possibili:

  • web_search
  • image_search
type string  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "google_search".

CodeExecution

Uno strumento che può essere utilizzato dal modello per eseguire il codice.

type string  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "code_execution".

UrlContext

Uno strumento che può essere utilizzato dal modello per recuperare il contesto dell'URL.

type string  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "url_context".

ComputerUse

Uno strumento che può essere utilizzato dal modello per interagire con il computer.

environment enum (string)  (facoltativo)

L'ambiente in cui viene eseguita l'operazione.

Valori possibili:

  • browser
excludedPredefinedFunctions array (string)  (facoltativo)

L'elenco delle funzioni predefinite escluse dalla chiamata del modello.

type string  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "computer_use".

McpServer

Un server MCP è un server che può essere chiamato dal modello per eseguire azioni.

name string  (facoltativo)

Il nome di MCPServer.

url string  (facoltativo)

L'URL completo dell'endpoint MCPServer. Esempio: "https://api.example.com/mcp"

headers object  (facoltativo)

(Facoltativo) Campi per intestazioni di autenticazione, timeout e così via, se necessario.

allowed_tools AllowedTools  (facoltativo)

Gli strumenti consentiti.

La configurazione degli strumenti consentiti.

Campi

mode ToolChoiceType  (facoltativo)

La modalità di scelta dello strumento.

Valori possibili:

  • auto
  • any
  • none
  • validated

tools array (string)  (facoltativo)

I nomi degli strumenti consentiti.

type string  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "mcp_server".

FileSearch

Uno strumento che può essere utilizzato dal modello per cercare i file.

file_search_store_names array (string)  (facoltativo)

I nomi dei negozi in cui cercare i file.

top_k integer  (facoltativo)

Il numero di blocchi di recupero semantico da recuperare.

metadata_filter stringa  (facoltativo)

Filtro dei metadati da applicare ai documenti e ai chunk di recupero semantico.

type string  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "file_search".

GoogleMaps

Uno strumento che può essere utilizzato dal modello per chiamare Google Maps.

enable_widget boolean  (facoltativo)

Indica se restituire un token di contesto del widget nel risultato della chiamata allo strumento della risposta.

latitude number  (facoltativo)

La latitudine della posizione dell'utente.

longitude number  (facoltativo)

La longitudine della posizione dell'utente.

type string  (facoltativo)

Nessuna descrizione fornita.

Sempre impostato su "google_maps".

Esempi

Funzione

GoogleSearch

CodeExecution

UrlContext

ComputerUse

McpServer

FileSearch

GoogleMaps

CANNOT TRANSLATE

Campi

role string  (facoltativo)

L'autore di questo turno. Deve essere un utente per l'input o un modello per l'output del modello.

content array (Content) o stringa  (facoltativo)

Il contenuto del turno.

Esempi

Turno dell'utente

{
  "role": "user",
  "content": [
    {
      "type": "text",
      "text": "user turn"
    }
  ]
}

Model Turn

{
  "role": "model",
  "content": [
    {
      "type": "text",
      "text": "model turn"
    }
  ]
}

InteractionSseEvent

Tipi possibili

Discriminatore polimorfico: event_type

InteractionStartEvent

interaction Interaction  (obbligatorio)

Nessuna descrizione fornita.

event_type enum (string)  (obbligatorio)

Nessuna descrizione fornita.

Valori possibili:

  • interaction.start
event_id string  (facoltativo)

Il token event_id da utilizzare per riprendere lo stream di interazione da questo evento.

InteractionCompleteEvent

interaction Interaction  (obbligatorio)

L'interazione completata con output vuoti per ridurre le dimensioni del payload. Utilizza gli eventi ContentDelta precedenti per l'output effettivo.

event_type enum (string)  (obbligatorio)

Nessuna descrizione fornita.

Valori possibili:

  • interaction.complete
event_id string  (facoltativo)

Il token event_id da utilizzare per riprendere lo stream di interazione da questo evento.

InteractionStatusUpdate

interaction_id string  (obbligatorio)

Nessuna descrizione fornita.

status enum (string)  (required)

Nessuna descrizione fornita.

Valori possibili:

  • in_progress
  • requires_action
  • completed
  • failed
  • cancelled
  • incomplete
event_type stringa  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "interaction.status_update".

event_id string  (facoltativo)

Il token event_id da utilizzare per riprendere lo stream di interazione da questo evento.

ContentStart

index integer  (obbligatorio)

Nessuna descrizione fornita.

content Content  (obbligatorio)

Nessuna descrizione fornita.

event_type stringa  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "content.start".

event_id string  (facoltativo)

Il token event_id da utilizzare per riprendere lo stream di interazione da questo evento.

ContentDelta

index integer  (obbligatorio)

Nessuna descrizione fornita.

delta object  (obbligatorio)

Nessuna descrizione fornita.

Tipi possibili

Discriminatore polimorfico: type

TextDelta

text string  (obbligatorio)

Nessuna descrizione fornita.

annotazioni Annotazione  (facoltativo)

Informazioni sulle citazioni per i contenuti generati dal modello.

Informazioni sulle citazioni per i contenuti generati dal modello.

Tipi possibili

Discriminatore polimorfico: type

UrlCitation

Un'annotazione di citazione di URL.

url string  (facoltativo)

L'URL.

title string  (facoltativo)

Il titolo dell'URL.

type string  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "url_citation".

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

FileCitation

Un'annotazione di citazione di un file.

document_uri string  (facoltativo)

L'URI del file.

file_name stringa  (facoltativo)

Il nome del file.

source string  (facoltativo)

Fonte attribuita a una parte del testo.

type string  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "file_citation".

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

PlaceCitation

Un'annotazione di citazione di un luogo.

place_id stringa  (facoltativo)

L'ID del luogo, nel formato `places/{place_id}`.

name string  (facoltativo)

Titolo del luogo.

url string  (facoltativo)

Riferimento URI del luogo.

review_snippets ReviewSnippet  (facoltativo)

Snippet di recensioni utilizzati per generare risposte sulle caratteristiche di un determinato luogo in Google Maps.

Contiene un estratto di una recensione utente che risponde a una domanda sulle caratteristiche di un luogo specifico in Google Maps.

Campi

title string  (facoltativo)

Titolo della recensione.

url string  (facoltativo)

Un link che corrisponde alla recensione dell'utente su Google Maps.

review_id stringa  (facoltativo)

L'ID dello snippet recensione.

type string  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "place_citation".

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "text".

ImageDelta

data string  (facoltativo)

Nessuna descrizione fornita.

uri string  (facoltativo)

Nessuna descrizione fornita.

mime_type enum (string)  (facoltativo)

Nessuna descrizione fornita.

Valori possibili:

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
risoluzione MediaResolution  (facoltativo)

La risoluzione dei contenuti multimediali.

Valori possibili:

  • low
  • medium
  • high
  • ultra_high

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "image".

AudioDelta

data string  (facoltativo)

Nessuna descrizione fornita.

uri string  (facoltativo)

Nessuna descrizione fornita.

mime_type enum (string)  (facoltativo)

Nessuna descrizione fornita.

Valori possibili:

  • audio/wav
  • audio/mp3
  • audio/aiff
  • audio/aac
  • audio/ogg
  • audio/flac
type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "audio".

DocumentDelta

data string  (facoltativo)

Nessuna descrizione fornita.

uri string  (facoltativo)

Nessuna descrizione fornita.

mime_type enum (string)  (facoltativo)

Nessuna descrizione fornita.

Valori possibili:

  • application/pdf
type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "document".

VideoDelta

data string  (facoltativo)

Nessuna descrizione fornita.

uri string  (facoltativo)

Nessuna descrizione fornita.

mime_type enum (string)  (facoltativo)

Nessuna descrizione fornita.

Valori possibili:

  • video/mp4
  • video/mpeg
  • video/mpg
  • video/mov
  • video/avi
  • video/x-flv
  • video/webm
  • video/wmv
  • video/3gpp
risoluzione MediaResolution  (facoltativo)

La risoluzione dei contenuti multimediali.

Valori possibili:

  • low
  • medium
  • high
  • ultra_high

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "video".

ThoughtSummaryDelta

content ThoughtSummaryContent  (facoltativo)

Un nuovo elemento di riepilogo da aggiungere al pensiero.

Tipi possibili

Discriminatore polimorfico: type

TextContent

Un blocco di contenuti testuali.

text string  (obbligatorio)

Il contenuto testuale.

annotazioni Annotazione  (facoltativo)

Informazioni sulle citazioni per i contenuti generati dal modello.

Informazioni sulle citazioni per i contenuti generati dal modello.

Tipi possibili

Discriminatore polimorfico: type

UrlCitation

Un'annotazione di citazione di URL.

url string  (facoltativo)

L'URL.

title string  (facoltativo)

Il titolo dell'URL.

type string  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "url_citation".

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

FileCitation

Un'annotazione di citazione di un file.

document_uri string  (facoltativo)

L'URI del file.

file_name stringa  (facoltativo)

Il nome del file.

source string  (facoltativo)

Fonte attribuita a una parte del testo.

type string  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "file_citation".

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

PlaceCitation

Un'annotazione di citazione di un luogo.

place_id stringa  (facoltativo)

L'ID del luogo, nel formato `places/{place_id}`.

name string  (facoltativo)

Titolo del luogo.

url string  (facoltativo)

Riferimento URI del luogo.

review_snippets ReviewSnippet  (facoltativo)

Snippet di recensioni utilizzati per generare risposte sulle caratteristiche di un determinato luogo in Google Maps.

Contiene un estratto di una recensione utente che risponde a una domanda sulle caratteristiche di un luogo specifico in Google Maps.

Campi

title string  (facoltativo)

Titolo della recensione.

url string  (facoltativo)

Un link che corrisponde alla recensione dell'utente su Google Maps.

review_id stringa  (facoltativo)

L'ID dello snippet recensione.

type string  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "place_citation".

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "text".

ImageContent

Un blocco di contenuti immagine.

data string  (facoltativo)

Il contenuto dell'immagine.

uri string  (facoltativo)

L'URI dell'immagine.

mime_type enum (string)  (facoltativo)

Il tipo MIME dell'immagine.

Valori possibili:

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
risoluzione MediaResolution  (facoltativo)

La risoluzione dei contenuti multimediali.

Valori possibili:

  • low
  • medium
  • high
  • ultra_high

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "image".

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "thought_summary".

ThoughtSignatureDelta

signature string  (facoltativo)

Firma per abbinare l'origine del backend da includere nella generazione.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "thought_signature".

FunctionCallDelta

name string  (obbligatorio)

Nessuna descrizione fornita.

arguments object  (obbligatorio)

Nessuna descrizione fornita.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "function_call".

id stringa  (obbligatorio)

Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

FunctionResultDelta

name string  (facoltativo)

Nessuna descrizione fornita.

is_error boolean  (facoltativo)

Nessuna descrizione fornita.

result oggetto o stringa  (obbligatorio)

Delta del risultato della chiamata allo strumento.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "function_result".

call_id string  (obbligatorio)

ID che corrisponde all'ID del blocco di chiamata di funzione.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

CodeExecutionCallDelta

arguments CodeExecutionCallArguments  (obbligatorio)

Nessuna descrizione fornita.

Gli argomenti da passare all'esecuzione del codice.

Campi

language enum (string)  (facoltativo)

Linguaggio di programmazione del codice.

Valori possibili:

  • python
code string  (facoltativo)

Il codice da eseguire.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "code_execution_call".

id stringa  (obbligatorio)

Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

CodeExecutionResultDelta

result string  (obbligatorio)

Nessuna descrizione fornita.

is_error boolean  (facoltativo)

Nessuna descrizione fornita.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "code_execution_result".

call_id string  (obbligatorio)

ID che corrisponde all'ID del blocco di chiamata di funzione.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

UrlContextCallDelta

arguments UrlContextCallArguments  (obbligatorio)

Nessuna descrizione fornita.

Gli argomenti da passare al contesto dell'URL.

Campi

urls array (string)  (facoltativo)

Gli URL da recuperare.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "url_context_call".

id stringa  (obbligatorio)

Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

UrlContextResultDelta

result UrlContextResult  (obbligatorio)

Nessuna descrizione fornita.

Il risultato del contesto dell'URL.

Campi

url string  (facoltativo)

L'URL recuperato.

status enum (string)  (facoltativo)

Lo stato del recupero dell'URL.

Valori possibili:

  • success
  • error
  • paywall
  • unsafe
is_error boolean  (facoltativo)

Nessuna descrizione fornita.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "url_context_result".

call_id string  (obbligatorio)

ID che corrisponde all'ID del blocco di chiamata di funzione.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

GoogleSearchCallDelta

arguments GoogleSearchCallArguments  (obbligatorio)

Nessuna descrizione fornita.

Gli argomenti da passare alla Ricerca Google.

Campi

queries array (string)  (facoltativo)

Query di ricerca web per la ricerca web successiva.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "google_search_call".

id stringa  (obbligatorio)

Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

GoogleSearchResultDelta

result GoogleSearchResult  (obbligatorio)

Nessuna descrizione fornita.

Il risultato della Ricerca Google.

Campi

search_suggestions stringa  (facoltativo)

Snippet di contenuti web che può essere incorporato in una pagina web o in una webview di un'app.

is_error boolean  (facoltativo)

Nessuna descrizione fornita.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "google_search_result".

call_id string  (obbligatorio)

ID che corrisponde all'ID del blocco di chiamata di funzione.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

McpServerToolCallDelta

name string  (obbligatorio)

Nessuna descrizione fornita.

server_name string  (obbligatorio)

Nessuna descrizione fornita.

arguments object  (obbligatorio)

Nessuna descrizione fornita.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "mcp_server_tool_call".

id stringa  (obbligatorio)

Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

McpServerToolResultDelta

name string  (facoltativo)

Nessuna descrizione fornita.

server_name string  (facoltativo)

Nessuna descrizione fornita.

result oggetto o stringa  (obbligatorio)

Delta del risultato della chiamata allo strumento.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "mcp_server_tool_result".

call_id string  (obbligatorio)

ID che corrisponde all'ID del blocco di chiamata di funzione.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

FileSearchCallDelta

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "file_search_call".

id stringa  (obbligatorio)

Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

FileSearchResultDelta

result FileSearchResult  (facoltativo)

Nessuna descrizione fornita.

Il risultato della ricerca di file.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "file_search_result".

call_id string  (obbligatorio)

ID che corrisponde all'ID del blocco di chiamata di funzione.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

GoogleMapsCallDelta

arguments GoogleMapsCallArguments  (facoltativo)

Gli argomenti da passare allo strumento Google Maps.

Gli argomenti da passare allo strumento Google Maps.

Campi

queries array (string)  (facoltativo)

Le query da eseguire.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "google_maps_call".

id stringa  (obbligatorio)

Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

GoogleMapsResultDelta

result GoogleMapsResult  (obbligatorio)

I risultati di Google Maps.

Il risultato di Google Maps.

Campi

luoghi Luoghi  (facoltativo)

I luoghi trovati.

Campi

place_id stringa  (facoltativo)

L'ID del luogo, nel formato `places/{place_id}`.

name string  (facoltativo)

Titolo del luogo.

url string  (facoltativo)

Riferimento URI del luogo.

review_snippets ReviewSnippet  (facoltativo)

Snippet di recensioni utilizzati per generare risposte sulle caratteristiche di un determinato luogo in Google Maps.

Contiene un estratto di una recensione utente che risponde a una domanda sulle caratteristiche di un luogo specifico in Google Maps.

Campi

title string  (facoltativo)

Titolo della recensione.

url string  (facoltativo)

Un link che corrisponde alla recensione dell'utente su Google Maps.

review_id stringa  (facoltativo)

L'ID dello snippet recensione.

widget_context_token string  (facoltativo)

Nome della risorsa del token di contesto del widget di Google Maps.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "google_maps_result".

call_id string  (obbligatorio)

ID che corrisponde all'ID del blocco di chiamata di funzione.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

event_type stringa  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "content.delta".

event_id string  (facoltativo)

Il token event_id da utilizzare per riprendere lo stream di interazione da questo evento.

ContentStop

index integer  (obbligatorio)

Nessuna descrizione fornita.

event_type stringa  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "content.stop".

event_id string  (facoltativo)

Il token event_id da utilizzare per riprendere lo stream di interazione da questo evento.

ErrorEvent

error Error  (facoltativo)

Nessuna descrizione fornita.

Messaggio di errore di un'interazione.

Campi

code string  (facoltativo)

Un URI che identifica il tipo di errore.

message string  (facoltativo)

Un messaggio di errore leggibile.

event_type stringa  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "error".

event_id string  (facoltativo)

Il token event_id da utilizzare per riprendere lo stream di interazione da questo evento.

Esempi

Inizio interazione

{
  "event_type": "interaction.start",
  "interaction": {
    "id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM",
    "model": "gemini-3-flash-preview",
    "object": "interaction",
    "status": "in_progress"
  }
}

Interazione completata

{
  "event_type": "interaction.complete",
  "interaction": {
    "created": "2025-12-09T18:45:40Z",
    "id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM",
    "model": "gemini-3-flash-preview",
    "object": "interaction",
    "role": "model",
    "status": "completed",
    "updated": "2025-12-09T18:45:40Z",
    "usage": {
      "input_tokens_by_modality": [
        {
          "modality": "text",
          "tokens": 11
        }
      ],
      "total_cached_tokens": 0,
      "total_input_tokens": 11,
      "total_output_tokens": 364,
      "total_thought_tokens": 1120,
      "total_tokens": 1495,
      "total_tool_use_tokens": 0
    }
  }
}

Aggiornamento dello stato dell'interazione

{
  "event_type": "interaction.status_update",
  "interaction_id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM",
  "status": "in_progress"
}

Inizio dei contenuti

{
  "event_type": "content.start",
  "content": {
    "type": "text"
  },
  "index": 1
}

Delta dei contenuti

{
  "event_type": "content.delta",
  "delta": {
    "type": "text",
    "text": "Elara\u2019s life was a symphony of quiet moments. A librarian, she found solace in the hushed aisles, the scent of aged paper, and the predictable rhythm of her days. Her small apartment, meticulously ordered, reflected this internal calm, save"
  },
  "index": 1
}

Interruzione dei contenuti

{
  "event_type": "content.stop",
  "index": 1
}

Evento di errore

{
  "event_type": "error",
  "error": {
    "message": "Failed to get completed interaction: Result not found.",
    "code": "not_found"
  }
}