Gemini API

L'API Gemini Interactions è un'API sperimentale che consente agli sviluppatori di creare applicazioni di AI generativa utilizzando i modelli Gemini. Gemini è il nostro modello più potente, sviluppato da zero per essere multimodale. È in grado di generalizzare e di comprendere, gestire e combinare senza problemi diversi tipi di informazioni, tra cui linguaggio, immagini, audio, video e codice. Puoi utilizzare l'API Gemini per casi d'uso come il ragionamento su testo e immagini, la generazione di contenuti, gli agenti di dialogo, i sistemi di riepilogo e classificazione e altro ancora.

Creare un'interazione

post https://generativelanguage.googleapis.com/v1beta/interactions

Crea una nuova interazione.

Corpo della richiesta

Il corpo della richiesta contiene dati con la seguente struttura:

model ModelOption  (facoltativo)

Il nome del modello utilizzato per generare l'interazione.
Obbligatorio se non viene fornito "agent".

Valori possibili:

  • gemini-2.5-computer-use-preview-10-2025

    Un modello di funzionalità agentiche progettato per l'interazione diretta con l'interfaccia, che consente a Gemini di percepire e navigare negli ambienti digitali.

  • gemini-2.5-flash

    Il nostro primo modello di ragionamento ibrido che supporta una finestra contestuale da 1 milione di token e dispone di budget di pensiero.

  • gemini-2.5-flash-image

    Il nostro modello nativo di generazione di immagini, ottimizzato per velocità, flessibilità e comprensione contestuale. L'input e l'output di testo hanno lo stesso prezzo di 2,5 Flash.

  • gemini-2.5-flash-lite

    Il nostro modello più piccolo ed economico, creato per l'utilizzo su larga scala.

  • gemini-2.5-flash-lite-preview-09-2025

    L'ultimo modello basato su Gemini 2.5 Flash Lite ottimizzato per costi contenuti, throughput elevato e alta qualità.

  • gemini-2.5-flash-native-audio-preview-12-2025

    I nostri modelli audio nativi ottimizzati per output audio di qualità superiore con un ritmo, una naturalezza della voce, un livello di dettaglio e un tono migliori.

  • gemini-2.5-flash-preview-09-2025

    Il modello più recente basato sul modello 2.5 Flash. 2.5 Flash Preview è ideale per l'elaborazione su larga scala, la bassa latenza, le attività ad alto volume che richiedono ragionamento e i casi d'uso con agenti.

  • gemini-2.5-flash-preview-tts

    Il nostro modello Text-to-Speech 2.5 Flash è ottimizzato per la generazione di sintesi vocale potente, controllabile e a bassa latenza.

  • gemini-2.5-pro

    Il nostro modello multiuso all'avanguardia, che eccelle nella programmazione e in attività di ragionamento complesse.

  • gemini-2.5-pro-preview-tts

    Il nostro modello audio Text-to-Speech 2.5 Pro ottimizzato per una generazione di voce potente e a bassa latenza per output più naturali e prompt più facili da gestire.

  • gemini-3-flash-preview

    Il nostro modello più intelligente, creato per la velocità, che combina intelligenza all'avanguardia con ricerca e grounding superiori.

  • gemini-3-pro-image-preview

    Modello all'avanguardia per la generazione e la modifica di immagini.

  • gemini-3-pro-preview

    Il nostro modello più intelligente con ragionamento e comprensione multimodale all'avanguardia, nonché potenti funzionalità di codifica di agenti e vibe coding.

  • gemini-3.1-pro-preview

    Il nostro ultimo modello di ragionamento SOTA con una profondità e una sfumatura senza precedenti, nonché potenti funzionalità di comprensione multimodale e programmazione.

  • gemini-3.1-flash-image-preview

    Intelligenza visiva di livello professionale con efficienza alla velocità di Flash e funzionalità di generazione basate sulla realtà.

  • gemini-3.1-flash-lite-preview

    Il nostro modello più conveniente, ottimizzato per attività agentiche ad alto volume, traduzione ed elaborazione di dati semplici.

  • gemini-3.1-flash-tts-preview

    Gemini 3.1 Flash TTS: generazione di sintesi vocale potente e a bassa latenza. Goditi output naturali, prompt orientabili e nuovi tag audio espressivi per un controllo preciso della narrazione.

  • lyria-3-clip-preview

    Il nostro modello di generazione di musica a bassa latenza ottimizzato per audio clip ad alta fedeltà e un controllo ritmico preciso.

  • lyria-3-pro-preview

    Il nostro modello generativo avanzato per brani completi con una profonda comprensione della composizione, ottimizzato per un controllo strutturale preciso e transizioni complesse in diversi stili musicali.

Il modello che completerà il prompt.\n\nPer ulteriori dettagli, consulta [modelli](https://ai.google.dev/gemini-api/docs/models).

agent AgentOption  (facoltativo)

Il nome dell'agente utilizzato per generare l'interazione.
Obbligatorio se non viene fornito "model".

Valori possibili:

  • deep-research-pro-preview-12-2025

    Agente Gemini Deep Research

  • deep-research-preview-04-2026

    Agente Gemini Deep Research

  • deep-research-max-preview-04-2026

    Gemini Deep Research Max Agent

L'agente con cui interagire.

input Content o array (Content) o array (Step) o stringa  (obbligatorio)

Gli input per l'interazione (comuni sia al modello che all'agente).

system_instruction string  (facoltativo)

Istruzione di sistema per l'interazione.

tools array (Tool)  (facoltativo)

Un elenco di dichiarazioni di strumenti che il modello può chiamare durante l'interazione.

response_format ResponseFormat o ResponseFormatList  (facoltativo)

Impone che la risposta generata sia un oggetto JSON conforme allo schema JSON specificato in questo campo.

response_mime_type stringa  (facoltativo)

Il tipo MIME della risposta. Questo campo è obbligatorio se è impostato response_format.

stream boolean  (facoltativo)

Solo input. Se l'interazione verrà trasmessa in streaming.

store boolean  (facoltativo)

Solo input. Se memorizzare la risposta e la richiesta per il recupero successivo.

background boolean  (facoltativo)

Solo input. Indica se eseguire l'interazione del modello in background.

generation_config GenerationConfig  (facoltativo)

Configurazione modello
Parametri di configurazione per l'interazione con il modello.
Alternativa a "agent_config". Applicabile solo quando è impostato "model".

Parametri di configurazione per le interazioni del modello.

Campi

temperature number  (facoltativo)

Controlla la casualità dell'output.

top_p number  (facoltativo)

La probabilità cumulativa massima dei token da considerare durante il campionamento.

seed integer  (facoltativo)

Seed utilizzato nella decodifica per la riproducibilità.

stop_sequences array (string)  (facoltativo)

Un elenco di sequenze di caratteri che interromperanno l'interazione di output.

thinking_level ThinkingLevel  (facoltativo)

Il livello di token di pensiero che il modello deve generare.

Valori possibili:

  • minimal
  • low
  • medium
  • high

thinking_summaries ThinkingSummaries  (facoltativo)

Se includere i riepiloghi del pensiero nella risposta.

Valori possibili:

  • auto
  • none

max_output_tokens integer  (facoltativo)

Il numero massimo di token da includere nella risposta.

speech_config SpeechConfig  (facoltativo)

Configurazione per l'interazione vocale.

La configurazione per l'interazione vocale.

Campi

voice string  (facoltativo)

La voce dell'oratore.

language string  (facoltativo)

La lingua del discorso.

speaker string  (facoltativo)

Il nome dell'oratore, che deve corrispondere a quello indicato nel prompt.

image_config ImageConfig  (facoltativo)

Configurazione per l'interazione con le immagini.

La configurazione per l'interazione con le immagini.

Campi

aspect_ratio enum (string)  (facoltativo)

Nessuna descrizione fornita.

Valori possibili:

  • 1:1
  • 2:3
  • 3:2
  • 3:4
  • 4:3
  • 4:5
  • 5:4
  • 9:16
  • 16:9
  • 21:9
  • 1:8
  • 8:1
  • 1:4
  • 4:1
image_size enum (string)  (facoltativo)

Nessuna descrizione fornita.

Valori possibili:

  • 1K
  • 2K
  • 4K
  • 512
tool_choice ToolChoiceConfig o ToolChoiceType  (facoltativo)

La configurazione della scelta dello strumento.

agent_config object  (facoltativo)

Configurazione dell'agente
Configurazione dell'agente.
Alternativa a `generation_config`. Applicabile solo quando è impostato `agent`.

Tipi possibili

Discriminatore polimorfico: type

DynamicAgentConfig

Configurazione per gli agenti dinamici.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "dynamic".

DeepResearchAgentConfig

Configurazione dell'agente Deep Research.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "deep-research".

thinking_summaries ThinkingSummaries  (facoltativo)

Se includere i riepiloghi del pensiero nella risposta.

Valori possibili:

  • auto
  • none

visualization enum (string)  (facoltativo)

Indica se includere le visualizzazioni nella risposta.

Valori possibili:

  • off
  • auto
collaborative_planning boolean  (facoltativo)

Consente la pianificazione human-in-the-loop per l'agente Deep Research. Se impostato su true, l'agente Deep Research fornirà un piano di ricerca nella sua risposta. L'agente procederà solo se l'utente conferma il piano nel turno successivo.

previous_interaction_id stringa  (facoltativo)

L'ID dell'interazione precedente, se presente.

response_modalities ResponseModality  (facoltativo)

Le modalità richieste della risposta (TEXT, IMAGE, AUDIO).

Valori possibili:

  • text
  • image
  • audio
  • video
  • document

service_tier ServiceTier  (facoltativo)

Il livello di servizio per l'interazione.

Valori possibili:

  • flex
  • standard
  • priority

webhook_config WebhookConfig  (facoltativo)

Facoltativo. Configurazione webhook per ricevere notifiche al termine dell'interazione.

Messaggio per la configurazione degli eventi webhook per una richiesta.

Campi

uris array (string)  (facoltativo)

Facoltativo. Se impostati, questi URI webhook verranno utilizzati per gli eventi webhook anziché per i webhook registrati.

user_metadata object  (facoltativo)

Facoltativo. I metadati utente che verranno restituiti a ogni emissione di eventi ai webhook.

Risposta

Restituisce una risorsa Interaction.

Richiesta semplice

Esempio di risposta

{
  "created": "2025-11-26T12:25:15Z",
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "object": "interaction",
  "steps": [
    {
      "type": "model_output",
      "content": [
        {
          "type": "text",
          "text": "Hello! I'm functioning perfectly and ready to assist you.\n\nHow are you doing today?"
        }
      ]
    }
  ],
  "status": "completed",
  "updated": "2025-11-26T12:25:15Z",
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 7
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 7,
    "total_output_tokens": 20,
    "total_thought_tokens": 22,
    "total_tokens": 49,
    "total_tool_use_tokens": 0
  }
}

In più passaggi

Esempio di risposta

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "steps": [
    {
      "type": "model_output",
      "content": [
        {
          "type": "text",
          "text": "The capital of France is Paris."
        }
      ]
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 50
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 50,
    "total_output_tokens": 10,
    "total_thought_tokens": 0,
    "total_tokens": 60,
    "total_tool_use_tokens": 0
  }
}

Input immagine

Esempio di risposta

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "steps": [
    {
      "type": "model_output",
      "content": [
        {
          "type": "text",
          "text": "A white humanoid robot with glowing blue eyes stands holding a red skateboard."
        }
      ]
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 10
      },
      {
        "modality": "image",
        "tokens": 258
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 268,
    "total_output_tokens": 20,
    "total_thought_tokens": 0,
    "total_tokens": 288,
    "total_tool_use_tokens": 0
  }
}

Chiamata di funzione

Esempio di risposta

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "requires_action",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "steps": [
    {
      "type": "function_call",
      "id": "gth23981",
      "name": "get_weather",
      "arguments": {
        "location": "Boston, MA"
      }
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 100
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 100,
    "total_output_tokens": 25,
    "total_thought_tokens": 0,
    "total_tokens": 125,
    "total_tool_use_tokens": 50
  }
}

Deep Research

Esempio di risposta

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "agent": "deep-research-pro-preview-12-2025",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "steps": [
    {
      "type": "model_output",
      "content": [
        {
          "type": "text",
          "text": "Here is a comprehensive research report on the current state of cancer research..."
        }
      ]
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 20
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 20,
    "total_output_tokens": 1000,
    "total_thought_tokens": 500,
    "total_tokens": 1520,
    "total_tool_use_tokens": 0
  }
}

Recuperare un'interazione

get https://generativelanguage.googleapis.com/v1beta/interactions/{id}

Recupera i dettagli completi di una singola interazione in base al relativo `Interaction.id`.

Parametri percorso / query

id stringa  (obbligatorio)

L'identificatore univoco dell'interazione da recuperare.

stream boolean  (facoltativo)

Se è impostato su true, i contenuti generati verranno trasmessi in streaming in modo incrementale.

Valore predefinito: False

last_event_id string  (facoltativo)

Facoltativo. Se impostato, riprende il flusso di interazione dal blocco successivo all'evento contrassegnato dall'ID evento. Può essere utilizzato solo se "stream" è true.

include_input boolean  (facoltativo)

Se è impostata su true, include l'input nella risposta.

Valore predefinito: False

api_version string  (facoltativo)

Quale versione dell'API utilizzare.

Risposta

Restituisce una risorsa Interaction.

Recupera interazione

Esempio di risposta

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:25:15Z",
  "updated": "2025-11-26T12:25:15Z",
  "steps": [
    {
      "type": "model_output",
      "content": [
        {
          "type": "text",
          "text": "I'm doing great, thank you for asking! How can I help you today?"
        }
      ]
    }
  ]
}

Eliminazione di un'interazione

delete https://generativelanguage.googleapis.com/v1beta/interactions/{id}

Elimina l'interazione in base all'ID.

Parametri percorso / query

id stringa  (obbligatorio)

L'identificatore univoco dell'interazione da eliminare.

api_version string  (facoltativo)

Quale versione dell'API utilizzare.

Risposta

In caso di esito positivo, la risposta è vuota.

Elimina interazione

Annullare un'interazione

post https://generativelanguage.googleapis.com/v1beta/interactions/{id}/cancel

Annulla un'interazione in base all'ID. Questo vale solo per le interazioni in background ancora in esecuzione.

Parametri percorso / query

id stringa  (obbligatorio)

L'identificatore univoco dell'interazione da annullare.

api_version string  (facoltativo)

Quale versione dell'API utilizzare.

Risposta

Restituisce una risorsa Interaction.

Annulla interazione

Esempio di risposta

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "agent": "deep-research-pro-preview-12-2025",
  "status": "cancelled",
  "object": "interaction",
  "created": "2025-11-26T12:25:15Z",
  "updated": "2025-11-26T12:25:15Z"
}

Risorse

Interazione

La risorsa Interaction.

Campi

model ModelOption  (facoltativo)

Il nome del modello utilizzato per generare l'interazione.

Valori possibili:

  • gemini-2.5-computer-use-preview-10-2025

    Un modello di funzionalità agentiche progettato per l'interazione diretta con l'interfaccia, che consente a Gemini di percepire e navigare negli ambienti digitali.

  • gemini-2.5-flash

    Il nostro primo modello di ragionamento ibrido che supporta una finestra contestuale da 1 milione di token e dispone di budget di pensiero.

  • gemini-2.5-flash-image

    Il nostro modello nativo di generazione di immagini, ottimizzato per velocità, flessibilità e comprensione contestuale. L'input e l'output di testo hanno lo stesso prezzo di 2,5 Flash.

  • gemini-2.5-flash-lite

    Il nostro modello più piccolo ed economico, creato per l'utilizzo su larga scala.

  • gemini-2.5-flash-lite-preview-09-2025

    L'ultimo modello basato su Gemini 2.5 Flash Lite ottimizzato per costi contenuti, throughput elevato e alta qualità.

  • gemini-2.5-flash-native-audio-preview-12-2025

    I nostri modelli audio nativi ottimizzati per output audio di qualità superiore con un ritmo, una naturalezza della voce, un livello di dettaglio e un tono migliori.

  • gemini-2.5-flash-preview-09-2025

    Il modello più recente basato sul modello 2.5 Flash. 2.5 Flash Preview è ideale per l'elaborazione su larga scala, la bassa latenza, le attività ad alto volume che richiedono ragionamento e i casi d'uso con agenti.

  • gemini-2.5-flash-preview-tts

    Il nostro modello Text-to-Speech 2.5 Flash è ottimizzato per la generazione di sintesi vocale potente, controllabile e a bassa latenza.

  • gemini-2.5-pro

    Il nostro modello multiuso all'avanguardia, che eccelle nella programmazione e in attività di ragionamento complesse.

  • gemini-2.5-pro-preview-tts

    Il nostro modello audio Text-to-Speech 2.5 Pro ottimizzato per una generazione di voce potente e a bassa latenza per output più naturali e prompt più facili da gestire.

  • gemini-3-flash-preview

    Il nostro modello più intelligente, creato per la velocità, che combina intelligenza all'avanguardia con ricerca e grounding superiori.

  • gemini-3-pro-image-preview

    Modello all'avanguardia per la generazione e la modifica di immagini.

  • gemini-3-pro-preview

    Il nostro modello più intelligente con ragionamento e comprensione multimodale all'avanguardia, nonché potenti funzionalità di codifica di agenti e vibe coding.

  • gemini-3.1-pro-preview

    Il nostro ultimo modello di ragionamento SOTA con una profondità e una sfumatura senza precedenti, nonché potenti funzionalità di comprensione multimodale e programmazione.

  • gemini-3.1-flash-image-preview

    Intelligenza visiva di livello professionale con efficienza alla velocità di Flash e funzionalità di generazione basate sulla realtà.

  • gemini-3.1-flash-lite-preview

    Il nostro modello più conveniente, ottimizzato per attività agentiche ad alto volume, traduzione ed elaborazione di dati semplici.

  • gemini-3.1-flash-tts-preview

    Gemini 3.1 Flash TTS: generazione di sintesi vocale potente e a bassa latenza. Goditi output naturali, prompt orientabili e nuovi tag audio espressivi per un controllo preciso della narrazione.

  • lyria-3-clip-preview

    Il nostro modello di generazione di musica a bassa latenza ottimizzato per audio clip ad alta fedeltà e un controllo ritmico preciso.

  • lyria-3-pro-preview

    Il nostro modello generativo avanzato per brani completi con una profonda comprensione della composizione, ottimizzato per un controllo strutturale preciso e transizioni complesse in diversi stili musicali.

Il modello che completerà il prompt.\n\nPer ulteriori dettagli, consulta [modelli](https://ai.google.dev/gemini-api/docs/models).

agent AgentOption  (facoltativo)

Il nome dell'agente utilizzato per generare l'interazione.

Valori possibili:

  • deep-research-pro-preview-12-2025

    Agente Gemini Deep Research

  • deep-research-preview-04-2026

    Agente Gemini Deep Research

  • deep-research-max-preview-04-2026

    Gemini Deep Research Max Agent

L'agente con cui interagire.

id string  (facoltativo)

Obbligatorio. Solo output. Un identificatore univoco per il completamento dell'interazione.

status enum (string)  (facoltativo)

Obbligatorio. Solo output. Lo stato dell'interazione.

Valori possibili:

  • in_progress
  • requires_action
  • completed
  • failed
  • cancelled
  • incomplete
created stringa  (facoltativo)

Obbligatorio. Solo output. L'ora in cui è stata creata la risposta nel formato ISO 8601 (AAAA-MM-GGThh:mm:ssZ).

updated string  (facoltativo)

Obbligatorio. Solo output. L'ora in cui la risposta è stata aggiornata l'ultima volta nel formato ISO 8601 (AAAA-MM-GGThh:mm:ssZ).

role string  (facoltativo)

Solo output. Il ruolo dell'interazione.

system_instruction string  (facoltativo)

Istruzione di sistema per l'interazione.

tools array (Tool)  (facoltativo)

Un elenco di dichiarazioni di strumenti che il modello può chiamare durante l'interazione.

usage Utilizzo  (facoltativo)

Solo output. Statistiche sull'utilizzo dei token della richiesta di interazione.

Statistiche sull'utilizzo dei token della richiesta di interazione.

Campi

total_input_tokens integer  (facoltativo)

Numero di token nel prompt (contesto).

input_tokens_by_modality ModalityTokens  (facoltativo)

Una suddivisione dell'utilizzo dei token di input per modalità.

Il conteggio dei token per una singola modalità di risposta.

Campi

modalità ResponseModality  (facoltativo)

La modalità associata al conteggio dei token.

Valori possibili:

  • text
  • image
  • audio
  • video
  • document

token integer  (facoltativo)

Numero di token per la modalità.

total_cached_tokens integer  (facoltativo)

Numero di token nella parte memorizzata nella cache del prompt (i contenuti memorizzati nella cache).

cached_tokens_by_modality ModalityTokens  (facoltativo)

Una suddivisione dell'utilizzo dei token memorizzati nella cache per modalità.

Il conteggio dei token per una singola modalità di risposta.

Campi

modalità ResponseModality  (facoltativo)

La modalità associata al conteggio dei token.

Valori possibili:

  • text
  • image
  • audio
  • video
  • document

token integer  (facoltativo)

Numero di token per la modalità.

total_output_tokens integer  (facoltativo)

Numero totale di token in tutte le risposte generate.

output_tokens_by_modality ModalityTokens  (facoltativo)

Una suddivisione dell'utilizzo dei token di output per modalità.

Il conteggio dei token per una singola modalità di risposta.

Campi

modalità ResponseModality  (facoltativo)

La modalità associata al conteggio dei token.

Valori possibili:

  • text
  • image
  • audio
  • video
  • document

token integer  (facoltativo)

Numero di token per la modalità.

total_tool_use_tokens integer  (facoltativo)

Numero di token presenti nei prompt di utilizzo degli strumenti.

tool_use_tokens_by_modality ModalityTokens  (facoltativo)

Una suddivisione dell'utilizzo dei token di utilizzo degli strumenti per modalità.

Il conteggio dei token per una singola modalità di risposta.

Campi

modalità ResponseModality  (facoltativo)

La modalità associata al conteggio dei token.

Valori possibili:

  • text
  • image
  • audio
  • video
  • document

token integer  (facoltativo)

Numero di token per la modalità.

total_thought_tokens integer  (facoltativo)

Numero di token di pensieri per i modelli di ragionamento.

total_tokens integer  (facoltativo)

Conteggio totale dei token per la richiesta di interazione (prompt + risposte + altri token interni).

grounding_tool_count GroundingToolCount  (facoltativo)

Conteggio degli strumenti di messa a terra.

Il numero di conteggi dello strumento di messa a terra.

Campi

type enum (string)  (facoltativo)

Il tipo di strumento di grounding associato al conteggio.

Valori possibili:

  • google_search
  • google_maps
  • retrieval
count integer  (facoltativo)

Il numero di conteggi dello strumento di messa a terra.

response_modalities ResponseModality  (facoltativo)

Le modalità richieste della risposta (TEXT, IMAGE, AUDIO).

Valori possibili:

  • text
  • image
  • audio
  • video
  • document

response_mime_type stringa  (facoltativo)

Il tipo MIME della risposta. Questo campo è obbligatorio se è impostato response_format.

previous_interaction_id stringa  (facoltativo)

L'ID dell'interazione precedente, se presente.

service_tier ServiceTier  (facoltativo)

Il livello di servizio per l'interazione.

Valori possibili:

  • flex
  • standard
  • priority

webhook_config WebhookConfig  (facoltativo)

Facoltativo. Configurazione webhook per ricevere notifiche al termine dell'interazione.

Messaggio per la configurazione degli eventi webhook per una richiesta.

Campi

uris array (string)  (facoltativo)

Facoltativo. Se impostati, questi URI webhook verranno utilizzati per gli eventi webhook anziché per i webhook registrati.

user_metadata object  (facoltativo)

Facoltativo. I metadati utente che verranno restituiti a ogni emissione di eventi ai webhook.

passaggi passaggio  (facoltativo)

Solo output. I passaggi che compongono l'interazione.

Un passaggio dell'interazione.

Tipi possibili

Discriminatore polimorfico: type

UserInputStep

Input fornito dall'utente.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "user_input".

content array (Content)  (facoltativo)

Nessuna descrizione fornita.

ModelOutputStep

Output generato dal modello.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "model_output".

content array (Content)  (facoltativo)

Nessuna descrizione fornita.

ThoughtStep

Un passaggio di pensiero.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "thought".

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

summary ThoughtSummaryContent  (facoltativo)

Un riepilogo del pensiero.

Tipi possibili

Discriminatore polimorfico: type

TextContent

Un blocco di contenuti testuali.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "text".

text string  (obbligatorio)

Obbligatorio. Il contenuto testuale.

annotazioni Annotazione  (facoltativo)

Informazioni sulle citazioni per i contenuti generati dal modello.

Informazioni sulle citazioni per i contenuti generati dal modello.

Tipi possibili

Discriminatore polimorfico: type

UrlCitation

Un'annotazione di citazione di URL.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "url_citation".

url string  (facoltativo)

L'URL.

title string  (facoltativo)

Il titolo dell'URL.

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

FileCitation

Un'annotazione di citazione di un file.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "file_citation".

document_uri string  (facoltativo)

L'URI del file.

file_name stringa  (facoltativo)

Il nome del file.

source string  (facoltativo)

Fonte attribuita a una parte del testo.

custom_metadata object  (facoltativo)

Metadati forniti dall'utente sul contesto recuperato.

page_number integer  (facoltativo)

Numero di pagina del documento citato, se applicabile.

media_id string  (facoltativo)

ID elemento multimediale in caso di citazioni di immagini, se applicabile.

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

PlaceCitation

Un'annotazione di citazione di un luogo.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "place_citation".

place_id stringa  (facoltativo)

L'ID del luogo, nel formato `places/{place_id}`.

name string  (facoltativo)

Titolo del luogo.

url string  (facoltativo)

Riferimento URI del luogo.

review_snippets ReviewSnippet  (facoltativo)

Snippet di recensioni utilizzati per generare risposte sulle caratteristiche di un determinato luogo in Google Maps.

Contiene un estratto di una recensione utente che risponde a una domanda sulle caratteristiche di un luogo specifico in Google Maps.

Campi

title string  (facoltativo)

Titolo della recensione.

url string  (facoltativo)

Un link che corrisponde alla recensione dell'utente su Google Maps.

review_id stringa  (facoltativo)

L'ID dello snippet recensione.

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

ImageContent

Un blocco di contenuti immagine.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "image".

data string  (facoltativo)

Il contenuto dell'immagine.

uri string  (facoltativo)

L'URI dell'immagine.

mime_type enum (string)  (facoltativo)

Il tipo MIME dell'immagine.

Valori possibili:

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
  • image/gif
  • image/bmp
  • image/tiff
risoluzione MediaResolution  (facoltativo)

La risoluzione dei contenuti multimediali.

Valori possibili:

  • low
  • medium
  • high
  • ultra_high

FunctionCallStep

Un passaggio di chiamata allo strumento di funzione.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "function_call".

name string  (obbligatorio)

Obbligatorio. Il nome dello strumento da chiamare.

arguments object  (obbligatorio)

Obbligatorio. Gli argomenti da passare alla funzione.

id stringa  (obbligatorio)

Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

CodeExecutionCallStep

Passaggio di chiamata dell'esecuzione del codice.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "code_execution_call".

arguments CodeExecutionCallStepArguments  (obbligatorio)

Obbligatorio. Gli argomenti da passare all'esecuzione del codice.

Gli argomenti da passare all'esecuzione del codice.

Campi

language enum (string)  (facoltativo)

Linguaggio di programmazione di `code`.

Valori possibili:

  • python
code string  (facoltativo)

Il codice da eseguire.

id stringa  (obbligatorio)

Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

UrlContextCallStep

Passaggio di chiamata del contesto dell'URL.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "url_context_call".

arguments UrlContextCallStepArguments  (obbligatorio)

Obbligatorio. Gli argomenti da passare al contesto dell'URL.

Gli argomenti da passare al contesto dell'URL.

Campi

urls array (string)  (facoltativo)

Gli URL da recuperare.

id stringa  (obbligatorio)

Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

McpServerToolCallStep

Passaggio di chiamata allo strumento MCPServer.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "mcp_server_tool_call".

name string  (obbligatorio)

Obbligatorio. Il nome dello strumento chiamato.

server_name string  (obbligatorio)

Obbligatorio. Il nome del server MCP utilizzato.

arguments object  (obbligatorio)

Obbligatorio. L'oggetto JSON degli argomenti della funzione.

id stringa  (obbligatorio)

Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

GoogleSearchCallStep

Passaggio della chiamata Ricerca Google.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "google_search_call".

arguments GoogleSearchCallStepArguments  (obbligatorio)

Obbligatorio. Gli argomenti da passare alla Ricerca Google.

Gli argomenti da passare alla Ricerca Google.

Campi

queries array (string)  (facoltativo)

Query di ricerca web per la ricerca web successiva.

search_type enum (string)  (facoltativo)

Il tipo di grounding della ricerca abilitato.

Valori possibili:

  • web_search
  • image_search
  • enterprise_web_search
id stringa  (obbligatorio)

Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

FileSearchCallStep

Passaggio di chiamata di ricerca di file.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "file_search_call".

id stringa  (obbligatorio)

Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

GoogleMapsCallStep

Passaggio di chiamata di Google Maps.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "google_maps_call".

arguments GoogleMapsCallStepArguments  (facoltativo)

Gli argomenti da passare allo strumento Google Maps.

Gli argomenti da passare allo strumento Google Maps.

Campi

queries array (string)  (facoltativo)

Le query da eseguire.

id stringa  (obbligatorio)

Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

FunctionResultStep

Risultato di una chiamata allo strumento di funzione.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "function_result".

name string  (facoltativo)

Il nome dello strumento chiamato.

is_error boolean  (facoltativo)

Indica se la chiamata allo strumento ha generato un errore.

call_id string  (obbligatorio)

Obbligatorio. ID da corrispondere all'ID del blocco di chiamata di funzione.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

result array (FunctionResultSubcontent) or string  (obbligatorio)

Il risultato della chiamata allo strumento.

CodeExecutionResultStep

Passaggio del risultato dell'esecuzione del codice.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "code_execution_result".

result string  (obbligatorio)

Obbligatorio. L'output dell'esecuzione del codice.

is_error boolean  (facoltativo)

Indica se l'esecuzione del codice ha generato un errore.

call_id string  (obbligatorio)

Obbligatorio. ID da corrispondere all'ID del blocco di chiamata di funzione.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

UrlContextResultStep

Passaggio del risultato del contesto URL.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "url_context_result".

result UrlContextResultItem  (obbligatorio)

Obbligatorio. I risultati del contesto dell'URL.

Il risultato del contesto dell'URL.

Campi

url string  (facoltativo)

L'URL recuperato.

status enum (string)  (facoltativo)

Lo stato del recupero dell'URL.

Valori possibili:

  • success
  • error
  • paywall
  • unsafe
is_error boolean  (facoltativo)

Indica se il contesto dell'URL ha generato un errore.

call_id string  (obbligatorio)

Obbligatorio. ID da corrispondere all'ID del blocco di chiamata di funzione.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

GoogleSearchResultStep

Passaggio del risultato di ricerca di Google.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "google_search_result".

result GoogleSearchResultItem  (obbligatorio)

Obbligatorio. I risultati della Ricerca Google.

Il risultato della Ricerca Google.

Campi

search_suggestions stringa  (facoltativo)

Snippet di contenuti web che può essere incorporato in una pagina web o in una webview di un'app.

is_error boolean  (facoltativo)

Indica se la Ricerca Google ha generato un errore.

call_id string  (obbligatorio)

Obbligatorio. ID da corrispondere all'ID del blocco di chiamata di funzione.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

McpServerToolResultStep

Passaggio del risultato dello strumento MCPServer.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "mcp_server_tool_result".

name string  (facoltativo)

Nome dello strumento chiamato per questa chiamata specifica.

server_name string  (facoltativo)

Il nome del server MCP utilizzato.

call_id string  (obbligatorio)

Obbligatorio. ID da corrispondere all'ID del blocco di chiamata di funzione.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

result array (FunctionResultSubcontent) or string  (obbligatorio)

L'output della chiamata al server MCP. Può essere un semplice testo o contenuti avanzati.

FileSearchResultStep

Passaggio del risultato della ricerca di file.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "file_search_result".

call_id string  (obbligatorio)

Obbligatorio. ID da corrispondere all'ID del blocco di chiamata di funzione.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

GoogleMapsResultStep

Passaggio dei risultati di Google Maps.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "google_maps_result".

result GoogleMapsResultItem  (obbligatorio)

Nessuna descrizione fornita.

Il risultato di Google Maps.

Campi

places GoogleMapsResultPlaces  (facoltativo)

Nessuna descrizione fornita.

Campi

place_id stringa  (facoltativo)

Nessuna descrizione fornita.

name string  (facoltativo)

Nessuna descrizione fornita.

url string  (facoltativo)

Nessuna descrizione fornita.

review_snippets ReviewSnippet  (facoltativo)

Nessuna descrizione fornita.

Contiene un estratto di una recensione utente che risponde a una domanda sulle caratteristiche di un luogo specifico in Google Maps.

Campi

title string  (facoltativo)

Titolo della recensione.

url string  (facoltativo)

Un link che corrisponde alla recensione dell'utente su Google Maps.

review_id stringa  (facoltativo)

L'ID dello snippet recensione.

widget_context_token string  (facoltativo)

Nessuna descrizione fornita.

call_id string  (obbligatorio)

Obbligatorio. ID da corrispondere all'ID del blocco di chiamata di funzione.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

input Content o array (Content) o array (Step) o stringa  (facoltativo)

L'input per l'interazione.

response_format ResponseFormat o ResponseFormatList  (facoltativo)

Impone che la risposta generata sia un oggetto JSON conforme allo schema JSON specificato in questo campo.

agent_config object  (facoltativo)

Parametri di configurazione per l'interazione con l'agente.

Tipi possibili

Discriminatore polimorfico: type

DynamicAgentConfig

Configurazione per gli agenti dinamici.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "dynamic".

DeepResearchAgentConfig

Configurazione dell'agente Deep Research.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "deep-research".

thinking_summaries ThinkingSummaries  (facoltativo)

Se includere i riepiloghi del pensiero nella risposta.

Valori possibili:

  • auto
  • none

visualization enum (string)  (facoltativo)

Indica se includere le visualizzazioni nella risposta.

Valori possibili:

  • off
  • auto
collaborative_planning boolean  (facoltativo)

Consente la pianificazione human-in-the-loop per l'agente Deep Research. Se impostato su true, l'agente Deep Research fornirà un piano di ricerca nella sua risposta. L'agente procederà solo se l'utente conferma il piano nel turno successivo.

Esempi

Esempio

{
  "created": "2025-12-04T15:01:45Z",
  "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg",
  "model": "gemini-3-flash-preview",
  "object": "interaction",
  "steps": [
    {
      "type": "model_output",
      "content": [
        {
          "type": "text",
          "text": "Hello! I'm doing well, functioning as expected. Thank you for asking! How are you doing today?"
        }
      ]
    }
  ],
  "status": "completed",
  "updated": "2025-12-04T15:01:45Z",
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 7
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 7,
    "total_output_tokens": 23,
    "total_thought_tokens": 49,
    "total_tokens": 79,
    "total_tool_use_tokens": 0
  }
}

Modelli di dati

Contenuti

Il contenuto della risposta.

Tipi possibili

Discriminatore polimorfico: type

TextContent

Un blocco di contenuti testuali.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "text".

text string  (obbligatorio)

Obbligatorio. Il contenuto testuale.

annotazioni Annotazione  (facoltativo)

Informazioni sulle citazioni per i contenuti generati dal modello.

Informazioni sulle citazioni per i contenuti generati dal modello.

Tipi possibili

Discriminatore polimorfico: type

UrlCitation

Un'annotazione di citazione di URL.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "url_citation".

url string  (facoltativo)

L'URL.

title string  (facoltativo)

Il titolo dell'URL.

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

FileCitation

Un'annotazione di citazione di un file.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "file_citation".

document_uri string  (facoltativo)

L'URI del file.

file_name stringa  (facoltativo)

Il nome del file.

source string  (facoltativo)

Fonte attribuita a una parte del testo.

custom_metadata object  (facoltativo)

Metadati forniti dall'utente sul contesto recuperato.

page_number integer  (facoltativo)

Numero di pagina del documento citato, se applicabile.

media_id string  (facoltativo)

ID elemento multimediale in caso di citazioni di immagini, se applicabile.

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

PlaceCitation

Un'annotazione di citazione di un luogo.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "place_citation".

place_id stringa  (facoltativo)

L'ID del luogo, nel formato `places/{place_id}`.

name string  (facoltativo)

Titolo del luogo.

url string  (facoltativo)

Riferimento URI del luogo.

review_snippets ReviewSnippet  (facoltativo)

Snippet di recensioni utilizzati per generare risposte sulle caratteristiche di un determinato luogo in Google Maps.

Contiene un estratto di una recensione utente che risponde a una domanda sulle caratteristiche di un luogo specifico in Google Maps.

Campi

title string  (facoltativo)

Titolo della recensione.

url string  (facoltativo)

Un link che corrisponde alla recensione dell'utente su Google Maps.

review_id stringa  (facoltativo)

L'ID dello snippet recensione.

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

ImageContent

Un blocco di contenuti immagine.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "image".

data string  (facoltativo)

Il contenuto dell'immagine.

uri string  (facoltativo)

L'URI dell'immagine.

mime_type enum (string)  (facoltativo)

Il tipo MIME dell'immagine.

Valori possibili:

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
  • image/gif
  • image/bmp
  • image/tiff
risoluzione MediaResolution  (facoltativo)

La risoluzione dei contenuti multimediali.

Valori possibili:

  • low
  • medium
  • high
  • ultra_high

AudioContent

Un blocco di contenuti audio.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "audio".

data string  (facoltativo)

I contenuti audio.

uri string  (facoltativo)

L'URI dell'audio.

mime_type enum (string)  (facoltativo)

Il tipo MIME dell'audio.

Valori possibili:

  • audio/wav
  • audio/mp3
  • audio/aiff
  • audio/aac
  • audio/ogg
  • audio/flac
  • audio/mpeg
  • audio/m4a
  • audio/l16
  • audio/opus
  • audio/alaw
  • audio/mulaw
channels integer  (facoltativo)

Il numero di canali audio.

sample_rate integer  (facoltativo)

La frequenza di campionamento dell'audio.

DocumentContent

Un blocco di contenuti del documento.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "document".

data string  (facoltativo)

I contenuti del documento.

uri string  (facoltativo)

L'URI del documento.

mime_type enum (string)  (facoltativo)

Il tipo MIME del documento.

Valori possibili:

  • application/pdf
VideoContent

Un blocco di contenuti video.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "video".

data string  (facoltativo)

I contenuti video.

uri string  (facoltativo)

L'URI del video.

mime_type enum (string)  (facoltativo)

Il tipo MIME del video.

Valori possibili:

  • video/mp4
  • video/mpeg
  • video/mpg
  • video/mov
  • video/avi
  • video/x-flv
  • video/webm
  • video/wmv
  • video/3gpp
risoluzione MediaResolution  (facoltativo)

La risoluzione dei contenuti multimediali.

Valori possibili:

  • low
  • medium
  • high
  • ultra_high

Esempi

Testo

{
  "type": "text",
  "text": "Hello, how are you?"
}

Immagine

{
  "type": "image",
  "data": "BASE64_ENCODED_IMAGE",
  "mime_type": "image/png"
}

Audio

{
  "type": "audio",
  "data": "BASE64_ENCODED_AUDIO",
  "mime_type": "audio/wav"
}

Documento

{
  "type": "document",
  "data": "BASE64_ENCODED_DOCUMENT",
  "mime_type": "application/pdf"
}

Video

{
  "type": "video",
  "uri": "https://www.youtube.com/watch?v=9hE5-98ZeCg"
}

Strumento

Uno strumento che può essere utilizzato dal modello.

Tipi possibili

Discriminatore polimorfico: type

Funzione

Uno strumento che può essere utilizzato dal modello.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "function".

name string  (facoltativo)

Il nome della funzione.

description stringa  (facoltativo)

Una descrizione della funzione.

parameters object  (facoltativo)

Lo schema JSON per i parametri della funzione.

CodeExecution

Uno strumento che può essere utilizzato dal modello per eseguire il codice.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "code_execution".

UrlContext

Uno strumento che può essere utilizzato dal modello per recuperare il contesto dell'URL.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "url_context".

ComputerUse

Uno strumento che può essere utilizzato dal modello per interagire con il computer.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "computer_use".

environment enum (string)  (facoltativo)

L'ambiente in cui viene eseguita l'operazione.

Valori possibili:

  • browser
excluded_predefined_functions array (string)  (facoltativo)

L'elenco delle funzioni predefinite escluse dalla chiamata del modello.

McpServer

Un MCPServer è un server che può essere chiamato dal modello per eseguire azioni.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "mcp_server".

name string  (facoltativo)

Il nome di MCPServer.

url string  (facoltativo)

L'URL completo dell'endpoint MCPServer. Esempio: "https://api.example.com/mcp"

headers object  (facoltativo)

(Facoltativo) Campi per intestazioni di autenticazione, timeout e così via, se necessario.

allowed_tools AllowedTools  (facoltativo)

Gli strumenti consentiti.

La configurazione degli strumenti consentiti.

Campi

mode ToolChoiceType  (facoltativo)

La modalità di scelta dello strumento.

Valori possibili:

  • auto
  • any
  • none
  • validated

tools array (string)  (facoltativo)

I nomi degli strumenti consentiti.

GoogleSearch

Uno strumento che può essere utilizzato dal modello per eseguire ricerche su Google.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "google_search".

search_types array (enum (string))  (facoltativo)

I tipi di grounding della ricerca da attivare.

Valori possibili:

  • web_search
  • image_search
  • enterprise_web_search
FileSearch

Uno strumento che può essere utilizzato dal modello per cercare i file.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "file_search".

file_search_store_names array (string)  (facoltativo)

I nomi dei negozi in cui cercare i file.

top_k integer  (facoltativo)

Il numero di blocchi di recupero semantico da recuperare.

metadata_filter stringa  (facoltativo)

Filtro dei metadati da applicare ai documenti e ai chunk di recupero semantico.

GoogleMaps

Uno strumento che può essere utilizzato dal modello per chiamare Google Maps.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "google_maps".

enable_widget boolean  (facoltativo)

Indica se restituire un token di contesto del widget nel risultato della chiamata allo strumento della risposta.

latitude number  (facoltativo)

La latitudine della posizione dell'utente.

longitude number  (facoltativo)

La longitudine della posizione dell'utente.

Recupero

Uno strumento che può essere utilizzato dal modello per recuperare i file.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "retrieval".

retrieval_types array (enum (string))  (facoltativo)

I tipi di recupero dei file da attivare.

Valori possibili:

  • vertex_ai_search
vertex_ai_search_config VertexAISearchConfig  (facoltativo)

Utilizzato per specificare la configurazione per VertexAISearch.

Utilizzato per specificare la configurazione per VertexAISearch.

Campi

engine string  (facoltativo)

Facoltativo. Utilizzato per specificare Vertex AI Search.

datastores array (string)  (facoltativo)

Facoltativo. Utilizzato per specificare i datastore di Vertex AI Search.

Esempi

Funzione

CodeExecution

UrlContext

ComputerUse

McpServer

GoogleSearch

FileSearch

GoogleMaps

Recupero

Nessun esempio disponibile per questo tipo.

InteractionSseEvent

Tipi possibili

Discriminatore polimorfico: event_type

InteractionCreatedEvent

event_type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "interaction.created".

interaction Interaction  (obbligatorio)

Nessuna descrizione fornita.

event_id string  (facoltativo)

Il token event_id da utilizzare per riprendere lo stream di interazione da questo evento.

InteractionCompletedEvent

event_type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "interaction.completed".

interaction Interaction  (obbligatorio)

Obbligatorio. L'interazione completata con output vuoti per ridurre le dimensioni del payload. Utilizza gli eventi ContentDelta precedenti per l'output effettivo.

event_id string  (facoltativo)

Il token event_id da utilizzare per riprendere lo stream di interazione da questo evento.

InteractionStatusUpdate

event_type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "interaction.status_update".

interaction_id string  (obbligatorio)

Nessuna descrizione fornita.

status enum (string)  (required)

Nessuna descrizione fornita.

Valori possibili:

  • in_progress
  • requires_action
  • completed
  • failed
  • cancelled
  • incomplete
event_id string  (facoltativo)

Il token event_id da utilizzare per riprendere lo stream di interazione da questo evento.

ErrorEvent

event_type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "error".

error Error  (facoltativo)

Nessuna descrizione fornita.

Messaggio di errore di un'interazione.

Campi

code string  (facoltativo)

Un URI che identifica il tipo di errore.

message string  (facoltativo)

Un messaggio di errore leggibile.

event_id string  (facoltativo)

Il token event_id da utilizzare per riprendere lo stream di interazione da questo evento.

StepStart

event_type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "step.start".

index integer  (obbligatorio)

Nessuna descrizione fornita.

passaggio Passaggio  (obbligatorio)

Nessuna descrizione fornita.

Un passaggio dell'interazione.

Tipi possibili

Discriminatore polimorfico: type

UserInputStep

Input fornito dall'utente.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "user_input".

content array (Content)  (facoltativo)

Nessuna descrizione fornita.

ModelOutputStep

Output generato dal modello.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "model_output".

content array (Content)  (facoltativo)

Nessuna descrizione fornita.

ThoughtStep

Un passaggio di pensiero.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "thought".

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

summary ThoughtSummaryContent  (facoltativo)

Un riepilogo del pensiero.

Tipi possibili

Discriminatore polimorfico: type

TextContent

Un blocco di contenuti testuali.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "text".

text string  (obbligatorio)

Obbligatorio. Il contenuto testuale.

annotazioni Annotazione  (facoltativo)

Informazioni sulle citazioni per i contenuti generati dal modello.

Informazioni sulle citazioni per i contenuti generati dal modello.

Tipi possibili

Discriminatore polimorfico: type

UrlCitation

Un'annotazione di citazione di URL.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "url_citation".

url string  (facoltativo)

L'URL.

title string  (facoltativo)

Il titolo dell'URL.

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

FileCitation

Un'annotazione di citazione di un file.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "file_citation".

document_uri string  (facoltativo)

L'URI del file.

file_name stringa  (facoltativo)

Il nome del file.

source string  (facoltativo)

Fonte attribuita a una parte del testo.

custom_metadata object  (facoltativo)

Metadati forniti dall'utente sul contesto recuperato.

page_number integer  (facoltativo)

Numero di pagina del documento citato, se applicabile.

media_id string  (facoltativo)

ID elemento multimediale in caso di citazioni di immagini, se applicabile.

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

PlaceCitation

Un'annotazione di citazione di un luogo.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "place_citation".

place_id stringa  (facoltativo)

L'ID del luogo, nel formato `places/{place_id}`.

name string  (facoltativo)

Titolo del luogo.

url string  (facoltativo)

Riferimento URI del luogo.

review_snippets ReviewSnippet  (facoltativo)

Snippet di recensioni utilizzati per generare risposte sulle caratteristiche di un determinato luogo in Google Maps.

Contiene un estratto di una recensione utente che risponde a una domanda sulle caratteristiche di un luogo specifico in Google Maps.

Campi

title string  (facoltativo)

Titolo della recensione.

url string  (facoltativo)

Un link che corrisponde alla recensione dell'utente su Google Maps.

review_id stringa  (facoltativo)

L'ID dello snippet recensione.

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

ImageContent

Un blocco di contenuti immagine.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "image".

data string  (facoltativo)

Il contenuto dell'immagine.

uri string  (facoltativo)

L'URI dell'immagine.

mime_type enum (string)  (facoltativo)

Il tipo MIME dell'immagine.

Valori possibili:

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
  • image/gif
  • image/bmp
  • image/tiff
risoluzione MediaResolution  (facoltativo)

La risoluzione dei contenuti multimediali.

Valori possibili:

  • low
  • medium
  • high
  • ultra_high

FunctionCallStep

Un passaggio di chiamata allo strumento di funzione.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "function_call".

name string  (obbligatorio)

Obbligatorio. Il nome dello strumento da chiamare.

arguments object  (obbligatorio)

Obbligatorio. Gli argomenti da passare alla funzione.

id stringa  (obbligatorio)

Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

CodeExecutionCallStep

Passaggio di chiamata dell'esecuzione del codice.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "code_execution_call".

arguments CodeExecutionCallStepArguments  (obbligatorio)

Obbligatorio. Gli argomenti da passare all'esecuzione del codice.

Gli argomenti da passare all'esecuzione del codice.

Campi

language enum (string)  (facoltativo)

Linguaggio di programmazione di `code`.

Valori possibili:

  • python
code string  (facoltativo)

Il codice da eseguire.

id stringa  (obbligatorio)

Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

UrlContextCallStep

Passaggio di chiamata del contesto dell'URL.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "url_context_call".

arguments UrlContextCallStepArguments  (obbligatorio)

Obbligatorio. Gli argomenti da passare al contesto dell'URL.

Gli argomenti da passare al contesto dell'URL.

Campi

urls array (string)  (facoltativo)

Gli URL da recuperare.

id stringa  (obbligatorio)

Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

McpServerToolCallStep

Passaggio di chiamata allo strumento MCPServer.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "mcp_server_tool_call".

name string  (obbligatorio)

Obbligatorio. Il nome dello strumento chiamato.

server_name string  (obbligatorio)

Obbligatorio. Il nome del server MCP utilizzato.

arguments object  (obbligatorio)

Obbligatorio. L'oggetto JSON degli argomenti della funzione.

id stringa  (obbligatorio)

Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

GoogleSearchCallStep

Passaggio della chiamata Ricerca Google.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "google_search_call".

arguments GoogleSearchCallStepArguments  (obbligatorio)

Obbligatorio. Gli argomenti da passare alla Ricerca Google.

Gli argomenti da passare alla Ricerca Google.

Campi

queries array (string)  (facoltativo)

Query di ricerca web per la ricerca web successiva.

search_type enum (string)  (facoltativo)

Il tipo di grounding della ricerca abilitato.

Valori possibili:

  • web_search
  • image_search
  • enterprise_web_search
id stringa  (obbligatorio)

Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

FileSearchCallStep

Passaggio di chiamata di ricerca di file.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "file_search_call".

id stringa  (obbligatorio)

Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

GoogleMapsCallStep

Passaggio di chiamata di Google Maps.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "google_maps_call".

arguments GoogleMapsCallStepArguments  (facoltativo)

Gli argomenti da passare allo strumento Google Maps.

Gli argomenti da passare allo strumento Google Maps.

Campi

queries array (string)  (facoltativo)

Le query da eseguire.

id stringa  (obbligatorio)

Obbligatorio. Un ID univoco per questa chiamata specifica dello strumento.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

FunctionResultStep

Risultato di una chiamata allo strumento di funzione.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "function_result".

name string  (facoltativo)

Il nome dello strumento chiamato.

is_error boolean  (facoltativo)

Indica se la chiamata allo strumento ha generato un errore.

call_id string  (obbligatorio)

Obbligatorio. ID da corrispondere all'ID del blocco di chiamata di funzione.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

result array (FunctionResultSubcontent) or string  (obbligatorio)

Il risultato della chiamata allo strumento.

CodeExecutionResultStep

Passaggio del risultato dell'esecuzione del codice.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "code_execution_result".

result string  (obbligatorio)

Obbligatorio. L'output dell'esecuzione del codice.

is_error boolean  (facoltativo)

Indica se l'esecuzione del codice ha generato un errore.

call_id string  (obbligatorio)

Obbligatorio. ID da corrispondere all'ID del blocco di chiamata di funzione.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

UrlContextResultStep

Passaggio del risultato del contesto URL.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "url_context_result".

result UrlContextResultItem  (obbligatorio)

Obbligatorio. I risultati del contesto dell'URL.

Il risultato del contesto dell'URL.

Campi

url string  (facoltativo)

L'URL recuperato.

status enum (string)  (facoltativo)

Lo stato del recupero dell'URL.

Valori possibili:

  • success
  • error
  • paywall
  • unsafe
is_error boolean  (facoltativo)

Indica se il contesto dell'URL ha generato un errore.

call_id string  (obbligatorio)

Obbligatorio. ID da corrispondere all'ID del blocco di chiamata di funzione.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

GoogleSearchResultStep

Passaggio del risultato di ricerca di Google.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "google_search_result".

result GoogleSearchResultItem  (obbligatorio)

Obbligatorio. I risultati della Ricerca Google.

Il risultato della Ricerca Google.

Campi

search_suggestions stringa  (facoltativo)

Snippet di contenuti web che può essere incorporato in una pagina web o in una webview di un'app.

is_error boolean  (facoltativo)

Indica se la Ricerca Google ha generato un errore.

call_id string  (obbligatorio)

Obbligatorio. ID da corrispondere all'ID del blocco di chiamata di funzione.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

McpServerToolResultStep

Passaggio del risultato dello strumento MCPServer.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "mcp_server_tool_result".

name string  (facoltativo)

Nome dello strumento chiamato per questa chiamata specifica.

server_name string  (facoltativo)

Il nome del server MCP utilizzato.

call_id string  (obbligatorio)

Obbligatorio. ID da corrispondere all'ID del blocco di chiamata di funzione.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

result array (FunctionResultSubcontent) or string  (obbligatorio)

L'output della chiamata al server MCP. Può essere un semplice testo o contenuti avanzati.

FileSearchResultStep

Passaggio del risultato della ricerca di file.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "file_search_result".

call_id string  (obbligatorio)

Obbligatorio. ID da corrispondere all'ID del blocco di chiamata di funzione.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

GoogleMapsResultStep

Passaggio dei risultati di Google Maps.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "google_maps_result".

result GoogleMapsResultItem  (obbligatorio)

Nessuna descrizione fornita.

Il risultato di Google Maps.

Campi

places GoogleMapsResultPlaces  (facoltativo)

Nessuna descrizione fornita.

Campi

place_id stringa  (facoltativo)

Nessuna descrizione fornita.

name string  (facoltativo)

Nessuna descrizione fornita.

url string  (facoltativo)

Nessuna descrizione fornita.

review_snippets ReviewSnippet  (facoltativo)

Nessuna descrizione fornita.

Contiene un estratto di una recensione utente che risponde a una domanda sulle caratteristiche di un luogo specifico in Google Maps.

Campi

title string  (facoltativo)

Titolo della recensione.

url string  (facoltativo)

Un link che corrisponde alla recensione dell'utente su Google Maps.

review_id stringa  (facoltativo)

L'ID dello snippet recensione.

widget_context_token string  (facoltativo)

Nessuna descrizione fornita.

call_id string  (obbligatorio)

Obbligatorio. ID da corrispondere all'ID del blocco di chiamata di funzione.

signature string  (facoltativo)

Un hash della firma per la convalida del backend.

event_id string  (facoltativo)

Il token event_id da utilizzare per riprendere lo stream di interazione da questo evento.

StepDelta

event_type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "step.delta".

index integer  (obbligatorio)

Nessuna descrizione fornita.

delta StepDeltaData  (obbligatorio)

Nessuna descrizione fornita.

Tipi possibili

Discriminatore polimorfico: type

TextDelta

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "text".

text string  (obbligatorio)

Nessuna descrizione fornita.

ImageDelta

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "image".

data string  (facoltativo)

Nessuna descrizione fornita.

uri string  (facoltativo)

Nessuna descrizione fornita.

mime_type enum (string)  (facoltativo)

Nessuna descrizione fornita.

Valori possibili:

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
  • image/gif
  • image/bmp
  • image/tiff
risoluzione MediaResolution  (facoltativo)

La risoluzione dei contenuti multimediali.

Valori possibili:

  • low
  • medium
  • high
  • ultra_high

AudioDelta

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "audio".

data string  (facoltativo)

Nessuna descrizione fornita.

uri string  (facoltativo)

Nessuna descrizione fornita.

mime_type enum (string)  (facoltativo)

Nessuna descrizione fornita.

Valori possibili:

  • audio/wav
  • audio/mp3
  • audio/aiff
  • audio/aac
  • audio/ogg
  • audio/flac
  • audio/mpeg
  • audio/m4a
  • audio/l16
  • audio/opus
  • audio/alaw
  • audio/mulaw
rate integer  (facoltativo)

Deprecato. Utilizza sample_rate. Il valore viene ignorato.

sample_rate integer  (facoltativo)

La frequenza di campionamento dell'audio.

channels integer  (facoltativo)

Il numero di canali audio.

DocumentDelta

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "document".

data string  (facoltativo)

Nessuna descrizione fornita.

uri string  (facoltativo)

Nessuna descrizione fornita.

mime_type enum (string)  (facoltativo)

Nessuna descrizione fornita.

Valori possibili:

  • application/pdf
VideoDelta

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "video".

data string  (facoltativo)

Nessuna descrizione fornita.

uri string  (facoltativo)

Nessuna descrizione fornita.

mime_type enum (string)  (facoltativo)

Nessuna descrizione fornita.

Valori possibili:

  • video/mp4
  • video/mpeg
  • video/mpg
  • video/mov
  • video/avi
  • video/x-flv
  • video/webm
  • video/wmv
  • video/3gpp
risoluzione MediaResolution  (facoltativo)

La risoluzione dei contenuti multimediali.

Valori possibili:

  • low
  • medium
  • high
  • ultra_high

ThoughtSummaryDelta

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "thought_summary".

content ThoughtSummaryContent  (facoltativo)

Un nuovo elemento di riepilogo da aggiungere al pensiero.

Tipi possibili

Discriminatore polimorfico: type

TextContent

Un blocco di contenuti testuali.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "text".

text string  (obbligatorio)

Obbligatorio. Il contenuto testuale.

annotazioni Annotazione  (facoltativo)

Informazioni sulle citazioni per i contenuti generati dal modello.

Informazioni sulle citazioni per i contenuti generati dal modello.

Tipi possibili

Discriminatore polimorfico: type

UrlCitation

Un'annotazione di citazione di URL.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "url_citation".

url string  (facoltativo)

L'URL.

title string  (facoltativo)

Il titolo dell'URL.

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

FileCitation

Un'annotazione di citazione di un file.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "file_citation".

document_uri string  (facoltativo)

L'URI del file.

file_name stringa  (facoltativo)

Il nome del file.

source string  (facoltativo)

Fonte attribuita a una parte del testo.

custom_metadata object  (facoltativo)

Metadati forniti dall'utente sul contesto recuperato.

page_number integer  (facoltativo)

Numero di pagina del documento citato, se applicabile.

media_id string  (facoltativo)

ID elemento multimediale in caso di citazioni di immagini, se applicabile.

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

PlaceCitation

Un'annotazione di citazione di un luogo.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "place_citation".

place_id stringa  (facoltativo)

L'ID del luogo, nel formato `places/{place_id}`.

name string  (facoltativo)

Titolo del luogo.

url string  (facoltativo)

Riferimento URI del luogo.

review_snippets ReviewSnippet  (facoltativo)

Snippet di recensioni utilizzati per generare risposte sulle caratteristiche di un determinato luogo in Google Maps.

Contiene un estratto di una recensione utente che risponde a una domanda sulle caratteristiche di un luogo specifico in Google Maps.

Campi

title string  (facoltativo)

Titolo della recensione.

url string  (facoltativo)

Un link che corrisponde alla recensione dell'utente su Google Maps.

review_id stringa  (facoltativo)

L'ID dello snippet recensione.

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

ImageContent

Un blocco di contenuti immagine.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "image".

data string  (facoltativo)

Il contenuto dell'immagine.

uri string  (facoltativo)

L'URI dell'immagine.

mime_type enum (string)  (facoltativo)

Il tipo MIME dell'immagine.

Valori possibili:

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
  • image/gif
  • image/bmp
  • image/tiff
risoluzione MediaResolution  (facoltativo)

La risoluzione dei contenuti multimediali.

Valori possibili:

  • low
  • medium
  • high
  • ultra_high

ThoughtSignatureDelta

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "thought_signature".

signature string  (facoltativo)

Firma per abbinare l'origine di backend da includere nella generazione.

TextAnnotationDelta

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "text_annotation_delta".

annotazioni Annotazione  (facoltativo)

Informazioni sulle citazioni per i contenuti generati dal modello.

Informazioni sulle citazioni per i contenuti generati dal modello.

Tipi possibili

Discriminatore polimorfico: type

UrlCitation

Un'annotazione di citazione di URL.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "url_citation".

url string  (facoltativo)

L'URL.

title string  (facoltativo)

Il titolo dell'URL.

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

FileCitation

Un'annotazione di citazione di un file.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "file_citation".

document_uri string  (facoltativo)

L'URI del file.

file_name stringa  (facoltativo)

Il nome del file.

source string  (facoltativo)

Fonte attribuita a una parte del testo.

custom_metadata object  (facoltativo)

Metadati forniti dall'utente sul contesto recuperato.

page_number integer  (facoltativo)

Numero di pagina del documento citato, se applicabile.

media_id string  (facoltativo)

ID elemento multimediale in caso di citazioni di immagini, se applicabile.

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

PlaceCitation

Un'annotazione di citazione di un luogo.

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "place_citation".

place_id stringa  (facoltativo)

L'ID del luogo, nel formato `places/{place_id}`.

name string  (facoltativo)

Titolo del luogo.

url string  (facoltativo)

Riferimento URI del luogo.

review_snippets ReviewSnippet  (facoltativo)

Snippet di recensioni utilizzati per generare risposte sulle caratteristiche di un determinato luogo in Google Maps.

Contiene un estratto di una recensione utente che risponde a una domanda sulle caratteristiche di un luogo specifico in Google Maps.

Campi

title string  (facoltativo)

Titolo della recensione.

url string  (facoltativo)

Un link che corrisponde alla recensione dell'utente su Google Maps.

review_id stringa  (facoltativo)

L'ID dello snippet recensione.

start_index integer  (facoltativo)

Inizio del segmento della risposta attribuito a questa fonte. L'indice indica l'inizio del segmento, misurato in byte.

end_index integer  (facoltativo)

Fine del segmento attribuito, esclusa.

ArgumentsDelta

type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "arguments_delta".

partial_arguments stringa  (facoltativo)

Nessuna descrizione fornita.

event_id string  (facoltativo)

Il token event_id da utilizzare per riprendere lo stream di interazione da questo evento.

StepStop

event_type object  (obbligatorio)

Nessuna descrizione fornita.

Sempre impostato su "step.stop".

index integer  (obbligatorio)

Nessuna descrizione fornita.

event_id string  (facoltativo)

Il token event_id da utilizzare per riprendere lo stream di interazione da questo evento.

Esempi

Interazione creata

{
  "event_type": "interaction.created",
  "interaction": {
    "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg",
    "model": "gemini-3-flash-preview",
    "status": "in_progress",
    "created": "2025-12-04T15:01:45Z",
    "updated": "2025-12-04T15:01:45Z"
  },
  "event_id": "evt_123"
}

Interazione completata

{
  "event_type": "interaction.completed",
  "interaction": {
    "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg",
    "model": "gemini-3-flash-preview",
    "status": "completed",
    "created": "2025-12-04T15:01:45Z",
    "updated": "2025-12-04T15:01:45Z"
  },
  "event_id": "evt_123"
}

Aggiornamento dello stato dell'interazione

{
  "event_type": "interaction.status_update",
  "interaction_id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM",
  "status": "in_progress"
}

Evento di errore

{
  "event_type": "error",
  "error": {
    "message": "Failed to get completed interaction: Result not found.",
    "code": "not_found"
  }
}

Avvio del passo

{
  "event_type": "step.start",
  "index": 0,
  "step": {
    "type": "model_output"
  }
}

Delta passi

{
  "event_type": "step.delta",
  "index": 0,
  "delta": {
    "type": "text",
    "text": "Hello"
  }
}

Step Stop

{
  "event_type": "step.stop",
  "index": 0
}