A API Gemini Interactions é uma API experimental que permite aos desenvolvedores criar aplicativos de IA generativa usando modelos do Gemini. O Gemini é nosso modelo mais avançado, criado desde o início para ser multimodal. Ele pode generalizar, entender, operar e combinar diferentes tipos de informações, incluindo idiomas, imagens, áudio, vídeo e código. Você pode usar a API Gemini para casos de uso como raciocínio em textos e imagens, geração de conteúdo, agentes de diálogo, sistemas de resumo e classificação e muito mais.
Criar uma interação
Cria uma nova interação.
Corpo da solicitação
O corpo da solicitação contém dados com a seguinte estrutura:
model ModelOption (opcional)
O nome do "Model" usado para gerar a interação.
Obrigatório se "agent" não for fornecido.
Valores possíveis:
-
gemini-2.5-computer-use-preview-10-2025Um modelo de capacidade de agente projetado para interação direta com a interface, permitindo que o Gemini perceba e navegue em ambientes digitais.
-
gemini-2.5-flashNosso primeiro modelo de raciocínio híbrido, que oferece suporte a uma janela de contexto de 1 milhão de tokens e tem limites de raciocínio.
-
gemini-2.5-flash-imageNosso modelo nativo de geração de imagens, otimizado para velocidade, flexibilidade e compreensão contextual. A entrada e a saída de texto têm o mesmo preço do 2.5 Flash.
-
gemini-2.5-flash-liteNosso modelo menor e mais econômico, criado para uso em grande escala.
-
gemini-2.5-flash-lite-preview-09-2025O modelo mais recente baseado no Gemini 2.5 Flash lite otimizado para custo-benefício, alta capacidade de processamento e alta qualidade.
-
gemini-2.5-flash-native-audio-preview-12-2025Nossos modelos de áudio nativos são otimizados para saídas de áudio de maior qualidade, com melhor ritmo, naturalidade da voz, nível de detalhes e humor.
-
gemini-2.5-flash-preview-09-2025O modelo mais recente baseado no modelo 2.5 Flash. O pré-lançamento do 2.5 Flash é ideal para processamento em grande escala, baixa latência, tarefas de alto volume que exigem raciocínio e casos de uso de agentes.
-
gemini-2.5-flash-preview-ttsNosso modelo de conversão de texto em voz 2.5 Flash otimizado para geração de fala controlável, potente e de baixa latência.
-
gemini-2.5-proNosso modelo multifuncional de última geração, que se destaca em programação e tarefas de raciocínio complexas.
-
gemini-2.5-pro-preview-ttsNosso modelo de áudio Text-to-Speech 2.5 Pro é otimizado para geração de fala poderosa e de baixa latência, com saídas mais naturais e comandos mais fáceis de direcionar.
-
gemini-3-flash-previewNosso modelo mais inteligente, criado para ser rápido, combinando inteligência de ponta com pesquisa e embasamento superiores.
-
gemini-3-pro-image-previewModelo de edição e geração de imagens de última geração.
-
gemini-3-pro-previewNosso modelo mais inteligente com raciocínio e compreensão multimodal de última geração, além de recursos avançados de programação assistida por IA e vibe coding.
-
gemini-3.1-pro-previewNosso mais recente modelo de raciocínio SOTA com profundidade e nuances sem precedentes, além de recursos avançados de compreensão multimodal e programação.
-
gemini-3.1-flash-image-previewInteligência visual de nível profissional com eficiência de velocidade do Flash e recursos de geração baseados na realidade.
-
gemini-3.1-flash-lite-previewNosso modelo mais econômico, otimizado para tarefas agentivas de alto volume, tradução e processamento de dados simples.
-
gemini-3.1-flash-tts-previewGemini 3.1 Flash TTS: geração de fala eficiente e de baixa latência. Aproveite saídas naturais, comandos direcionáveis e novas tags de áudio expressivas para um controle preciso da narração.
-
lyria-3-clip-previewNosso modelo de geração de música de baixa latência otimizado para clipes de áudio de alta fidelidade e controle rítmico preciso.
-
lyria-3-pro-previewNosso modelo generativo avançado de músicas completas com compreensão composicional profunda, otimizado para controle estrutural preciso e transições complexas em diversos estilos musicais.
agent AgentOption (opcional)
O nome do "Agente" usado para gerar a interação.
Obrigatório se "model" não for fornecido.
Valores possíveis:
-
deep-research-pro-preview-12-2025Agente Deep Research do Gemini
-
deep-research-preview-04-2026Agente Deep Research do Gemini
-
deep-research-max-preview-04-2026Agente Deep Research Max do Gemini
As entradas para a interação (comum ao modelo e ao agente).
Instrução do sistema para a interação.
Uma lista de declarações de ferramentas que o modelo pode chamar durante a interação.
Garante que a resposta gerada seja um objeto JSON em conformidade com o esquema JSON especificado neste campo.
O tipo MIME da resposta. Obrigatório se "response_format" estiver definido.
Somente entrada. Se a interação será transmitida por streaming.
Somente entrada. Se a resposta e a solicitação serão armazenadas para recuperação posterior.
Somente entrada. Se a interação do modelo será executada em segundo plano.
generation_config GenerationConfig (opcional)
Configuração do modelo
: parâmetros de configuração para a interação do modelo.
Alternativa a "agent_config". Só é aplicável quando "model" está definido.
Campos
Controla a aleatoriedade da saída.
A probabilidade cumulativa máxima de tokens a serem considerados na amostragem.
Seed usada na decodificação para reprodutibilidade.
Uma lista de sequências de caracteres que vão interromper a interação de saída.
thinking_level ThinkingLevel (opcional)
O nível de tokens de pensamento que o modelo deve gerar.
Valores possíveis:
-
minimal -
low -
medium -
high
thinking_summaries ThinkingSummaries (opcional)
Define se os resumos de pensamento serão incluídos na resposta.
Valores possíveis:
-
auto -
none
O número máximo de tokens a serem incluídos na resposta.
speech_config SpeechConfig (opcional)
Configuração para interação de fala.
Campos
A voz do alto-falante.
O idioma da fala.
O nome do falante precisa corresponder ao nome informado no comando.
image_config ImageConfig (opcional)
Configuração para interação com imagens.
Campos
Nenhuma descrição informada.
Valores possíveis:
-
1:1 -
2:3 -
3:2 -
3:4 -
4:3 -
4:5 -
5:4 -
9:16 -
16:9 -
21:9 -
1:8 -
8:1 -
1:4 -
4:1
Nenhuma descrição informada.
Valores possíveis:
-
1K -
2K -
4K -
512
A configuração de escolha da ferramenta.
agent_config object (opcional)
Configuração do agente
Configuração do agente.
Alternativa a "generation_config". Só é aplicável quando "agent" está definido.
Tipos possíveis
Discriminador polimórfico: type
DynamicAgentConfig
Configuração para agentes dinâmicos.
Nenhuma descrição informada.
Sempre defina como "dynamic".
DeepResearchAgentConfig
Configuração do agente Deep Research.
Nenhuma descrição informada.
Sempre defina como "deep-research".
thinking_summaries ThinkingSummaries (opcional)
Define se os resumos de pensamento serão incluídos na resposta.
Valores possíveis:
-
auto -
none
Define se as visualizações serão incluídas na resposta.
Valores possíveis:
-
off -
auto
Ativa o planejamento human-in-the-loop para o agente Deep Research. Se definido como "true", o agente Deep Research vai fornecer um plano de pesquisa na resposta. O agente só vai continuar se o usuário confirmar o plano na próxima interação.
O ID da interação anterior, se houver.
response_modalities ResponseModality (opcional)
As modalidades solicitadas da resposta (TEXT, IMAGE, AUDIO).
Valores possíveis:
-
text -
image -
audio -
video -
document
service_tier ServiceTier (opcional)
O nível de serviço da interação.
Valores possíveis:
-
flex -
standard -
priority
webhook_config WebhookConfig (opcional)
Opcional. Configuração de webhook para receber notificações quando a interação for concluída.
Campos
Opcional. Se definido, esses URIs de webhook serão usados para eventos de webhook em vez dos webhooks registrados.
Opcional. Os metadados do usuário que serão retornados em cada emissão de evento para os webhooks.
Resposta
Retorna um recurso Interaction.
Solicitação simples
Exemplo de resposta
{ "created": "2025-11-26T12:25:15Z", "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "object": "interaction", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "Hello! I'm functioning perfectly and ready to assist you.\n\nHow are you doing today?" } ] } ], "status": "completed", "updated": "2025-11-26T12:25:15Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 7 } ], "total_cached_tokens": 0, "total_input_tokens": 7, "total_output_tokens": 20, "total_thought_tokens": 22, "total_tokens": 49, "total_tool_use_tokens": 0 } }
Várias interações
Exemplo de resposta
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "The capital of France is Paris." } ] } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 50 } ], "total_cached_tokens": 0, "total_input_tokens": 50, "total_output_tokens": 10, "total_thought_tokens": 0, "total_tokens": 60, "total_tool_use_tokens": 0 } }
Entrada de imagem
Exemplo de resposta
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "A white humanoid robot with glowing blue eyes stands holding a red skateboard." } ] } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 10 }, { "modality": "image", "tokens": 258 } ], "total_cached_tokens": 0, "total_input_tokens": 268, "total_output_tokens": 20, "total_thought_tokens": 0, "total_tokens": 288, "total_tool_use_tokens": 0 } }
Chamadas de função
Exemplo de resposta
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "requires_action", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "steps": [ { "type": "function_call", "id": "gth23981", "name": "get_weather", "arguments": { "location": "Boston, MA" } } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 100 } ], "total_cached_tokens": 0, "total_input_tokens": 100, "total_output_tokens": 25, "total_thought_tokens": 0, "total_tokens": 125, "total_tool_use_tokens": 50 } }
Deep Research
Exemplo de resposta
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "agent": "deep-research-pro-preview-12-2025", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "Here is a comprehensive research report on the current state of cancer research..." } ] } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 20 } ], "total_cached_tokens": 0, "total_input_tokens": 20, "total_output_tokens": 1000, "total_thought_tokens": 500, "total_tokens": 1520, "total_tool_use_tokens": 0 } }
Como recuperar uma interação
Recupera todos os detalhes de uma única interação com base no `Interaction.id`.
Parâmetros de caminho / consulta
O identificador exclusivo da interação a ser recuperada.
Se definido como verdadeiro, o conteúdo gerado será transmitido de forma incremental.
Padrão: False
Opcional. Se definido, retoma o fluxo de interação do próximo bloco após o evento marcado pelo ID do evento. Só pode ser usado se "stream" for verdadeiro.
Se definido como "true", inclui a entrada na resposta.
Padrão: False
Qual versão da API usar.
Resposta
Retorna um recurso Interaction.
Acessar interação
Exemplo de resposta
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:25:15Z", "updated": "2025-11-26T12:25:15Z", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "I'm doing great, thank you for asking! How can I help you today?" } ] } ] }
Excluir uma interação
Exclui a interação por ID.
Parâmetros de caminho / consulta
O identificador exclusivo da interação a ser excluída.
Qual versão da API usar.
Resposta
Se a solicitação for concluída, a resposta estará vazia.
Excluir interação
Como cancelar uma interação
Cancela uma interação por ID. Isso só se aplica a interações em segundo plano que ainda estão em execução.
Parâmetros de caminho / consulta
O identificador exclusivo da interação a ser cancelada.
Qual versão da API usar.
Resposta
Retorna um recurso Interaction.
Cancelar interação
Exemplo de resposta
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "agent": "deep-research-pro-preview-12-2025", "status": "cancelled", "object": "interaction", "created": "2025-11-26T12:25:15Z", "updated": "2025-11-26T12:25:15Z" }
Recursos
Interação
O recurso "Interaction".
Campos
model ModelOption (opcional)
O nome do "Model" usado para gerar a interação.
Valores possíveis:
-
gemini-2.5-computer-use-preview-10-2025Um modelo de capacidade de agente projetado para interação direta com a interface, permitindo que o Gemini perceba e navegue em ambientes digitais.
-
gemini-2.5-flashNosso primeiro modelo de raciocínio híbrido, que oferece suporte a uma janela de contexto de 1 milhão de tokens e tem limites de raciocínio.
-
gemini-2.5-flash-imageNosso modelo nativo de geração de imagens, otimizado para velocidade, flexibilidade e compreensão contextual. A entrada e a saída de texto têm o mesmo preço do 2.5 Flash.
-
gemini-2.5-flash-liteNosso modelo menor e mais econômico, criado para uso em grande escala.
-
gemini-2.5-flash-lite-preview-09-2025O modelo mais recente baseado no Gemini 2.5 Flash lite otimizado para custo-benefício, alta capacidade de processamento e alta qualidade.
-
gemini-2.5-flash-native-audio-preview-12-2025Nossos modelos de áudio nativos são otimizados para saídas de áudio de maior qualidade, com melhor ritmo, naturalidade da voz, nível de detalhes e humor.
-
gemini-2.5-flash-preview-09-2025O modelo mais recente baseado no modelo 2.5 Flash. O pré-lançamento do 2.5 Flash é ideal para processamento em grande escala, baixa latência, tarefas de alto volume que exigem raciocínio e casos de uso de agentes.
-
gemini-2.5-flash-preview-ttsNosso modelo de conversão de texto em voz 2.5 Flash otimizado para geração de fala controlável, potente e de baixa latência.
-
gemini-2.5-proNosso modelo multifuncional de última geração, que se destaca em programação e tarefas de raciocínio complexas.
-
gemini-2.5-pro-preview-ttsNosso modelo de áudio Text-to-Speech 2.5 Pro é otimizado para geração de fala poderosa e de baixa latência, com saídas mais naturais e comandos mais fáceis de direcionar.
-
gemini-3-flash-previewNosso modelo mais inteligente, criado para ser rápido, combinando inteligência de ponta com pesquisa e embasamento superiores.
-
gemini-3-pro-image-previewModelo de edição e geração de imagens de última geração.
-
gemini-3-pro-previewNosso modelo mais inteligente com raciocínio e compreensão multimodal de última geração, além de recursos avançados de programação assistida por IA e vibe coding.
-
gemini-3.1-pro-previewNosso mais recente modelo de raciocínio SOTA com profundidade e nuances sem precedentes, além de recursos avançados de compreensão multimodal e programação.
-
gemini-3.1-flash-image-previewInteligência visual de nível profissional com eficiência de velocidade do Flash e recursos de geração baseados na realidade.
-
gemini-3.1-flash-lite-previewNosso modelo mais econômico, otimizado para tarefas agentivas de alto volume, tradução e processamento de dados simples.
-
gemini-3.1-flash-tts-previewGemini 3.1 Flash TTS: geração de fala eficiente e de baixa latência. Aproveite saídas naturais, comandos direcionáveis e novas tags de áudio expressivas para um controle preciso da narração.
-
lyria-3-clip-previewNosso modelo de geração de música de baixa latência otimizado para clipes de áudio de alta fidelidade e controle rítmico preciso.
-
lyria-3-pro-previewNosso modelo generativo avançado de músicas completas com compreensão composicional profunda, otimizado para controle estrutural preciso e transições complexas em diversos estilos musicais.
agent AgentOption (opcional)
O nome do "Agente" usado para gerar a interação.
Valores possíveis:
-
deep-research-pro-preview-12-2025Agente Deep Research do Gemini
-
deep-research-preview-04-2026Agente Deep Research do Gemini
-
deep-research-max-preview-04-2026Agente Deep Research Max do Gemini
Obrigatório. Apenas saída. Um identificador exclusivo para a conclusão da interação.
Obrigatório. Apenas saída. O status da interação.
Valores possíveis:
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
Obrigatório. Apenas saída. O horário em que a resposta foi criada no formato ISO 8601 (AAAA-MM-DDThh:mm:ssZ).
Obrigatório. Apenas saída. A hora em que a resposta foi atualizada pela última vez no formato ISO 8601 (AAAA-MM-DDThh:mm:ssZ).
Apenas saída. A função da interação.
Instrução do sistema para a interação.
Uma lista de declarações de ferramentas que o modelo pode chamar durante a interação.
usage Usage (opcional)
Apenas saída. Estatísticas sobre o uso de tokens da solicitação de interação.
Campos
Número de tokens no comando (contexto).
input_tokens_by_modality ModalityTokens (opcional)
Um detalhamento do uso de tokens de entrada por modalidade.
Campos
modalidade ResponseModality (opcional)
A modalidade associada à contagem de tokens.
Valores possíveis:
-
text -
image -
audio -
video -
document
Número de tokens para a modalidade.
Número de tokens na parte em cache do comando (o conteúdo em cache).
cached_tokens_by_modality ModalityTokens (opcional)
Um detalhamento do uso de tokens armazenados em cache por modalidade.
Campos
modalidade ResponseModality (opcional)
A modalidade associada à contagem de tokens.
Valores possíveis:
-
text -
image -
audio -
video -
document
Número de tokens para a modalidade.
Número total de tokens em todas as respostas geradas.
output_tokens_by_modality ModalityTokens (opcional)
Um detalhamento do uso de tokens de saída por modalidade.
Campos
modalidade ResponseModality (opcional)
A modalidade associada à contagem de tokens.
Valores possíveis:
-
text -
image -
audio -
video -
document
Número de tokens para a modalidade.
Número de tokens presentes nos comandos de uso da ferramenta.
tool_use_tokens_by_modality ModalityTokens (opcional)
Um detalhamento do uso de tokens de uso de ferramentas por modalidade.
Campos
modalidade ResponseModality (opcional)
A modalidade associada à contagem de tokens.
Valores possíveis:
-
text -
image -
audio -
video -
document
Número de tokens para a modalidade.
Número de tokens de ideias para modelos de pensamento.
Contagem total de tokens para a solicitação de interação (comando + respostas + outros tokens internos).
grounding_tool_count GroundingToolCount (opcional)
Contagem de ferramentas de embasamento.
Campos
O tipo de ferramenta de embasamento associado à contagem.
Valores possíveis:
-
google_search -
google_maps -
retrieval
O número de contagens de ferramentas de embasamento.
response_modalities ResponseModality (opcional)
As modalidades solicitadas da resposta (TEXT, IMAGE, AUDIO).
Valores possíveis:
-
text -
image -
audio -
video -
document
O tipo MIME da resposta. Obrigatório se "response_format" estiver definido.
O ID da interação anterior, se houver.
service_tier ServiceTier (opcional)
O nível de serviço da interação.
Valores possíveis:
-
flex -
standard -
priority
webhook_config WebhookConfig (opcional)
Opcional. Configuração de webhook para receber notificações quando a interação for concluída.
Campos
Opcional. Se definido, esses URIs de webhook serão usados para eventos de webhook em vez dos webhooks registrados.
Opcional. Os metadados do usuário que serão retornados em cada emissão de evento para os webhooks.
steps Step (opcional)
Apenas saída. As etapas que compõem a interação.
Tipos possíveis
Discriminador polimórfico: type
UserInputStep
Entrada fornecida pelo usuário.
Nenhuma descrição informada.
Sempre defina como "user_input".
Nenhuma descrição informada.
ModelOutputStep
Saída gerada pelo modelo.
Nenhuma descrição informada.
Sempre defina como "model_output".
Nenhuma descrição informada.
ThoughtStep
Uma etapa de pensamento.
Nenhuma descrição informada.
Sempre defina como "thought".
Um hash de assinatura para validação de back-end.
summary ThoughtSummaryContent (opcional)
Um resumo do pensamento.
Tipos possíveis
Discriminador polimórfico: type
TextContent
Um bloco de conteúdo de texto.
Nenhuma descrição informada.
Sempre defina como "text".
Obrigatório. O conteúdo do texto.
annotations Annotation (opcional)
Informações de citação para conteúdo gerado pelo modelo.
Tipos possíveis
Discriminador polimórfico: type
UrlCitation
Uma anotação de citação de URL.
Nenhuma descrição informada.
Sempre defina como "url_citation".
O URL.
O título do URL.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
FileCitation
Uma anotação de citação de arquivo.
Nenhuma descrição informada.
Sempre defina como "file_citation".
O URI do arquivo.
O nome do arquivo.
Origem atribuída a uma parte do texto.
Metadados fornecidos pelo usuário sobre o contexto recuperado.
Número da página do documento citado, se aplicável.
ID da mídia em caso de citações de imagens, se aplicável.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
PlaceCitation
Uma anotação de citação de lugar.
Nenhuma descrição informada.
Sempre defina como "place_citation".
O ID do lugar, no formato `places/{place_id}`.
Título do lugar.
Referência de URI do lugar.
review_snippets ReviewSnippet (opcional)
Trechos de avaliações usados para gerar respostas sobre os recursos de um determinado lugar no Google Maps.
Campos
Título da avaliação.
Um link que corresponde à avaliação do usuário no Google Maps.
O ID do snippet de avaliação.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
ImageContent
Um bloco de conteúdo de imagem.
Nenhuma descrição informada.
Sempre defina como "image".
O conteúdo da imagem.
O URI da imagem.
O tipo MIME da imagem.
Valores possíveis:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (opcional)
A resolução da mídia.
Valores possíveis:
-
low -
medium -
high -
ultra_high
FunctionCallStep
Uma etapa de chamada de ferramenta de função.
Nenhuma descrição informada.
Sempre defina como "function_call".
Obrigatório. O nome da ferramenta a ser chamada.
Obrigatório. Os argumentos a serem transmitidos para a função.
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
CodeExecutionCallStep
Etapa de chamada de execução de código.
Nenhuma descrição informada.
Sempre defina como "code_execution_call".
arguments CodeExecutionCallStepArguments (required)
Obrigatório. Os argumentos a serem transmitidos para a execução do código.
Campos
Linguagem de programação do "code".
Valores possíveis:
-
python
O código a ser executado.
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
UrlContextCallStep
Etapa de chamada de contexto de URL.
Nenhuma descrição informada.
Sempre defina como "url_context_call".
arguments UrlContextCallStepArguments (obrigatório)
Obrigatório. Os argumentos a serem transmitidos para o contexto do URL.
Campos
Os URLs a serem buscados.
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
McpServerToolCallStep
Etapa de chamada de ferramenta MCPServer.
Nenhuma descrição informada.
Sempre defina como "mcp_server_tool_call".
Obrigatório. O nome da ferramenta que foi chamada.
Obrigatório. O nome do servidor MCP usado.
Obrigatório. O objeto JSON de argumentos para a função.
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
GoogleSearchCallStep
Etapa de chamada da Pesquisa Google.
Nenhuma descrição informada.
Sempre defina como "google_search_call".
argumentos GoogleSearchCallStepArguments (obrigatório)
Obrigatório. Os argumentos a serem transmitidos para a Pesquisa Google.
Campos
Consultas de pesquisa na Web para a pesquisa na Web de acompanhamento.
O tipo de embasamento de pesquisa ativado.
Valores possíveis:
-
web_search -
image_search -
enterprise_web_search
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
FileSearchCallStep
Etapa de chamada da Pesquisa de arquivos.
Nenhuma descrição informada.
Sempre defina como "file_search_call".
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
GoogleMapsCallStep
Etapa de chamada do Google Maps.
Nenhuma descrição informada.
Sempre defina como "google_maps_call".
arguments GoogleMapsCallStepArguments (opcional)
Os argumentos a serem transmitidos para a ferramenta do Google Maps.
Campos
As consultas a serem executadas.
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
FunctionResultStep
Resultado de uma chamada de ferramenta de função.
Nenhuma descrição informada.
Sempre defina como "function_result".
O nome da ferramenta que foi chamada.
Se a chamada de ferramenta resultou em um erro.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
O resultado da chamada de função.
CodeExecutionResultStep
Etapa de resultado da execução do código.
Nenhuma descrição informada.
Sempre defina como "code_execution_result".
Obrigatório. A saída da execução do código.
Se a execução do código resultou em um erro.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
UrlContextResultStep
Etapa de resultado do contexto do URL.
Nenhuma descrição informada.
Sempre defina como "url_context_result".
result UrlContextResultItem (obrigatório)
Obrigatório. Os resultados do contexto do URL.
Campos
O URL buscado.
O status da recuperação do URL.
Valores possíveis:
-
success -
error -
paywall -
unsafe
Indica se o contexto do URL resultou em um erro.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
GoogleSearchResultStep
Etapa de resultado da pesquisa do Google.
Nenhuma descrição informada.
Sempre defina como "google_search_result".
result GoogleSearchResultItem (obrigatório)
Obrigatório. Os resultados da Pesquisa Google.
Campos
Snippet de conteúdo da Web que pode ser incorporado a uma página da Web ou a uma WebView de app.
Se a Pesquisa Google resultou em um erro.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
McpServerToolResultStep
Etapa de resultado da ferramenta MCPServer.
Nenhuma descrição informada.
Sempre defina como "mcp_server_tool_result".
Nome da ferramenta chamada para essa chamada de ferramenta específica.
O nome do servidor MCP usado.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
A saída da chamada do servidor MCP. Pode ser texto simples ou conteúdo avançado.
FileSearchResultStep
Etapa de resultado da pesquisa de arquivos.
Nenhuma descrição informada.
Sempre defina como "file_search_result".
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
GoogleMapsResultStep
Etapa de resultado do Google Maps.
Nenhuma descrição informada.
Sempre defina como "google_maps_result".
result GoogleMapsResultItem (obrigatório)
Nenhuma descrição informada.
Campos
places GoogleMapsResultPlaces (opcional)
Nenhuma descrição informada.
Campos
Nenhuma descrição informada.
Nenhuma descrição informada.
Nenhuma descrição informada.
review_snippets ReviewSnippet (opcional)
Nenhuma descrição informada.
Campos
Título da avaliação.
Um link que corresponde à avaliação do usuário no Google Maps.
O ID do snippet de avaliação.
Nenhuma descrição informada.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
Garante que a resposta gerada seja um objeto JSON em conformidade com o esquema JSON especificado neste campo.
agent_config object (opcional)
Parâmetros de configuração para a interação do agente.
Tipos possíveis
Discriminador polimórfico: type
DynamicAgentConfig
Configuração para agentes dinâmicos.
Nenhuma descrição informada.
Sempre defina como "dynamic".
DeepResearchAgentConfig
Configuração do agente Deep Research.
Nenhuma descrição informada.
Sempre defina como "deep-research".
thinking_summaries ThinkingSummaries (opcional)
Define se os resumos de pensamento serão incluídos na resposta.
Valores possíveis:
-
auto -
none
Define se as visualizações serão incluídas na resposta.
Valores possíveis:
-
off -
auto
Ativa o planejamento human-in-the-loop para o agente Deep Research. Se definido como "true", o agente Deep Research vai fornecer um plano de pesquisa na resposta. O agente só vai continuar se o usuário confirmar o plano na próxima interação.
Exemplos
Exemplo
{ "created": "2025-12-04T15:01:45Z", "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg", "model": "gemini-3-flash-preview", "object": "interaction", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "Hello! I'm doing well, functioning as expected. Thank you for asking! How are you doing today?" } ] } ], "status": "completed", "updated": "2025-12-04T15:01:45Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 7 } ], "total_cached_tokens": 0, "total_input_tokens": 7, "total_output_tokens": 23, "total_thought_tokens": 49, "total_tokens": 79, "total_tool_use_tokens": 0 } }
Modelos de dados
Conteúdo
O conteúdo da resposta.
Tipos possíveis
Discriminador polimórfico: type
TextContent
Um bloco de conteúdo de texto.
Nenhuma descrição informada.
Sempre defina como "text".
Obrigatório. O conteúdo do texto.
annotations Annotation (opcional)
Informações de citação para conteúdo gerado pelo modelo.
Tipos possíveis
Discriminador polimórfico: type
UrlCitation
Uma anotação de citação de URL.
Nenhuma descrição informada.
Sempre defina como "url_citation".
O URL.
O título do URL.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
FileCitation
Uma anotação de citação de arquivo.
Nenhuma descrição informada.
Sempre defina como "file_citation".
O URI do arquivo.
O nome do arquivo.
Origem atribuída a uma parte do texto.
Metadados fornecidos pelo usuário sobre o contexto recuperado.
Número da página do documento citado, se aplicável.
ID da mídia em caso de citações de imagens, se aplicável.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
PlaceCitation
Uma anotação de citação de lugar.
Nenhuma descrição informada.
Sempre defina como "place_citation".
O ID do lugar, no formato `places/{place_id}`.
Título do lugar.
Referência de URI do lugar.
review_snippets ReviewSnippet (opcional)
Trechos de avaliações usados para gerar respostas sobre os recursos de um determinado lugar no Google Maps.
Campos
Título da avaliação.
Um link que corresponde à avaliação do usuário no Google Maps.
O ID do snippet de avaliação.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
ImageContent
Um bloco de conteúdo de imagem.
Nenhuma descrição informada.
Sempre defina como "image".
O conteúdo da imagem.
O URI da imagem.
O tipo MIME da imagem.
Valores possíveis:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (opcional)
A resolução da mídia.
Valores possíveis:
-
low -
medium -
high -
ultra_high
AudioContent
Um bloco de conteúdo de áudio.
Nenhuma descrição informada.
Sempre defina como "audio".
O conteúdo de áudio.
O URI do áudio.
O tipo MIME do áudio.
Valores possíveis:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
O número de canais de áudio.
A taxa de amostragem do áudio.
DocumentContent
Um bloco de conteúdo de documento.
Nenhuma descrição informada.
Sempre defina como "document".
O conteúdo do documento.
O URI do documento.
O tipo MIME do documento.
Valores possíveis:
-
application/pdf
VideoContent
Um bloco de conteúdo em vídeo.
Nenhuma descrição informada.
Sempre defina como "video".
O conteúdo do vídeo.
O URI do vídeo.
O tipo MIME do vídeo.
Valores possíveis:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
resolution MediaResolution (opcional)
A resolução da mídia.
Valores possíveis:
-
low -
medium -
high -
ultra_high
Exemplos
Texto
{ "type": "text", "text": "Hello, how are you?" }
Imagem
{ "type": "image", "data": "BASE64_ENCODED_IMAGE", "mime_type": "image/png" }
Áudio
{ "type": "audio", "data": "BASE64_ENCODED_AUDIO", "mime_type": "audio/wav" }
Documento
{ "type": "document", "data": "BASE64_ENCODED_DOCUMENT", "mime_type": "application/pdf" }
Vídeo
{ "type": "video", "uri": "https://www.youtube.com/watch?v=9hE5-98ZeCg" }
Ferramenta
Uma ferramenta que pode ser usada pelo modelo.
Tipos possíveis
Discriminador polimórfico: type
Função
Uma ferramenta que pode ser usada pelo modelo.
Nenhuma descrição informada.
Sempre defina como "function".
O nome da função.
Uma descrição da função.
O esquema JSON para os parâmetros da função.
CodeExecution
Uma ferramenta que pode ser usada pelo modelo para executar código.
Nenhuma descrição informada.
Sempre defina como "code_execution".
UrlContext
Uma ferramenta que pode ser usada pelo modelo para buscar o contexto do URL.
Nenhuma descrição informada.
Sempre defina como "url_context".
ComputerUse
Uma ferramenta que pode ser usada pelo modelo para interagir com o computador.
Nenhuma descrição informada.
Sempre defina como "computer_use".
O ambiente em operação.
Valores possíveis:
-
browser
A lista de funções predefinidas que são excluídas da chamada de modelo.
McpServer
Um MCPServer é um servidor que pode ser chamado pelo modelo para realizar ações.
Nenhuma descrição informada.
Sempre defina como "mcp_server".
O nome do MCPServer.
O URL completo do endpoint MCPServer. Exemplo: "https://api.example.com/mcp"
Opcional: campos para cabeçalhos de autenticação, tempos limite etc., se necessário.
allowed_tools AllowedTools (opcional)
As ferramentas permitidas.
Campos
mode ToolChoiceType (opcional)
O modo da escolha de ferramenta.
Valores possíveis:
-
auto -
any -
none -
validated
Os nomes das ferramentas permitidas.
GoogleSearch
Uma ferramenta que pode ser usada pelo modelo para pesquisar no Google.
Nenhuma descrição informada.
Sempre defina como "google_search".
Os tipos de embasamento de pesquisa a serem ativados.
Valores possíveis:
-
web_search -
image_search -
enterprise_web_search
FileSearch
Uma ferramenta que pode ser usada pelo modelo para pesquisar arquivos.
Nenhuma descrição informada.
Sempre defina como "file_search".
Os nomes das lojas de pesquisa de arquivos a serem pesquisados.
O número de partes da recuperação semântica a serem recuperadas.
Filtro de metadados a ser aplicado aos documentos e partes da recuperação semântica.
GoogleMaps
Uma ferramenta que pode ser usada pelo modelo para chamar o Google Maps.
Nenhuma descrição informada.
Sempre defina como "google_maps".
Se é necessário retornar um token de contexto de widget no resultado da chamada de função da resposta.
A latitude da localização do usuário.
A longitude da localização do usuário.
Recuperação
Uma ferramenta que pode ser usada pelo modelo para recuperar arquivos.
Nenhuma descrição informada.
Sempre defina como "retrieval".
Os tipos de recuperação de arquivos a serem ativados.
Valores possíveis:
-
vertex_ai_search
vertex_ai_search_config VertexAISearchConfig (opcional)
Usado para especificar a configuração do VertexAISearch.
Campos
Opcional. Usado para especificar o Vertex AI para Pesquisa.
Opcional. Usado para especificar repositórios de dados da Vertex AI para Pesquisa.
Exemplos
Função
CodeExecution
UrlContext
ComputerUse
McpServer
GoogleSearch
FileSearch
GoogleMaps
Recuperação
Não há exemplos disponíveis para esse tipo.
InteractionSseEvent
Tipos possíveis
Discriminador polimórfico: event_type
InteractionCreatedEvent
Nenhuma descrição informada.
Sempre defina como "interaction.created".
Nenhuma descrição informada.
O token event_id a ser usado para retomar o fluxo de interação, a partir deste evento.
InteractionCompletedEvent
Nenhuma descrição informada.
Sempre defina como "interaction.completed".
Obrigatório. A interação concluída com saídas vazias para reduzir o tamanho do payload. Use os eventos ContentDelta anteriores para a saída real.
O token event_id a ser usado para retomar o fluxo de interação, a partir deste evento.
InteractionStatusUpdate
Nenhuma descrição informada.
Sempre defina como "interaction.status_update".
Nenhuma descrição informada.
Nenhuma descrição informada.
Valores possíveis:
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
O token event_id a ser usado para retomar o fluxo de interação, a partir deste evento.
ErrorEvent
Nenhuma descrição informada.
Sempre defina como "error".
error Error (opcional)
Nenhuma descrição informada.
Campos
Um URI que identifica o tipo de erro.
Uma mensagem de erro legível.
O token event_id a ser usado para retomar o fluxo de interação, a partir deste evento.
StepStart
Nenhuma descrição informada.
Sempre defina como "step.start".
Nenhuma descrição informada.
step Step (obrigatório)
Nenhuma descrição informada.
Tipos possíveis
Discriminador polimórfico: type
UserInputStep
Entrada fornecida pelo usuário.
Nenhuma descrição informada.
Sempre defina como "user_input".
Nenhuma descrição informada.
ModelOutputStep
Saída gerada pelo modelo.
Nenhuma descrição informada.
Sempre defina como "model_output".
Nenhuma descrição informada.
ThoughtStep
Uma etapa de pensamento.
Nenhuma descrição informada.
Sempre defina como "thought".
Um hash de assinatura para validação de back-end.
summary ThoughtSummaryContent (opcional)
Um resumo do pensamento.
Tipos possíveis
Discriminador polimórfico: type
TextContent
Um bloco de conteúdo de texto.
Nenhuma descrição informada.
Sempre defina como "text".
Obrigatório. O conteúdo do texto.
annotations Annotation (opcional)
Informações de citação para conteúdo gerado pelo modelo.
Tipos possíveis
Discriminador polimórfico: type
UrlCitation
Uma anotação de citação de URL.
Nenhuma descrição informada.
Sempre defina como "url_citation".
O URL.
O título do URL.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
FileCitation
Uma anotação de citação de arquivo.
Nenhuma descrição informada.
Sempre defina como "file_citation".
O URI do arquivo.
O nome do arquivo.
Origem atribuída a uma parte do texto.
Metadados fornecidos pelo usuário sobre o contexto recuperado.
Número da página do documento citado, se aplicável.
ID da mídia em caso de citações de imagens, se aplicável.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
PlaceCitation
Uma anotação de citação de lugar.
Nenhuma descrição informada.
Sempre defina como "place_citation".
O ID do lugar, no formato `places/{place_id}`.
Título do lugar.
Referência de URI do lugar.
review_snippets ReviewSnippet (opcional)
Trechos de avaliações usados para gerar respostas sobre os recursos de um determinado lugar no Google Maps.
Campos
Título da avaliação.
Um link que corresponde à avaliação do usuário no Google Maps.
O ID do snippet de avaliação.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
ImageContent
Um bloco de conteúdo de imagem.
Nenhuma descrição informada.
Sempre defina como "image".
O conteúdo da imagem.
O URI da imagem.
O tipo MIME da imagem.
Valores possíveis:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (opcional)
A resolução da mídia.
Valores possíveis:
-
low -
medium -
high -
ultra_high
FunctionCallStep
Uma etapa de chamada de ferramenta de função.
Nenhuma descrição informada.
Sempre defina como "function_call".
Obrigatório. O nome da ferramenta a ser chamada.
Obrigatório. Os argumentos a serem transmitidos para a função.
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
CodeExecutionCallStep
Etapa de chamada de execução de código.
Nenhuma descrição informada.
Sempre defina como "code_execution_call".
arguments CodeExecutionCallStepArguments (required)
Obrigatório. Os argumentos a serem transmitidos para a execução do código.
Campos
Linguagem de programação do "code".
Valores possíveis:
-
python
O código a ser executado.
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
UrlContextCallStep
Etapa de chamada de contexto de URL.
Nenhuma descrição informada.
Sempre defina como "url_context_call".
arguments UrlContextCallStepArguments (obrigatório)
Obrigatório. Os argumentos a serem transmitidos para o contexto do URL.
Campos
Os URLs a serem buscados.
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
McpServerToolCallStep
Etapa de chamada de ferramenta MCPServer.
Nenhuma descrição informada.
Sempre defina como "mcp_server_tool_call".
Obrigatório. O nome da ferramenta que foi chamada.
Obrigatório. O nome do servidor MCP usado.
Obrigatório. O objeto JSON de argumentos para a função.
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
GoogleSearchCallStep
Etapa de chamada da Pesquisa Google.
Nenhuma descrição informada.
Sempre defina como "google_search_call".
argumentos GoogleSearchCallStepArguments (obrigatório)
Obrigatório. Os argumentos a serem transmitidos para a Pesquisa Google.
Campos
Consultas de pesquisa na Web para a pesquisa na Web de acompanhamento.
O tipo de embasamento de pesquisa ativado.
Valores possíveis:
-
web_search -
image_search -
enterprise_web_search
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
FileSearchCallStep
Etapa de chamada da Pesquisa de arquivos.
Nenhuma descrição informada.
Sempre defina como "file_search_call".
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
GoogleMapsCallStep
Etapa de chamada do Google Maps.
Nenhuma descrição informada.
Sempre defina como "google_maps_call".
arguments GoogleMapsCallStepArguments (opcional)
Os argumentos a serem transmitidos para a ferramenta do Google Maps.
Campos
As consultas a serem executadas.
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
FunctionResultStep
Resultado de uma chamada de ferramenta de função.
Nenhuma descrição informada.
Sempre defina como "function_result".
O nome da ferramenta que foi chamada.
Se a chamada de ferramenta resultou em um erro.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
O resultado da chamada de função.
CodeExecutionResultStep
Etapa de resultado da execução do código.
Nenhuma descrição informada.
Sempre defina como "code_execution_result".
Obrigatório. A saída da execução do código.
Se a execução do código resultou em um erro.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
UrlContextResultStep
Etapa de resultado do contexto do URL.
Nenhuma descrição informada.
Sempre defina como "url_context_result".
result UrlContextResultItem (obrigatório)
Obrigatório. Os resultados do contexto do URL.
Campos
O URL buscado.
O status da recuperação do URL.
Valores possíveis:
-
success -
error -
paywall -
unsafe
Indica se o contexto do URL resultou em um erro.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
GoogleSearchResultStep
Etapa de resultado da pesquisa do Google.
Nenhuma descrição informada.
Sempre defina como "google_search_result".
result GoogleSearchResultItem (obrigatório)
Obrigatório. Os resultados da Pesquisa Google.
Campos
Snippet de conteúdo da Web que pode ser incorporado a uma página da Web ou a uma WebView de app.
Se a Pesquisa Google resultou em um erro.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
McpServerToolResultStep
Etapa de resultado da ferramenta MCPServer.
Nenhuma descrição informada.
Sempre defina como "mcp_server_tool_result".
Nome da ferramenta chamada para essa chamada de ferramenta específica.
O nome do servidor MCP usado.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
A saída da chamada do servidor MCP. Pode ser texto simples ou conteúdo avançado.
FileSearchResultStep
Etapa de resultado da pesquisa de arquivos.
Nenhuma descrição informada.
Sempre defina como "file_search_result".
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
GoogleMapsResultStep
Etapa de resultado do Google Maps.
Nenhuma descrição informada.
Sempre defina como "google_maps_result".
result GoogleMapsResultItem (obrigatório)
Nenhuma descrição informada.
Campos
places GoogleMapsResultPlaces (opcional)
Nenhuma descrição informada.
Campos
Nenhuma descrição informada.
Nenhuma descrição informada.
Nenhuma descrição informada.
review_snippets ReviewSnippet (opcional)
Nenhuma descrição informada.
Campos
Título da avaliação.
Um link que corresponde à avaliação do usuário no Google Maps.
O ID do snippet de avaliação.
Nenhuma descrição informada.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
O token event_id a ser usado para retomar o fluxo de interação, a partir deste evento.
StepDelta
Nenhuma descrição informada.
Sempre defina como "step.delta".
Nenhuma descrição informada.
delta StepDeltaData (obrigatório)
Nenhuma descrição informada.
Tipos possíveis
Discriminador polimórfico: type
TextDelta
Nenhuma descrição informada.
Sempre defina como "text".
Nenhuma descrição informada.
ImageDelta
Nenhuma descrição informada.
Sempre defina como "image".
Nenhuma descrição informada.
Nenhuma descrição informada.
Nenhuma descrição informada.
Valores possíveis:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (opcional)
A resolução da mídia.
Valores possíveis:
-
low -
medium -
high -
ultra_high
AudioDelta
Nenhuma descrição informada.
Sempre defina como "audio".
Nenhuma descrição informada.
Nenhuma descrição informada.
Nenhuma descrição informada.
Valores possíveis:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
Obsoleto. Use "sample_rate". O valor é ignorado.
A taxa de amostragem do áudio.
O número de canais de áudio.
DocumentDelta
Nenhuma descrição informada.
Sempre defina como "document".
Nenhuma descrição informada.
Nenhuma descrição informada.
Nenhuma descrição informada.
Valores possíveis:
-
application/pdf
VideoDelta
Nenhuma descrição informada.
Sempre defina como "video".
Nenhuma descrição informada.
Nenhuma descrição informada.
Nenhuma descrição informada.
Valores possíveis:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
resolution MediaResolution (opcional)
A resolução da mídia.
Valores possíveis:
-
low -
medium -
high -
ultra_high
ThoughtSummaryDelta
Nenhuma descrição informada.
Sempre defina como "thought_summary".
content ThoughtSummaryContent (opcional)
Um novo item de resumo a ser adicionado ao pensamento.
Tipos possíveis
Discriminador polimórfico: type
TextContent
Um bloco de conteúdo de texto.
Nenhuma descrição informada.
Sempre defina como "text".
Obrigatório. O conteúdo do texto.
annotations Annotation (opcional)
Informações de citação para conteúdo gerado pelo modelo.
Tipos possíveis
Discriminador polimórfico: type
UrlCitation
Uma anotação de citação de URL.
Nenhuma descrição informada.
Sempre defina como "url_citation".
O URL.
O título do URL.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
FileCitation
Uma anotação de citação de arquivo.
Nenhuma descrição informada.
Sempre defina como "file_citation".
O URI do arquivo.
O nome do arquivo.
Origem atribuída a uma parte do texto.
Metadados fornecidos pelo usuário sobre o contexto recuperado.
Número da página do documento citado, se aplicável.
ID da mídia em caso de citações de imagens, se aplicável.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
PlaceCitation
Uma anotação de citação de lugar.
Nenhuma descrição informada.
Sempre defina como "place_citation".
O ID do lugar, no formato `places/{place_id}`.
Título do lugar.
Referência de URI do lugar.
review_snippets ReviewSnippet (opcional)
Trechos de avaliações usados para gerar respostas sobre os recursos de um determinado lugar no Google Maps.
Campos
Título da avaliação.
Um link que corresponde à avaliação do usuário no Google Maps.
O ID do snippet de avaliação.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
ImageContent
Um bloco de conteúdo de imagem.
Nenhuma descrição informada.
Sempre defina como "image".
O conteúdo da imagem.
O URI da imagem.
O tipo MIME da imagem.
Valores possíveis:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (opcional)
A resolução da mídia.
Valores possíveis:
-
low -
medium -
high -
ultra_high
ThoughtSignatureDelta
Nenhuma descrição informada.
Sempre defina como "thought_signature".
Assinatura para corresponder à origem do back-end que fará parte da geração.
TextAnnotationDelta
Nenhuma descrição informada.
Sempre defina como "text_annotation_delta".
annotations Annotation (opcional)
Informações de citação para conteúdo gerado pelo modelo.
Tipos possíveis
Discriminador polimórfico: type
UrlCitation
Uma anotação de citação de URL.
Nenhuma descrição informada.
Sempre defina como "url_citation".
O URL.
O título do URL.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
FileCitation
Uma anotação de citação de arquivo.
Nenhuma descrição informada.
Sempre defina como "file_citation".
O URI do arquivo.
O nome do arquivo.
Origem atribuída a uma parte do texto.
Metadados fornecidos pelo usuário sobre o contexto recuperado.
Número da página do documento citado, se aplicável.
ID da mídia em caso de citações de imagens, se aplicável.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
PlaceCitation
Uma anotação de citação de lugar.
Nenhuma descrição informada.
Sempre defina como "place_citation".
O ID do lugar, no formato `places/{place_id}`.
Título do lugar.
Referência de URI do lugar.
review_snippets ReviewSnippet (opcional)
Trechos de avaliações usados para gerar respostas sobre os recursos de um determinado lugar no Google Maps.
Campos
Título da avaliação.
Um link que corresponde à avaliação do usuário no Google Maps.
O ID do snippet de avaliação.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
ArgumentsDelta
Nenhuma descrição informada.
Sempre defina como "arguments_delta".
Nenhuma descrição informada.
O token event_id a ser usado para retomar o fluxo de interação, a partir deste evento.
StepStop
Nenhuma descrição informada.
Sempre defina como "step.stop".
Nenhuma descrição informada.
O token event_id a ser usado para retomar o fluxo de interação, a partir deste evento.
Exemplos
Interação criada
{ "event_type": "interaction.created", "interaction": { "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg", "model": "gemini-3-flash-preview", "status": "in_progress", "created": "2025-12-04T15:01:45Z", "updated": "2025-12-04T15:01:45Z" }, "event_id": "evt_123" }
Interação concluída
{ "event_type": "interaction.completed", "interaction": { "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg", "model": "gemini-3-flash-preview", "status": "completed", "created": "2025-12-04T15:01:45Z", "updated": "2025-12-04T15:01:45Z" }, "event_id": "evt_123" }
Atualização do status da interação
{ "event_type": "interaction.status_update", "interaction_id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM", "status": "in_progress" }
Evento de erro
{ "event_type": "error", "error": { "message": "Failed to get completed interaction: Result not found.", "code": "not_found" } }
Início da etapa
{ "event_type": "step.start", "index": 0, "step": { "type": "model_output" } }
Delta de etapa
{ "event_type": "step.delta", "index": 0, "delta": { "type": "text", "text": "Hello" } }
Step Stop
{ "event_type": "step.stop", "index": 0 }