A API Gemini Interactions é uma API experimental que permite aos desenvolvedores criar aplicativos de IA generativa usando modelos do Gemini. O Gemini é nosso modelo mais avançado, criado desde o início para ser multimodal. Ele pode generalizar, entender, operar e combinar diferentes tipos de informações, incluindo idiomas, imagens, áudio, vídeo e código. Você pode usar a API Gemini para casos de uso como raciocínio em textos e imagens, geração de conteúdo, agentes de diálogo, sistemas de resumo e classificação e muito mais.
Criar uma interação
Cria uma nova interação.
Corpo da solicitação
O corpo da solicitação contém dados com a seguinte estrutura:
model ModelOption (opcional)
O nome do "Model" usado para gerar a interação.
Obrigatório se "agent" não for fornecido.
Valores possíveis:
-
gemini-2.5-computer-use-preview-10-2025Um modelo de capacidade de agente projetado para interação direta com a interface, permitindo que o Gemini perceba e navegue em ambientes digitais.
-
gemini-2.5-flashNosso primeiro modelo de raciocínio híbrido, que oferece suporte a uma janela de contexto de 1 milhão de tokens e tem limites de raciocínio.
-
gemini-2.5-flash-imageNosso modelo nativo de geração de imagens, otimizado para velocidade, flexibilidade e compreensão contextual. A entrada e a saída de texto têm o mesmo preço do 2.5 Flash.
-
gemini-2.5-flash-liteNosso modelo menor e mais econômico, criado para uso em grande escala.
-
gemini-2.5-flash-lite-preview-09-2025O modelo mais recente baseado no Gemini 2.5 Flash lite otimizado para custo-benefício, alta capacidade de processamento e alta qualidade.
-
gemini-2.5-flash-native-audio-preview-12-2025Nossos modelos de áudio nativos são otimizados para saídas de áudio de maior qualidade, com melhor ritmo, naturalidade da voz, nível de detalhes e humor.
-
gemini-2.5-flash-preview-09-2025O modelo mais recente baseado no modelo 2.5 Flash. O pré-lançamento do 2.5 Flash é ideal para processamento em grande escala, baixa latência, tarefas de alto volume que exigem pensamento e casos de uso de agentes.
-
gemini-2.5-flash-preview-ttsNosso modelo de conversão de texto em voz 2.5 Flash otimizado para geração de fala controlável, potente e de baixa latência.
-
gemini-2.5-proNosso modelo avançado e multifuncional, que se destaca em programação e tarefas de raciocínio complexas.
-
gemini-2.5-pro-preview-ttsNosso modelo de áudio Text-to-Speech 2.5 Pro é otimizado para geração de fala poderosa e de baixa latência, com saídas mais naturais e comandos mais fáceis de direcionar.
-
gemini-3-flash-previewNosso modelo mais inteligente, criado para ser rápido, que combina inteligência de ponta com pesquisa e embasamento superiores.
-
gemini-3-pro-image-previewModelo de edição e geração de imagens de última geração.
-
gemini-3-pro-previewNosso modelo mais inteligente com raciocínio e compreensão multimodal de última geração, além de recursos avançados de programação assistida por IA e vibe coding.
-
gemini-3.1-pro-previewNosso mais recente modelo de raciocínio SOTA com profundidade e nuances sem precedentes, além de recursos avançados de compreensão multimodal e programação.
-
gemini-3.1-flash-image-previewInteligência visual de nível profissional com eficiência de velocidade do Flash e recursos de geração baseados na realidade.
-
gemini-3.1-flash-lite-previewNosso modelo mais econômico, otimizado para tarefas agênticas de alto volume, tradução e processamento de dados simples.
-
gemini-3.1-flash-tts-previewGemini 3.1 Flash TTS: geração de fala eficiente e de baixa latência. Aproveite saídas naturais, comandos direcionáveis e novas tags de áudio expressivas para um controle preciso da narração.
-
lyria-3-clip-previewNosso modelo de geração de música de baixa latência otimizado para clipes de áudio de alta fidelidade e controle rítmico preciso.
-
lyria-3-pro-previewNosso modelo generativo avançado de músicas completas com compreensão composicional profunda, otimizado para controle estrutural preciso e transições complexas em diversos estilos musicais.
agent AgentOption (opcional)
O nome do "Agente" usado para gerar a interação.
Obrigatório se "model" não for fornecido.
Valores possíveis:
-
deep-research-pro-preview-12-2025Agente Deep Research do Gemini
-
deep-research-preview-04-2026Agente Deep Research do Gemini
-
deep-research-max-preview-04-2026Agente Deep Research Max do Gemini
As entradas para a interação (comum ao modelo e ao agente).
Instrução do sistema para a interação.
Uma lista de declarações de ferramentas que o modelo pode chamar durante a interação.
Força que a resposta gerada seja um objeto JSON que esteja em conformidade com o esquema JSON especificado neste campo.
O tipo MIME da resposta. Obrigatório se "response_format" estiver definido.
Somente entrada. Se a interação será transmitida por streaming.
Somente entrada. Indica se a resposta e a solicitação serão armazenadas para recuperação posterior.
Somente entrada. Se a interação do modelo será executada em segundo plano.
generation_config GenerationConfig (opcional)
Configuração do modelo
: parâmetros de configuração para a interação do modelo.
Alternativa a "agent_config". Só é aplicável quando "model" está definido.
Campos
Controla a aleatoriedade da saída.
A probabilidade cumulativa máxima de tokens a serem considerados na amostragem.
Seed usada na decodificação para reprodutibilidade.
Uma lista de sequências de caracteres que vão interromper a interação de saída.
thinking_level ThinkingLevel (opcional)
O nível de tokens de pensamento que o modelo deve gerar.
Valores possíveis:
-
minimal -
low -
medium -
high
thinking_summaries ThinkingSummaries (opcional)
Define se os resumos de pensamento serão incluídos na resposta.
Valores possíveis:
-
auto -
none
O número máximo de tokens a serem incluídos na resposta.
speech_config SpeechConfig (opcional)
Configuração para interação de fala.
Campos
A voz do alto-falante.
O idioma da fala.
O nome do falante precisa corresponder ao nome informado no comando.
image_config ImageConfig (opcional)
Configuração para interação com imagens.
Campos
Nenhuma descrição informada.
Valores possíveis:
-
1:1 -
2:3 -
3:2 -
3:4 -
4:3 -
4:5 -
5:4 -
9:16 -
16:9 -
21:9 -
1:8 -
8:1 -
1:4 -
4:1
Nenhuma descrição informada.
Valores possíveis:
-
1K -
2K -
4K -
512
A configuração de escolha da ferramenta.
agent_config object (opcional)
Configuração do agente
Configuração do agente.
Alternativa a "generation_config". Só é aplicável quando "agent" está definido.
Tipos possíveis
Discriminador polimórfico: type
DynamicAgentConfig
Configuração para agentes dinâmicos.
Nenhuma descrição informada.
Sempre defina como "dynamic".
DeepResearchAgentConfig
Configuração do agente Deep Research.
Nenhuma descrição informada.
Sempre defina como "deep-research".
thinking_summaries ThinkingSummaries (opcional)
Define se os resumos de pensamento serão incluídos na resposta.
Valores possíveis:
-
auto -
none
Define se as visualizações serão incluídas na resposta.
Valores possíveis:
-
off -
auto
Ativa o planejamento human-in-the-loop para o agente Deep Research. Se definido como "true", o agente Deep Research vai fornecer um plano de pesquisa na resposta. O agente só vai continuar se o usuário confirmar o plano na próxima interação.
O ID da interação anterior, se houver.
response_modalities ResponseModality (opcional)
As modalidades solicitadas da resposta (TEXT, IMAGE, AUDIO).
Valores possíveis:
-
text -
image -
audio -
video -
document
O nível de serviço da interação.
Valores possíveis:
-
flex -
standard -
priority
Resposta
Retorna um recurso Interaction.
Solicitação simples
Exemplo de resposta
{ "created": "2025-11-26T12:25:15Z", "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "object": "interaction", "outputs": [ { "text": "Hello! I'm functioning perfectly and ready to assist you.\n\nHow are you doing today?", "type": "text" } ], "role": "model", "status": "completed", "updated": "2025-11-26T12:25:15Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 7 } ], "total_cached_tokens": 0, "total_input_tokens": 7, "total_output_tokens": 20, "total_thought_tokens": 22, "total_tokens": 49, "total_tool_use_tokens": 0 } }
Várias interações
Exemplo de resposta
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "role": "model", "outputs": [ { "type": "text", "text": "The capital of France is Paris." } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 50 } ], "total_cached_tokens": 0, "total_input_tokens": 50, "total_output_tokens": 10, "total_thought_tokens": 0, "total_tokens": 60, "total_tool_use_tokens": 0 } }
Entrada de imagem
Exemplo de resposta
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "role": "model", "outputs": [ { "type": "text", "text": "A white humanoid robot with glowing blue eyes stands holding a red skateboard." } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 10 }, { "modality": "image", "tokens": 258 } ], "total_cached_tokens": 0, "total_input_tokens": 268, "total_output_tokens": 20, "total_thought_tokens": 0, "total_tokens": 288, "total_tool_use_tokens": 0 } }
Chamada de função
Exemplo de resposta
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "requires_action", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "role": "model", "outputs": [ { "type": "function_call", "id": "gth23981", "name": "get_weather", "arguments": { "location": "Boston, MA" } } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 100 } ], "total_cached_tokens": 0, "total_input_tokens": 100, "total_output_tokens": 25, "total_thought_tokens": 0, "total_tokens": 125, "total_tool_use_tokens": 50 } }
Deep Research
Exemplo de resposta
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "agent": "deep-research-pro-preview-12-2025", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "role": "agent", "outputs": [ { "type": "text", "text": "Here is a comprehensive research report on the current state of cancer research..." } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 20 } ], "total_cached_tokens": 0, "total_input_tokens": 20, "total_output_tokens": 1000, "total_thought_tokens": 500, "total_tokens": 1520, "total_tool_use_tokens": 0 } }
Como recuperar uma interação
Recupera todos os detalhes de uma única interação com base no `Interaction.id`.
Parâmetros de caminho / consulta
O identificador exclusivo da interação a ser recuperada.
Se definido como verdadeiro, o conteúdo gerado será transmitido de forma incremental.
Padrão: False
Opcional. Se definido, retoma o fluxo de interação do próximo bloco após o evento marcado pelo ID do evento. Só pode ser usado se "stream" for verdadeiro.
Se definido como "true", inclui a entrada na resposta.
Padrão: False
Qual versão da API usar.
Resposta
Retorna um recurso Interaction.
Acessar interação
Exemplo de resposta
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:25:15Z", "updated": "2025-11-26T12:25:15Z", "role": "model", "outputs": [ { "type": "text", "text": "I'm doing great, thank you for asking! How can I help you today?" } ] }
Excluir uma interação
Exclui a interação por ID.
Parâmetros de caminho / consulta
O identificador exclusivo da interação a ser excluída.
Qual versão da API usar.
Resposta
Se a solicitação for concluída, a resposta estará vazia.
Excluir interação
Como cancelar uma interação
Cancela uma interação por ID. Isso só se aplica a interações em segundo plano que ainda estão em execução.
Parâmetros de caminho / consulta
O identificador exclusivo da interação a ser cancelada.
Qual versão da API usar.
Resposta
Retorna um recurso Interaction.
Cancelar interação
Exemplo de resposta
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "agent": "deep-research-pro-preview-12-2025", "status": "cancelled", "object": "interaction", "created": "2025-11-26T12:25:15Z", "updated": "2025-11-26T12:25:15Z", "role": "agent" }
Recursos
Interação
O recurso "Interaction".
Campos
model ModelOption (opcional)
O nome do "Model" usado para gerar a interação.
Valores possíveis:
-
gemini-2.5-computer-use-preview-10-2025Um modelo de capacidade de agente projetado para interação direta com a interface, permitindo que o Gemini perceba e navegue em ambientes digitais.
-
gemini-2.5-flashNosso primeiro modelo de raciocínio híbrido, que oferece suporte a uma janela de contexto de 1 milhão de tokens e tem limites de raciocínio.
-
gemini-2.5-flash-imageNosso modelo nativo de geração de imagens, otimizado para velocidade, flexibilidade e compreensão contextual. A entrada e a saída de texto têm o mesmo preço do 2.5 Flash.
-
gemini-2.5-flash-liteNosso modelo menor e mais econômico, criado para uso em grande escala.
-
gemini-2.5-flash-lite-preview-09-2025O modelo mais recente baseado no Gemini 2.5 Flash lite otimizado para custo-benefício, alta capacidade de processamento e alta qualidade.
-
gemini-2.5-flash-native-audio-preview-12-2025Nossos modelos de áudio nativos são otimizados para saídas de áudio de maior qualidade, com melhor ritmo, naturalidade da voz, nível de detalhes e humor.
-
gemini-2.5-flash-preview-09-2025O modelo mais recente baseado no modelo 2.5 Flash. O pré-lançamento do 2.5 Flash é ideal para processamento em grande escala, baixa latência, tarefas de alto volume que exigem pensamento e casos de uso de agentes.
-
gemini-2.5-flash-preview-ttsNosso modelo de conversão de texto em voz 2.5 Flash otimizado para geração de fala controlável, potente e de baixa latência.
-
gemini-2.5-proNosso modelo avançado e multifuncional, que se destaca em programação e tarefas de raciocínio complexas.
-
gemini-2.5-pro-preview-ttsNosso modelo de áudio Text-to-Speech 2.5 Pro é otimizado para geração de fala poderosa e de baixa latência, com saídas mais naturais e comandos mais fáceis de direcionar.
-
gemini-3-flash-previewNosso modelo mais inteligente, criado para ser rápido, que combina inteligência de ponta com pesquisa e embasamento superiores.
-
gemini-3-pro-image-previewModelo de edição e geração de imagens de última geração.
-
gemini-3-pro-previewNosso modelo mais inteligente com raciocínio e compreensão multimodal de última geração, além de recursos avançados de programação assistida por IA e vibe coding.
-
gemini-3.1-pro-previewNosso mais recente modelo de raciocínio SOTA com profundidade e nuances sem precedentes, além de recursos avançados de compreensão multimodal e programação.
-
gemini-3.1-flash-image-previewInteligência visual de nível profissional com eficiência de velocidade do Flash e recursos de geração baseados na realidade.
-
gemini-3.1-flash-lite-previewNosso modelo mais econômico, otimizado para tarefas agênticas de alto volume, tradução e processamento de dados simples.
-
gemini-3.1-flash-tts-previewGemini 3.1 Flash TTS: geração de fala eficiente e de baixa latência. Aproveite saídas naturais, comandos direcionáveis e novas tags de áudio expressivas para um controle preciso da narração.
-
lyria-3-clip-previewNosso modelo de geração de música de baixa latência otimizado para clipes de áudio de alta fidelidade e controle rítmico preciso.
-
lyria-3-pro-previewNosso modelo generativo avançado de músicas completas com compreensão composicional profunda, otimizado para controle estrutural preciso e transições complexas em diversos estilos musicais.
agent AgentOption (opcional)
O nome do "Agente" usado para gerar a interação.
Valores possíveis:
-
deep-research-pro-preview-12-2025Agente Deep Research do Gemini
-
deep-research-preview-04-2026Agente Deep Research do Gemini
-
deep-research-max-preview-04-2026Agente Deep Research Max do Gemini
Obrigatório. Apenas saída. Um identificador exclusivo para a conclusão da interação.
Obrigatório. Apenas saída. O status da interação.
Valores possíveis:
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
Obrigatório. Apenas saída. O horário em que a resposta foi criada no formato ISO 8601 (AAAA-MM-DDThh:mm:ssZ).
Obrigatório. Apenas saída. A hora em que a resposta foi atualizada pela última vez no formato ISO 8601 (AAAA-MM-DDThh:mm:ssZ).
Apenas saída. A função da interação.
Apenas saída. Respostas do modelo.
Instrução do sistema para a interação.
Uma lista de declarações de ferramentas que o modelo pode chamar durante a interação.
usage Usage (opcional)
Apenas saída. Estatísticas sobre o uso de tokens da solicitação de interação.
Campos
Número de tokens no comando (contexto).
input_tokens_by_modality ModalityTokens (opcional)
Um detalhamento do uso de tokens de entrada por modalidade.
Campos
modalidade ResponseModality (opcional)
A modalidade associada à contagem de tokens.
Valores possíveis:
-
text -
image -
audio -
video -
document
Número de tokens para a modalidade.
Número de tokens na parte em cache do comando (o conteúdo em cache).
cached_tokens_by_modality ModalityTokens (opcional)
Um detalhamento do uso de tokens em cache por modalidade.
Campos
modalidade ResponseModality (opcional)
A modalidade associada à contagem de tokens.
Valores possíveis:
-
text -
image -
audio -
video -
document
Número de tokens para a modalidade.
Número total de tokens em todas as respostas geradas.
output_tokens_by_modality ModalityTokens (opcional)
Um detalhamento do uso de tokens de saída por modalidade.
Campos
modalidade ResponseModality (opcional)
A modalidade associada à contagem de tokens.
Valores possíveis:
-
text -
image -
audio -
video -
document
Número de tokens para a modalidade.
Número de tokens presentes nos comandos de uso da ferramenta.
tool_use_tokens_by_modality ModalityTokens (opcional)
Um detalhamento do uso de tokens de uso de ferramentas por modalidade.
Campos
modalidade ResponseModality (opcional)
A modalidade associada à contagem de tokens.
Valores possíveis:
-
text -
image -
audio -
video -
document
Número de tokens para a modalidade.
Número de tokens de raciocínio para modelos de pensamento.
Contagem total de tokens para a solicitação de interação (comando + respostas + outros tokens internos).
response_modalities ResponseModality (opcional)
As modalidades solicitadas da resposta (TEXT, IMAGE, AUDIO).
Valores possíveis:
-
text -
image -
audio -
video -
document
Força que a resposta gerada seja um objeto JSON que esteja em conformidade com o esquema JSON especificado neste campo.
O tipo MIME da resposta. Obrigatório se "response_format" estiver definido.
O ID da interação anterior, se houver.
O nível de serviço da interação.
Valores possíveis:
-
flex -
standard -
priority
agent_config object (opcional)
Parâmetros de configuração para a interação do agente.
Tipos possíveis
Discriminador polimórfico: type
DynamicAgentConfig
Configuração para agentes dinâmicos.
Nenhuma descrição informada.
Sempre defina como "dynamic".
DeepResearchAgentConfig
Configuração do agente Deep Research.
Nenhuma descrição informada.
Sempre defina como "deep-research".
thinking_summaries ThinkingSummaries (opcional)
Define se os resumos de pensamento serão incluídos na resposta.
Valores possíveis:
-
auto -
none
Define se as visualizações serão incluídas na resposta.
Valores possíveis:
-
off -
auto
Ativa o planejamento human-in-the-loop para o agente Deep Research. Se definido como "true", o agente Deep Research vai fornecer um plano de pesquisa na resposta. O agente só vai continuar se o usuário confirmar o plano na próxima interação.
Exemplos
Exemplo
{ "created": "2025-12-04T15:01:45Z", "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg", "model": "gemini-3-flash-preview", "object": "interaction", "outputs": [ { "text": "Hello! I'm doing well, functioning as expected. Thank you for asking! How are you doing today?", "type": "text" } ], "role": "model", "status": "completed", "updated": "2025-12-04T15:01:45Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 7 } ], "total_cached_tokens": 0, "total_input_tokens": 7, "total_output_tokens": 23, "total_thought_tokens": 49, "total_tokens": 79, "total_tool_use_tokens": 0 } }
Modelos de dados
Conteúdo
O conteúdo da resposta.
Tipos possíveis
Discriminador polimórfico: type
TextContent
Um bloco de conteúdo de texto.
Nenhuma descrição informada.
Sempre defina como "text".
Obrigatório. O conteúdo do texto.
annotations Annotation (opcional)
Informações de citação para conteúdo gerado pelo modelo.
Tipos possíveis
Discriminador polimórfico: type
UrlCitation
Uma anotação de citação de URL.
Nenhuma descrição informada.
Sempre defina como "url_citation".
O URL.
O título do URL.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
FileCitation
Uma anotação de citação de arquivo.
Nenhuma descrição informada.
Sempre defina como "file_citation".
O URI do arquivo.
O nome do arquivo.
Fonte atribuída a uma parte do texto.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
PlaceCitation
Uma anotação de citação de lugar.
Nenhuma descrição informada.
Sempre defina como "place_citation".
O ID do lugar, no formato `places/{place_id}`.
Título do lugar.
Referência de URI do lugar.
review_snippets ReviewSnippet (opcional)
Trechos de avaliações usados para gerar respostas sobre os recursos de um determinado lugar no Google Maps.
Campos
Título da avaliação.
Um link que corresponde à avaliação do usuário no Google Maps.
O ID do snippet de avaliação.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
ImageContent
Um bloco de conteúdo de imagem.
Nenhuma descrição informada.
Sempre defina como "image".
O conteúdo da imagem.
O URI da imagem.
O tipo MIME da imagem.
Valores possíveis:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (opcional)
A resolução da mídia.
Valores possíveis:
-
low -
medium -
high -
ultra_high
AudioContent
Um bloco de conteúdo de áudio.
Nenhuma descrição informada.
Sempre defina como "audio".
O conteúdo de áudio.
O URI do áudio.
O tipo MIME do áudio.
Valores possíveis:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
A taxa de amostragem do áudio.
O número de canais de áudio.
DocumentContent
Um bloco de conteúdo de documento.
Nenhuma descrição informada.
Sempre defina como "document".
O conteúdo do documento.
O URI do documento.
O tipo MIME do documento.
Valores possíveis:
-
application/pdf
VideoContent
Um bloco de conteúdo em vídeo.
Nenhuma descrição informada.
Sempre defina como "video".
O conteúdo do vídeo.
O URI do vídeo.
O tipo MIME do vídeo.
Valores possíveis:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
resolution MediaResolution (opcional)
A resolução da mídia.
Valores possíveis:
-
low -
medium -
high -
ultra_high
ThoughtContent
Um bloco de conteúdo de pensamento.
Nenhuma descrição informada.
Sempre defina como "thought".
Assinatura para corresponder à origem do back-end que fará parte da geração.
summary ThoughtSummaryContent (opcional)
Um resumo do pensamento.
Tipos possíveis
Discriminador polimórfico: type
TextContent
Um bloco de conteúdo de texto.
Nenhuma descrição informada.
Sempre defina como "text".
Obrigatório. O conteúdo do texto.
annotations Annotation (opcional)
Informações de citação para conteúdo gerado pelo modelo.
Tipos possíveis
Discriminador polimórfico: type
UrlCitation
Uma anotação de citação de URL.
Nenhuma descrição informada.
Sempre defina como "url_citation".
O URL.
O título do URL.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
FileCitation
Uma anotação de citação de arquivo.
Nenhuma descrição informada.
Sempre defina como "file_citation".
O URI do arquivo.
O nome do arquivo.
Fonte atribuída a uma parte do texto.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
PlaceCitation
Uma anotação de citação de lugar.
Nenhuma descrição informada.
Sempre defina como "place_citation".
O ID do lugar, no formato `places/{place_id}`.
Título do lugar.
Referência de URI do lugar.
review_snippets ReviewSnippet (opcional)
Trechos de avaliações usados para gerar respostas sobre os recursos de um determinado lugar no Google Maps.
Campos
Título da avaliação.
Um link que corresponde à avaliação do usuário no Google Maps.
O ID do snippet de avaliação.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
ImageContent
Um bloco de conteúdo de imagem.
Nenhuma descrição informada.
Sempre defina como "image".
O conteúdo da imagem.
O URI da imagem.
O tipo MIME da imagem.
Valores possíveis:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (opcional)
A resolução da mídia.
Valores possíveis:
-
low -
medium -
high -
ultra_high
FunctionCallContent
Um bloco de conteúdo de chamada de ferramenta de função.
Nenhuma descrição informada.
Sempre defina como "function_call".
Obrigatório. O nome da ferramenta a ser chamada.
Obrigatório. Os argumentos a serem transmitidos para a função.
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
CodeExecutionCallContent
Conteúdo de execução de código.
Nenhuma descrição informada.
Sempre defina como "code_execution_call".
arguments CodeExecutionCallArguments (obrigatório)
Obrigatório. Os argumentos a serem transmitidos para a execução do código.
Campos
Linguagem de programação do "code".
Valores possíveis:
-
python
O código a ser executado.
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
UrlContextCallContent
Conteúdo do contexto do URL.
Nenhuma descrição informada.
Sempre defina como "url_context_call".
arguments UrlContextCallArguments (obrigatório)
Obrigatório. Os argumentos a serem transmitidos para o contexto do URL.
Campos
Os URLs a serem buscados.
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
McpServerToolCallContent
Conteúdo da chamada de ferramenta MCPServer.
Nenhuma descrição informada.
Sempre defina como "mcp_server_tool_call".
Obrigatório. O nome da ferramenta que foi chamada.
Obrigatório. O nome do servidor MCP usado.
Obrigatório. O objeto JSON de argumentos para a função.
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
GoogleSearchCallContent
Conteúdo da Pesquisa Google.
Nenhuma descrição informada.
Sempre defina como "google_search_call".
argumentos GoogleSearchCallArguments (obrigatório)
Obrigatório. Os argumentos a serem transmitidos para a Pesquisa Google.
Campos
Consultas de pesquisa na Web para a pesquisa na Web de acompanhamento.
O tipo de embasamento de pesquisa ativado.
Valores possíveis:
-
web_search -
image_search -
enterprise_web_search
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
FileSearchCallContent
Conteúdo da Pesquisa de arquivos.
Nenhuma descrição informada.
Sempre defina como "file_search_call".
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
GoogleMapsCallContent
Conteúdo do Google Maps.
Nenhuma descrição informada.
Sempre defina como "google_maps_call".
arguments GoogleMapsCallArguments (opcional)
Os argumentos a serem transmitidos para a ferramenta do Google Maps.
Campos
As consultas a serem executadas.
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
FunctionResultContent
Um bloco de conteúdo de resultado da ferramenta de função.
Nenhuma descrição informada.
Sempre defina como "function_result".
O nome da ferramenta que foi chamada.
Se a chamada de ferramenta resultou em um erro.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
O resultado da chamada de função.
CodeExecutionResultContent
Conteúdo do resultado da execução do código.
Nenhuma descrição informada.
Sempre defina como "code_execution_result".
Obrigatório. A saída da execução do código.
Se a execução do código resultou em um erro.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
UrlContextResultContent
Conteúdo do resultado do contexto do URL.
Nenhuma descrição informada.
Sempre defina como "url_context_result".
result UrlContextResult (obrigatório)
Obrigatório. Os resultados do contexto do URL.
Campos
O URL buscado.
O status da recuperação do URL.
Valores possíveis:
-
success -
error -
paywall -
unsafe
Indica se o contexto do URL resultou em um erro.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
GoogleSearchResultContent
Conteúdo do resultado da pesquisa do Google.
Nenhuma descrição informada.
Sempre defina como "google_search_result".
result GoogleSearchResult (obrigatório)
Obrigatório. Os resultados da Pesquisa Google.
Campos
Snippet de conteúdo da Web que pode ser incorporado a uma página da Web ou a uma WebView de app.
Se a Pesquisa Google resultou em um erro.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
McpServerToolResultContent
Conteúdo do resultado da ferramenta MCPServer.
Nenhuma descrição informada.
Sempre defina como "mcp_server_tool_result".
Nome da ferramenta chamada para essa chamada de ferramenta específica.
O nome do servidor MCP usado.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
A saída da chamada do servidor MCP. Pode ser texto simples ou conteúdo avançado.
FileSearchResultContent
Conteúdo do resultado da Pesquisa de arquivos.
Nenhuma descrição informada.
Sempre defina como "file_search_result".
result FileSearchResult (obrigatório)
Obrigatório. Os resultados da pesquisa de arquivos.
Campos
Metadados fornecidos pelo usuário sobre o FileSearchResult.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
GoogleMapsResultContent
Conteúdo dos resultados do Google Maps.
Nenhuma descrição informada.
Sempre defina como "google_maps_result".
result GoogleMapsResult (obrigatório)
Obrigatório. Os resultados do Google Maps.
Campos
places Places (opcional)
Os lugares encontrados.
Campos
O ID do lugar, no formato `places/{place_id}`.
Título do lugar.
Referência de URI do lugar.
review_snippets ReviewSnippet (opcional)
Trechos de avaliações usados para gerar respostas sobre os recursos de um determinado lugar no Google Maps.
Campos
Título da avaliação.
Um link que corresponde à avaliação do usuário no Google Maps.
O ID do snippet de avaliação.
Nome do recurso do token de contexto do widget do Google Maps.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
Exemplos
Texto
{ "type": "text", "text": "Hello, how are you?" }
Imagem
{ "type": "image", "data": "BASE64_ENCODED_IMAGE", "mime_type": "image/png" }
Áudio
{ "type": "audio", "data": "BASE64_ENCODED_AUDIO", "mime_type": "audio/wav" }
Documento
{ "type": "document", "data": "BASE64_ENCODED_DOCUMENT", "mime_type": "application/pdf" }
Vídeo
{ "type": "video", "uri": "https://www.youtube.com/watch?v=9hE5-98ZeCg" }
Raciocínio
{ "type": "thought", "summary": [ { "type": "text", "text": "The user is asking about the weather. I should use the get_weather tool." } ], "signature": "CoMDAXLI2nynRYojJIy6B1Jh9os2crpWLfB0+19xcLsGG46bd8wjkF/6RNlRUdvHrXyjsHkG0BZFcuO/bPOyA6Xh5jANNgx82wPHjGExN8A4ZQn56FlMwyZoqFVQz0QyY1lfibFJ2zU3J87uw26OewzcuVX0KEcs+GIsZa3EA6WwqhbsOd3wtZB3Ua2Qf98VAWZTS5y/tWpql7jnU3/CU7pouxQr/Bwft3hwnJNesQ9/dDJTuaQ8Zprh9VRWf1aFFjpIueOjBRrlT3oW6/y/eRl/Gt9BQXCYTqg/38vHFUU4Wo/d9dUpvfCe/a3o97t2Jgxp34oFKcsVb4S5WJrykIkw+14DzVnTpCpbQNFckqvFLuqnJCkL0EQFtunBXI03FJpPu3T1XU6id8S7ojoJQZSauGUCgmaLqUGdMrd08oo81ecoJSLs51Re9N/lISGmjWFPGpqJLoGq6uo4FHz58hmeyXCgHG742BHz2P3MiH1CXHUT2J8mF6zLhf3SR9Qb3lkrobAh" }
Chamada de função
{ "type": "function_call", "name": "get_weather", "id": "gth23981", "arguments": { "location": "Boston, MA" } }
Chamada de execução de código
{ "type": "code_execution_call", "id": "call_123456", "arguments": { "language": "python", "code": "print('hello world')" } }
Chamada de contexto de URL
{ "type": "url_context_call", "id": "call_123456", "arguments": { "urls": [ "https://www.example.com" ] } }
Chamada de ferramenta do servidor MCP
{ "type": "mcp_server_tool_call", "id": "call_123456", "name": "get_forecast", "server_name": "weather_server", "arguments": { "city": "London" } }
Chamada da Pesquisa Google
{ "type": "google_search_call", "id": "call_123456", "arguments": { "queries": [ "weather in Boston" ] } }
Chamada de pesquisa de arquivos
{ "type": "file_search_call", "id": "call_123456" }
Chamada do Google Maps
{ "type": "google_maps_call", "id": "call_123456", "arguments": { "query": "best food near me" } }
Resultado da função
{ "type": "function_result", "name": "get_weather", "call_id": "gth23981", "result": [ { "type": "text", "text": "{\"weather\":\"sunny\"}" } ] }
Resultado da execução do código
{ "type": "code_execution_result", "call_id": "call_123456", "result": "hello world" }
Resultado do contexto do URL
{ "type": "url_context_result", "call_id": "call_123456", "result": [ { "url": "https://www.example.com", "status": "SUCCESS" } ] }
Resultado da pesquisa do Google
{ "type": "google_search_result", "call_id": "call_123456", "result": [ { "url": "https://www.google.com/search?q=weather+in+Boston", "title": "Weather in Boston" } ] }
Resultado da Ferramenta de Servidor MCP
{ "type": "mcp_server_tool_result", "name": "get_forecast", "server_name": "weather_server", "call_id": "call_123456", "result": "sunny" }
Resultado da pesquisa de arquivos
{ "type": "file_search_result", "call_id": "call_123456", "result": [ { "text": "search result chunk", "file_search_store": "file_search_store" } ] }
Resultado do Google Maps
{ "type": "google_maps_result", "call_id": "call_123456", "result": [ { "places": [ { "url": "https://www.google.com/maps/search/best+food+near+me", "name": "Tasty Restaurant" } ] } ] }
Ferramenta
Uma ferramenta que pode ser usada pelo modelo.
Tipos possíveis
Discriminador polimórfico: type
Função
Uma ferramenta que pode ser usada pelo modelo.
Nenhuma descrição informada.
Sempre defina como "function".
O nome da função.
Uma descrição da função.
O esquema JSON para os parâmetros da função.
CodeExecution
Uma ferramenta que pode ser usada pelo modelo para executar código.
Nenhuma descrição informada.
Sempre defina como "code_execution".
UrlContext
Uma ferramenta que pode ser usada pelo modelo para buscar o contexto do URL.
Nenhuma descrição informada.
Sempre defina como "url_context".
ComputerUse
Uma ferramenta que pode ser usada pelo modelo para interagir com o computador.
Nenhuma descrição informada.
Sempre defina como "computer_use".
O ambiente em operação.
Valores possíveis:
-
browser
A lista de funções predefinidas que são excluídas da chamada de modelo.
McpServer
Um MCPServer é um servidor que pode ser chamado pelo modelo para realizar ações.
Nenhuma descrição informada.
Sempre defina como "mcp_server".
O nome do MCPServer.
O URL completo do endpoint MCPServer. Exemplo: "https://api.example.com/mcp"
Opcional: campos para cabeçalhos de autenticação, tempos limite etc., se necessário.
allowed_tools AllowedTools (opcional)
As ferramentas permitidas.
Campos
mode ToolChoiceType (opcional)
O modo da escolha de ferramenta.
Valores possíveis:
-
auto -
any -
none -
validated
Os nomes das ferramentas permitidas.
GoogleSearch
Uma ferramenta que pode ser usada pelo modelo para pesquisar no Google.
Nenhuma descrição informada.
Sempre defina como "google_search".
Os tipos de embasamento de pesquisa a serem ativados.
Valores possíveis:
-
web_search -
image_search -
enterprise_web_search
FileSearch
Uma ferramenta que pode ser usada pelo modelo para pesquisar arquivos.
Nenhuma descrição informada.
Sempre defina como "file_search".
Os nomes das lojas de pesquisa de arquivos a serem pesquisados.
O número de partes da recuperação semântica a serem recuperadas.
Filtro de metadados a ser aplicado aos documentos e partes da recuperação semântica.
GoogleMaps
Uma ferramenta que pode ser usada pelo modelo para chamar o Google Maps.
Nenhuma descrição informada.
Sempre defina como "google_maps".
Se é necessário retornar um token de contexto de widget no resultado da chamada de função da resposta.
A latitude da localização do usuário.
A longitude da localização do usuário.
Recuperação
Uma ferramenta que pode ser usada pelo modelo para recuperar arquivos.
Nenhuma descrição informada.
Sempre defina como "retrieval".
Os tipos de recuperação de arquivos a serem ativados.
Valores possíveis:
-
vertex_ai_search
vertex_ai_search_config VertexAISearchConfig (opcional)
Usado para especificar a configuração do VertexAISearch.
Campos
Opcional. Usado para especificar o Vertex AI para Pesquisa.
Opcional. Usado para especificar repositórios de dados da Vertex AI para Pesquisa.
Exemplos
Função
CodeExecution
UrlContext
ComputerUse
McpServer
GoogleSearch
FileSearch
GoogleMaps
Recuperação
Não há exemplos disponíveis para esse tipo.
CANNOT TRANSLATE
Campos
O criador desta rodada. Precisa ser "user" para entrada ou "model" para saída do modelo.
Nenhuma descrição informada.
Exemplos
Turno do usuário
{ "role": "user", "content": [ { "type": "text", "text": "user turn" } ] }
Turno do modelo
{ "role": "model", "content": [ { "type": "text", "text": "model turn" } ] }
InteractionSseEvent
Tipos possíveis
Discriminador polimórfico: event_type
InteractionStartEvent
Nenhuma descrição informada.
Sempre defina como "interaction.start".
Nenhuma descrição informada.
O token event_id a ser usado para retomar o fluxo de interação, a partir deste evento.
InteractionCompleteEvent
Nenhuma descrição informada.
Sempre defina como "interaction.complete".
Obrigatório. A interação concluída com saídas vazias para reduzir o tamanho do payload. Use os eventos ContentDelta anteriores para a saída real.
O token event_id a ser usado para retomar o fluxo de interação, a partir deste evento.
InteractionStatusUpdate
Nenhuma descrição informada.
Sempre defina como "interaction.status_update".
Nenhuma descrição informada.
Nenhuma descrição informada.
Valores possíveis:
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
O token event_id a ser usado para retomar o fluxo de interação, a partir deste evento.
ContentStart
Nenhuma descrição informada.
Sempre defina como "content.start".
Nenhuma descrição informada.
Nenhuma descrição informada.
O token event_id a ser usado para retomar o fluxo de interação, a partir deste evento.
ContentDelta
Nenhuma descrição informada.
Sempre defina como "content.delta".
Nenhuma descrição informada.
delta ContentDeltaData (obrigatório)
Nenhuma descrição informada.
Tipos possíveis
Discriminador polimórfico: type
TextDelta
Nenhuma descrição informada.
Sempre defina como "text".
Nenhuma descrição informada.
ImageDelta
Nenhuma descrição informada.
Sempre defina como "image".
Nenhuma descrição informada.
Nenhuma descrição informada.
Nenhuma descrição informada.
Valores possíveis:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (opcional)
A resolução da mídia.
Valores possíveis:
-
low -
medium -
high -
ultra_high
AudioDelta
Nenhuma descrição informada.
Sempre defina como "audio".
Nenhuma descrição informada.
Nenhuma descrição informada.
Nenhuma descrição informada.
Valores possíveis:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
A taxa de amostragem do áudio.
O número de canais de áudio.
DocumentDelta
Nenhuma descrição informada.
Sempre defina como "document".
Nenhuma descrição informada.
Nenhuma descrição informada.
Nenhuma descrição informada.
Valores possíveis:
-
application/pdf
VideoDelta
Nenhuma descrição informada.
Sempre defina como "video".
Nenhuma descrição informada.
Nenhuma descrição informada.
Nenhuma descrição informada.
Valores possíveis:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
resolution MediaResolution (opcional)
A resolução da mídia.
Valores possíveis:
-
low -
medium -
high -
ultra_high
ThoughtSummaryDelta
Nenhuma descrição informada.
Sempre defina como "thought_summary".
content ThoughtSummaryContent (opcional)
Um novo item de resumo a ser adicionado ao pensamento.
Tipos possíveis
Discriminador polimórfico: type
TextContent
Um bloco de conteúdo de texto.
Nenhuma descrição informada.
Sempre defina como "text".
Obrigatório. O conteúdo do texto.
annotations Annotation (opcional)
Informações de citação para conteúdo gerado pelo modelo.
Tipos possíveis
Discriminador polimórfico: type
UrlCitation
Uma anotação de citação de URL.
Nenhuma descrição informada.
Sempre defina como "url_citation".
O URL.
O título do URL.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
FileCitation
Uma anotação de citação de arquivo.
Nenhuma descrição informada.
Sempre defina como "file_citation".
O URI do arquivo.
O nome do arquivo.
Fonte atribuída a uma parte do texto.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
PlaceCitation
Uma anotação de citação de lugar.
Nenhuma descrição informada.
Sempre defina como "place_citation".
O ID do lugar, no formato `places/{place_id}`.
Título do lugar.
Referência de URI do lugar.
review_snippets ReviewSnippet (opcional)
Trechos de avaliações usados para gerar respostas sobre os recursos de um determinado lugar no Google Maps.
Campos
Título da avaliação.
Um link que corresponde à avaliação do usuário no Google Maps.
O ID do snippet de avaliação.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
ImageContent
Um bloco de conteúdo de imagem.
Nenhuma descrição informada.
Sempre defina como "image".
O conteúdo da imagem.
O URI da imagem.
O tipo MIME da imagem.
Valores possíveis:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (opcional)
A resolução da mídia.
Valores possíveis:
-
low -
medium -
high -
ultra_high
ThoughtSignatureDelta
Nenhuma descrição informada.
Sempre defina como "thought_signature".
Assinatura para corresponder à origem do back-end que fará parte da geração.
FunctionCallDelta
Nenhuma descrição informada.
Sempre defina como "function_call".
Nenhuma descrição informada.
Nenhuma descrição informada.
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
CodeExecutionCallDelta
Nenhuma descrição informada.
Sempre defina como "code_execution_call".
arguments CodeExecutionCallArguments (obrigatório)
Nenhuma descrição informada.
Campos
Linguagem de programação do "code".
Valores possíveis:
-
python
O código a ser executado.
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
UrlContextCallDelta
Nenhuma descrição informada.
Sempre defina como "url_context_call".
arguments UrlContextCallArguments (obrigatório)
Nenhuma descrição informada.
Campos
Os URLs a serem buscados.
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
GoogleSearchCallDelta
Nenhuma descrição informada.
Sempre defina como "google_search_call".
argumentos GoogleSearchCallArguments (obrigatório)
Nenhuma descrição informada.
Campos
Consultas de pesquisa na Web para a pesquisa na Web de acompanhamento.
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
McpServerToolCallDelta
Nenhuma descrição informada.
Sempre defina como "mcp_server_tool_call".
Nenhuma descrição informada.
Nenhuma descrição informada.
Nenhuma descrição informada.
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
FileSearchCallDelta
Nenhuma descrição informada.
Sempre defina como "file_search_call".
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
GoogleMapsCallDelta
Nenhuma descrição informada.
Sempre defina como "google_maps_call".
arguments GoogleMapsCallArguments (opcional)
Os argumentos a serem transmitidos para a ferramenta do Google Maps.
Campos
As consultas a serem executadas.
Obrigatório. Um ID exclusivo para essa chamada de função específica.
Um hash de assinatura para validação de back-end.
FunctionResultDelta
Nenhuma descrição informada.
Sempre defina como "function_result".
Nenhuma descrição informada.
Nenhuma descrição informada.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
Nenhuma descrição informada.
CodeExecutionResultDelta
Nenhuma descrição informada.
Sempre defina como "code_execution_result".
Nenhuma descrição informada.
Nenhuma descrição informada.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
UrlContextResultDelta
Nenhuma descrição informada.
Sempre defina como "url_context_result".
result UrlContextResult (obrigatório)
Nenhuma descrição informada.
Campos
O URL buscado.
O status da recuperação do URL.
Valores possíveis:
-
success -
error -
paywall -
unsafe
Nenhuma descrição informada.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
GoogleSearchResultDelta
Nenhuma descrição informada.
Sempre defina como "google_search_result".
result GoogleSearchResult (obrigatório)
Nenhuma descrição informada.
Campos
Snippet de conteúdo da Web que pode ser incorporado a uma página da Web ou a uma WebView de app.
Nenhuma descrição informada.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
McpServerToolResultDelta
Nenhuma descrição informada.
Sempre defina como "mcp_server_tool_result".
Nenhuma descrição informada.
Nenhuma descrição informada.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
Nenhuma descrição informada.
FileSearchResultDelta
Nenhuma descrição informada.
Sempre defina como "file_search_result".
result FileSearchResult (obrigatório)
Nenhuma descrição informada.
Campos
Metadados fornecidos pelo usuário sobre o FileSearchResult.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
GoogleMapsResultDelta
Nenhuma descrição informada.
Sempre defina como "google_maps_result".
result GoogleMapsResult (opcional)
Os resultados do Google Maps.
Campos
places Places (opcional)
Os lugares encontrados.
Campos
O ID do lugar, no formato `places/{place_id}`.
Título do lugar.
Referência de URI do lugar.
review_snippets ReviewSnippet (opcional)
Trechos de avaliações usados para gerar respostas sobre os recursos de um determinado lugar no Google Maps.
Campos
Título da avaliação.
Um link que corresponde à avaliação do usuário no Google Maps.
O ID do snippet de avaliação.
Nome do recurso do token de contexto do widget do Google Maps.
Obrigatório. ID para corresponder ao ID do bloco de chamada de função.
Um hash de assinatura para validação de back-end.
TextAnnotationDelta
Nenhuma descrição informada.
Sempre defina como "text_annotation".
annotations Annotation (opcional)
Informações de citação para conteúdo gerado pelo modelo.
Tipos possíveis
Discriminador polimórfico: type
UrlCitation
Uma anotação de citação de URL.
Nenhuma descrição informada.
Sempre defina como "url_citation".
O URL.
O título do URL.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
FileCitation
Uma anotação de citação de arquivo.
Nenhuma descrição informada.
Sempre defina como "file_citation".
O URI do arquivo.
O nome do arquivo.
Fonte atribuída a uma parte do texto.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
PlaceCitation
Uma anotação de citação de lugar.
Nenhuma descrição informada.
Sempre defina como "place_citation".
O ID do lugar, no formato `places/{place_id}`.
Título do lugar.
Referência de URI do lugar.
review_snippets ReviewSnippet (opcional)
Trechos de avaliações usados para gerar respostas sobre os recursos de um determinado lugar no Google Maps.
Campos
Título da avaliação.
Um link que corresponde à avaliação do usuário no Google Maps.
O ID do snippet de avaliação.
Início do segmento da resposta atribuído a esta fonte. O índice indica o início do segmento, medido em bytes.
Fim do segmento atribuído, exclusivo.
O token event_id a ser usado para retomar o fluxo de interação, a partir deste evento.
ContentStop
Nenhuma descrição informada.
Sempre defina como "content.stop".
Nenhuma descrição informada.
O token event_id a ser usado para retomar o fluxo de interação, a partir deste evento.
ErrorEvent
Nenhuma descrição informada.
Sempre defina como "error".
error Error (opcional)
Nenhuma descrição informada.
Campos
Um URI que identifica o tipo de erro.
Uma mensagem de erro legível.
O token event_id a ser usado para retomar o fluxo de interação, a partir deste evento.
Exemplos
Início da interação
{ "event_type": "interaction.start", "interaction": { "id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM", "model": "gemini-3-flash-preview", "object": "interaction", "status": "in_progress" } }
Interação concluída
{ "event_type": "interaction.complete", "interaction": { "created": "2025-12-09T18:45:40Z", "id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM", "model": "gemini-3-flash-preview", "object": "interaction", "role": "model", "status": "completed", "updated": "2025-12-09T18:45:40Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 11 } ], "total_cached_tokens": 0, "total_input_tokens": 11, "total_output_tokens": 364, "total_thought_tokens": 1120, "total_tokens": 1495, "total_tool_use_tokens": 0 } } }
Atualização do status da interação
{ "event_type": "interaction.status_update", "interaction_id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM", "status": "in_progress" }
Início do conteúdo
{ "event_type": "content.start", "content": { "type": "text" }, "index": 1 }
Delta de conteúdo
{ "event_type": "content.delta", "delta": { "type": "text", "text": "Elara\u2019s life was a symphony of quiet moments. A librarian, she found solace in the hushed aisles, the scent of aged paper, and the predictable rhythm of her days. Her small apartment, meticulously ordered, reflected this internal calm, save" }, "index": 1 }
Parada de conteúdo
{ "event_type": "content.stop", "index": 1 }
Evento de erro
{ "event_type": "error", "error": { "message": "Failed to get completed interaction: Result not found.", "code": "not_found" } }