L'API Interactions est désormais en disponibilité générale. Nous vous recommandons d'utiliser cette API pour accéder à toutes les dernières fonctionnalités et tous les derniers modèles.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini API

L'API Gemini Interactions est une API expérimentale qui permet aux développeurs de créer des applications d'IA générative à l'aide des modèles Gemini. Gemini est notre modèle le plus performant, entièrement conçu pour être multimodal. Il peut généraliser, comprendre avec fluidité, traiter et combiner différents supports d'informations, dont le texte, le code, l'audio, l'image et la vidéo. Vous pouvez utiliser l'API Gemini pour des cas d'utilisation tels que le raisonnement sur du texte et des images, la génération de contenu, les agents de dialogue, les systèmes de synthèse et de classification, et plus encore.

Afficher au format Markdown Afficher la spécification OpenAPI

Créer une interaction

post https://generativelanguage.googleapis.com/v1beta/interactions

Crée une interaction.

Corps de la requête
Réponse

Corps de la requête

Le corps de la requête contient des données présentant la structure suivante :

model ModelOption (facultatif)

Nom du `Model` utilisé pour générer l'interaction.
Obligatoire si l'attribut "agent" n'est pas fourni.

Valeurs possibles :

gemini-2.5-computer-use-preview-10-2025
Modèle de capacité agentique conçu pour l'interaction directe avec l'interface, permettant à Gemini de percevoir et de parcourir les environnements numériques.
gemini-2.5-flash
Notre premier modèle de raisonnement hybride, qui accepte une fenêtre de contexte d'un million de jetons et dispose de budgets de réflexion.
gemini-2.5-flash-image
Notre modèle natif de génération d'images, optimisé pour la vitesse, la flexibilité et la compréhension contextuelle. Les entrées et sorties de texte sont facturées au même prix que Gemini 2.5 Flash.
gemini-2.5-flash-lite
Notre modèle le plus petit et le plus économique, conçu pour une utilisation à grande échelle.
gemini-2.5-flash-lite-preview-09-2025
Dernier modèle basé sur Gemini 2.5 Flash-Lite, optimisé pour la rentabilité, le haut débit et la qualité.
gemini-2.5-flash-native-audio-preview-12-2025
Nos modèles audio natifs sont optimisés pour des sorties audio de meilleure qualité, avec un rythme, une voix, une verbosité et une humeur plus naturels.
gemini-2.5-flash-preview-09-2025
Dernier modèle basé sur le modèle 2.5 Flash. La version Preview de 2.5 Flash est idéale pour les tâches de traitement à grande échelle, à faible latence et à volume élevé qui nécessitent de la réflexion, ainsi que pour les cas d'utilisation agentiques.
gemini-2.5-flash-preview-tts
Notre modèle de synthèse vocale 2.5 Flash est optimisé pour générer des voix puissantes, contrôlables et à faible latence.
gemini-2.5-pro
Notre modèle polyvalent de pointe, qui excelle dans les tâches de codage et de raisonnement complexe.
gemini-2.5-pro-preview-tts
Notre modèle audio de synthèse vocale 2.5 Pro est optimisé pour générer des voix puissantes et à faible latence, afin d'obtenir des résultats plus naturels et des requêtes plus faciles à orienter.
gemini-3-flash-preview
Notre modèle le plus intelligent, conçu pour la rapidité, qui combine une intelligence de pointe avec des capacités de recherche et d'ancrage supérieures.
gemini-3-pro-image-preview
Modèle de pointe pour la génération et la retouche d'images.
gemini-3-pro-preview
Notre modèle le plus intelligent, doté de capacités de raisonnement et de compréhension multimodale de pointe, ainsi que de puissantes fonctionnalités de codage agentique et de vibe coding.
gemini-3.1-pro-preview
Notre dernier modèle de raisonnement SOTA, doté d'une profondeur et d'une nuance sans précédent, ainsi que de puissantes capacités de compréhension multimodale et de codage.
gemini-3.1-flash-image-preview
Intelligence visuelle de niveau professionnel, efficacité de Gemini Flash et capacités de génération ancrées dans la réalité.
gemini-3.1-flash-lite-preview
Notre modèle le plus économique, optimisé pour les tâches agentiques à volume élevé, la traduction et le traitement de données simples.
gemini-3.1-flash-tts-preview
Gemini 3.1 Flash TTS : génération vocale puissante et à faible latence. Profitez de résultats naturels, d'invites orientables et de nouvelles balises audio expressives pour un contrôle précis de la narration.
lyria-3-clip-preview
Notre modèle de génération de musique à faible latence est optimisé pour les extraits audio haute fidélité et le contrôle rythmique précis.
lyria-3-pro-preview
Notre modèle génératif avancé pour les chansons complètes, avec une compréhension approfondie de la composition, optimisé pour un contrôle précis de la structure et des transitions complexes dans différents styles musicaux.

agent AgentOption (facultatif)

Nom de l'agent utilisé pour générer l'interaction.
Obligatoire si `model` n'est pas fourni.

Valeurs possibles :

deep-research-pro-preview-12-2025
Agent Gemini Deep Research
deep-research-preview-04-2026
Agent Gemini Deep Research
deep-research-max-preview-04-2026
Agent Gemini Deep Research Max

input Content ou tableau (Content) ou tableau (Step) ou chaîne (obligatoire)

Entrées de l'interaction (communes au modèle et à l'agent).

system_instruction string (facultatif)

Instruction système pour l'interaction.

tools array (Tool) (facultatif)

Liste des déclarations d'outils que le modèle peut appeler lors de l'interaction.

response_format ResponseFormat ou ResponseFormatList (facultatif)

Garantit que la réponse générée est un objet JSON conforme au schéma JSON spécifié dans ce champ.

response_mime_type string (facultatif)

Type MIME de la réponse. Obligatoire si response_format est défini.

stream boolean (facultatif)

Uniquement en entrée. Indique si l'interaction sera diffusée en streaming.

store boolean (facultatif)

Uniquement en entrée. Indique si la réponse et la requête doivent être stockées pour être récupérées ultérieurement.

background boolean (facultatif)

Uniquement en entrée. Indique si l'interaction du modèle doit s'exécuter en arrière-plan.

generation_config GenerationConfig (facultatif)

Configuration du modèle :
paramètres de configuration pour l'interaction avec le modèle.
Alternative à `agent_config`. Ne s'applique que lorsque `model` est défini.

Champs

temperature number (facultatif)

Contrôle le caractère aléatoire de la sortie.

top_p number (facultatif)

Probabilité cumulée maximale des jetons à prendre en compte lors de l'échantillonnage.

seed integer (facultatif)

Graine utilisée dans le décodage pour la reproductibilité.

stop_sequences array (string) (optional)

Liste des séquences de caractères qui arrêteront l'interaction de sortie.

thinking_level ThinkingLevel (facultatif)

Niveau de jetons de réflexion que le modèle doit générer.

Valeurs possibles :

minimal
low
medium
high

thinking_summaries ThinkingSummaries (facultatif)

Indique si la réponse doit inclure des résumés de la réflexion.

Valeurs possibles :

auto
none

max_output_tokens integer (facultatif)

Nombre maximal de jetons à inclure dans la réponse.

speech_config SpeechConfig (facultatif)

Configuration pour l'interaction vocale.

Champs

voice string (facultatif)

La voix de l'orateur.

language string (facultatif)

Langue du discours.

speaker string (facultatif)

Nom de l'intervenant. Il doit correspondre à celui indiqué dans la requête.

image_config ImageConfig (facultatif)

Configuration de l'interaction avec l'image.

Champs

aspect_ratio enum (string) (optional)

Aucune description fournie.

Valeurs possibles :

1:1
2:3
3:2
3:4
4:3
4:5
5:4
9:16
16:9
21:9
1:8
8:1
1:4
4:1

image_size enum (string) (facultatif)

Aucune description fournie.

Valeurs possibles :

1K
2K
4K
512

tool_choice ToolChoiceConfig ou ToolChoiceType (facultatif)

Configuration du choix de l'outil.

agent_config object (facultatif)

Configuration de l'agent
Configuration de l'agent.
Alternative à `generation_config`. Ne s'applique que lorsque `agent` est défini.

Types possibles

Discriminant polymorphe : type

DynamicAgentConfig

Configuration des agents dynamiques.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "dynamic".

DeepResearchAgentConfig

Configuration de l'agent Deep Research.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "deep-research".

thinking_summaries ThinkingSummaries (facultatif)

Indique si la réponse doit inclure des résumés de la réflexion.

Valeurs possibles :

auto
none

visualization enum (string) (facultatif)

Indique si la réponse doit inclure des visualisations.

Valeurs possibles :

off
auto

collaborative_planning boolean (facultatif)

Active la planification human-in-the-loop pour l'agent Deep Research. Si la valeur est définie sur "true", l'agent Deep Research fournira un plan de recherche dans sa réponse. L'agent ne poursuivra la procédure que si l'utilisateur confirme le forfait au prochain tour.

previous_interaction_id string (facultatif)

ID de l'interaction précédente, le cas échéant.

response_modalities ResponseModality (facultatif)

Modalités de réponse demandées (TEXT, IMAGE, AUDIO).

Valeurs possibles :

text
image
audio
video
document

service_tier ServiceTier (facultatif)

Niveau de service de l'interaction.

Valeurs possibles :

flex
standard
priority

webhook_config WebhookConfig (facultatif)

Facultatif. Configuration du webhook pour recevoir des notifications lorsque l'interaction est terminée.

Champs

uris array (string) (facultatif)

Facultatif. Si elles sont définies, ces URI de webhook seront utilisés pour les événements de webhook au lieu des webhooks enregistrés.

user_metadata object (facultatif)

Facultatif. Métadonnées utilisateur qui seront renvoyées à chaque émission d'événement aux webhooks.

Réponse

Renvoie une ressource Interaction.

Demande simple

Exemple de réponse

{
  "created": "2025-11-26T12:25:15Z",
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "object": "interaction",
  "steps": [
    {
      "type": "model_output",
      "content": [
        {
          "type": "text",
          "text": "Hello! I'm functioning perfectly and ready to assist you.\n\nHow are you doing today?"
        }
      ]
    }
  ],
  "status": "completed",
  "updated": "2025-11-26T12:25:15Z",
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 7
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 7,
    "total_output_tokens": 20,
    "total_thought_tokens": 22,
    "total_tokens": 49,
    "total_tool_use_tokens": 0
  }
}

Multitours

Exemple de réponse

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "steps": [
    {
      "type": "model_output",
      "content": [
        {
          "type": "text",
          "text": "The capital of France is Paris."
        }
      ]
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 50
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 50,
    "total_output_tokens": 10,
    "total_thought_tokens": 0,
    "total_tokens": 60,
    "total_tool_use_tokens": 0
  }
}

Image d'entrée

Exemple de réponse

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "steps": [
    {
      "type": "model_output",
      "content": [
        {
          "type": "text",
          "text": "A white humanoid robot with glowing blue eyes stands holding a red skateboard."
        }
      ]
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 10
      },
      {
        "modality": "image",
        "tokens": 258
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 268,
    "total_output_tokens": 20,
    "total_thought_tokens": 0,
    "total_tokens": 288,
    "total_tool_use_tokens": 0
  }
}

Appel de fonction

Exemple de réponse

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "requires_action",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "steps": [
    {
      "type": "function_call",
      "id": "gth23981",
      "name": "get_weather",
      "arguments": {
        "location": "Boston, MA"
      }
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 100
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 100,
    "total_output_tokens": 25,
    "total_thought_tokens": 0,
    "total_tokens": 125,
    "total_tool_use_tokens": 50
  }
}

Deep Research

Exemple de réponse

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "agent": "deep-research-pro-preview-12-2025",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "steps": [
    {
      "type": "model_output",
      "content": [
        {
          "type": "text",
          "text": "Here is a comprehensive research report on the current state of cancer research..."
        }
      ]
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 20
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 20,
    "total_output_tokens": 1000,
    "total_thought_tokens": 500,
    "total_tokens": 1520,
    "total_tool_use_tokens": 0
  }
}

Récupérer une interaction

get https://generativelanguage.googleapis.com/v1beta/interactions/{id}

Récupère tous les détails d'une interaction en fonction de son `Interaction.id`.

Paramètres de chemin d'accès / de requête
Réponse

Paramètres de chemin / de requête

id chaîne (obligatoire)

Identifiant unique de l'interaction à récupérer.

stream boolean (facultatif)

Si la valeur est définie sur "true", le contenu généré sera diffusé de manière incrémentielle.

Valeur par défaut : False

last_event_id string (facultatif)

Facultatif. Si cette option est définie, le flux d'interaction reprend à partir du prochain bloc après l'événement marqué par l'ID d'événement. Ne peut être utilisé que si "stream" est défini sur "true".

include_input boolean (facultatif)

Si la valeur est définie sur "true", l'entrée est incluse dans la réponse.

Valeur par défaut : False

api_version string (facultatif)

Version de l'API à utiliser.

Réponse

Renvoie une ressource Interaction.

Obtenir une interaction

Exemple de réponse

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:25:15Z",
  "updated": "2025-11-26T12:25:15Z",
  "steps": [
    {
      "type": "model_output",
      "content": [
        {
          "type": "text",
          "text": "I'm doing great, thank you for asking! How can I help you today?"
        }
      ]
    }
  ]
}

Supprimer une interaction

delete https://generativelanguage.googleapis.com/v1beta/interactions/{id}

Supprime l'interaction par ID.

Paramètres de chemin d'accès / de requête
Réponse

Paramètres de chemin / de requête

id chaîne (obligatoire)

Identifiant unique de l'interaction à supprimer.

api_version string (facultatif)

Version de l'API à utiliser.

Réponse

Si l'opération réussit, la réponse est vide.

Supprimer une interaction

Annuler une interaction

post https://generativelanguage.googleapis.com/v1beta/interactions/{id}/cancel

Annule une interaction par ID. Cela ne s'applique qu'aux interactions en arrière-plan qui sont toujours en cours d'exécution.

Paramètres de chemin d'accès / de requête
Réponse

Paramètres de chemin / de requête

id chaîne (obligatoire)

Identifiant unique de l'interaction à annuler.

api_version string (facultatif)

Version de l'API à utiliser.

Réponse

Renvoie une ressource Interaction.

Annuler l'interaction

Exemple de réponse

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "agent": "deep-research-pro-preview-12-2025",
  "status": "cancelled",
  "object": "interaction",
  "created": "2025-11-26T12:25:15Z",
  "updated": "2025-11-26T12:25:15Z"
}

Ressources

Interaction

Ressource Interaction.

Champs

model ModelOption (facultatif)

Nom du `Model` utilisé pour générer l'interaction.

Valeurs possibles :

gemini-2.5-computer-use-preview-10-2025
Modèle de capacité agentique conçu pour l'interaction directe avec l'interface, permettant à Gemini de percevoir et de parcourir les environnements numériques.
gemini-2.5-flash
Notre premier modèle de raisonnement hybride, qui accepte une fenêtre de contexte d'un million de jetons et dispose de budgets de réflexion.
gemini-2.5-flash-image
Notre modèle natif de génération d'images, optimisé pour la vitesse, la flexibilité et la compréhension contextuelle. Les entrées et sorties de texte sont facturées au même prix que Gemini 2.5 Flash.
gemini-2.5-flash-lite
Notre modèle le plus petit et le plus économique, conçu pour une utilisation à grande échelle.
gemini-2.5-flash-lite-preview-09-2025
Dernier modèle basé sur Gemini 2.5 Flash-Lite, optimisé pour la rentabilité, le haut débit et la qualité.
gemini-2.5-flash-native-audio-preview-12-2025
Nos modèles audio natifs sont optimisés pour des sorties audio de meilleure qualité, avec un rythme, une voix, une verbosité et une humeur plus naturels.
gemini-2.5-flash-preview-09-2025
Dernier modèle basé sur le modèle 2.5 Flash. La version Preview de 2.5 Flash est idéale pour les tâches de traitement à grande échelle, à faible latence et à volume élevé qui nécessitent de la réflexion, ainsi que pour les cas d'utilisation agentiques.
gemini-2.5-flash-preview-tts
Notre modèle de synthèse vocale 2.5 Flash est optimisé pour générer des voix puissantes, contrôlables et à faible latence.
gemini-2.5-pro
Notre modèle polyvalent de pointe, qui excelle dans les tâches de codage et de raisonnement complexe.
gemini-2.5-pro-preview-tts
Notre modèle audio de synthèse vocale 2.5 Pro est optimisé pour générer des voix puissantes et à faible latence, afin d'obtenir des résultats plus naturels et des requêtes plus faciles à orienter.
gemini-3-flash-preview
Notre modèle le plus intelligent, conçu pour la rapidité, qui combine une intelligence de pointe avec des capacités de recherche et d'ancrage supérieures.
gemini-3-pro-image-preview
Modèle de pointe pour la génération et la retouche d'images.
gemini-3-pro-preview
Notre modèle le plus intelligent, doté de capacités de raisonnement et de compréhension multimodale de pointe, ainsi que de puissantes fonctionnalités de codage agentique et de vibe coding.
gemini-3.1-pro-preview
Notre dernier modèle de raisonnement SOTA, doté d'une profondeur et d'une nuance sans précédent, ainsi que de puissantes capacités de compréhension multimodale et de codage.
gemini-3.1-flash-image-preview
Intelligence visuelle de niveau professionnel, efficacité de Gemini Flash et capacités de génération ancrées dans la réalité.
gemini-3.1-flash-lite-preview
Notre modèle le plus économique, optimisé pour les tâches agentiques à volume élevé, la traduction et le traitement de données simples.
gemini-3.1-flash-tts-preview
Gemini 3.1 Flash TTS : génération vocale puissante et à faible latence. Profitez de résultats naturels, d'invites orientables et de nouvelles balises audio expressives pour un contrôle précis de la narration.
lyria-3-clip-preview
Notre modèle de génération de musique à faible latence est optimisé pour les extraits audio haute fidélité et le contrôle rythmique précis.
lyria-3-pro-preview
Notre modèle génératif avancé pour les chansons complètes, avec une compréhension approfondie de la composition, optimisé pour un contrôle précis de la structure et des transitions complexes dans différents styles musicaux.

agent AgentOption (facultatif)

Nom de l'agent utilisé pour générer l'interaction.

Valeurs possibles :

deep-research-pro-preview-12-2025
Agent Gemini Deep Research
deep-research-preview-04-2026
Agent Gemini Deep Research
deep-research-max-preview-04-2026
Agent Gemini Deep Research Max

id chaîne (facultatif)

Obligatoire. Uniquement en sortie. Identifiant unique de la fin de l'interaction.

status enum (string) (facultatif)

Obligatoire. Uniquement en sortie. État de l'interaction.

Valeurs possibles :

in_progress
requires_action
completed
failed
cancelled
incomplete

created string (facultatif)

Obligatoire. Uniquement en sortie. Heure à laquelle la réponse a été créée, au format ISO 8601 (AAAA-MM-JJThh:mm:ssZ).

updated string (facultatif)

Obligatoire. Uniquement en sortie. Heure à laquelle la réponse a été mise à jour pour la dernière fois au format ISO 8601 (AAAA-MM-JJThh:mm:ssZ).

role string (facultatif)

Uniquement en sortie. Rôle de l'interaction.

system_instruction string (facultatif)

Instruction système pour l'interaction.

tools array (Tool) (facultatif)

Liste des déclarations d'outils que le modèle peut appeler lors de l'interaction.

usage Usage (facultatif)

Uniquement en sortie. Statistiques sur l'utilisation des jetons de la demande d'interaction.

Champs

total_input_tokens integer (optional)

Nombre de jetons dans le prompt (contexte).

input_tokens_by_modality ModalityTokens (facultatif)

Répartition de l'utilisation des jetons d'entrée par modalité.

Champs

modality ResponseModality (facultatif)

Modalité associée au nombre de jetons.

Valeurs possibles :

text
image
audio
video
document

tokens integer (facultatif)

Nombre de jetons pour la modalité.

total_cached_tokens integer (optional)

Nombre de jetons dans la partie mise en cache de la requête (le contenu mis en cache).

cached_tokens_by_modality ModalityTokens (facultatif)

Répartition de l'utilisation des jetons mis en cache par modalité.

Champs

modality ResponseModality (facultatif)

Modalité associée au nombre de jetons.

Valeurs possibles :

text
image
audio
video
document

tokens integer (facultatif)

Nombre de jetons pour la modalité.

total_output_tokens integer (facultatif)

Nombre total de jetons dans toutes les réponses générées.

output_tokens_by_modality ModalityTokens (facultatif)

Répartition de l'utilisation des jetons de sortie par modalité.

Champs

modality ResponseModality (facultatif)

Modalité associée au nombre de jetons.

Valeurs possibles :

text
image
audio
video
document

tokens integer (facultatif)

Nombre de jetons pour la modalité.

total_tool_use_tokens integer (optional)

Nombre de jetons présents dans la ou les invites d'utilisation d'outils.

tool_use_tokens_by_modality ModalityTokens (facultatif)

Répartition de l'utilisation des jetons d'utilisation des outils par modalité.

Champs

modality ResponseModality (facultatif)

Modalité associée au nombre de jetons.

Valeurs possibles :

text
image
audio
video
document

tokens integer (facultatif)

Nombre de jetons pour la modalité.

total_thought_tokens integer (facultatif)

Nombre de jetons de pensées pour les modèles à raisonnement.

total_tokens integer (optional)

Nombre total de jetons pour la requête d'interaction (requête + réponses + autres jetons internes).

grounding_tool_count GroundingToolCount (facultatif)

Nombre d'outils d'ancrage.

Champs

type enum (string) (facultatif)

Type d'outil d'ancrage associé au nombre.

Valeurs possibles :

google_search
google_maps
retrieval

count integer (facultatif)

Nombre d'outils d'ancrage.

response_modalities ResponseModality (facultatif)

Modalités de réponse demandées (TEXT, IMAGE, AUDIO).

Valeurs possibles :

text
image
audio
video
document

response_mime_type string (facultatif)

Type MIME de la réponse. Obligatoire si response_format est défini.

previous_interaction_id string (facultatif)

ID de l'interaction précédente, le cas échéant.

service_tier ServiceTier (facultatif)

Niveau de service de l'interaction.

Valeurs possibles :

flex
standard
priority

webhook_config WebhookConfig (facultatif)

Facultatif. Configuration du webhook pour recevoir des notifications lorsque l'interaction est terminée.

Champs

uris array (string) (facultatif)

Facultatif. Si elles sont définies, ces URI de webhook seront utilisés pour les événements de webhook au lieu des webhooks enregistrés.

user_metadata object (facultatif)

Facultatif. Métadonnées utilisateur qui seront renvoyées à chaque émission d'événement aux webhooks.

steps Step (optional)

Uniquement en sortie. Étapes qui composent l'interaction.

Types possibles

Discriminant polymorphe : type

UserInputStep

Entrée fournie par l'utilisateur.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "user_input".

content array (Content) (facultatif)

Aucune description fournie.

ModelOutputStep

Sortie générée par le modèle.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "model_output".

content array (Content) (facultatif)

Aucune description fournie.

ThoughtStep

Une étape de réflexion.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "thought".

signature string (facultatif)

Hachage de signature pour la validation du backend.

summary ThoughtSummaryContent (facultatif)

Un résumé de la pensée.

Types possibles

Discriminant polymorphe : type

TextContent

Bloc de contenu textuel.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "text".

text string (obligatoire)

Obligatoire. Contenu textuel.

annotations Annotation (optional)

Informations de citation pour le contenu généré par le modèle.

Types possibles

Discriminant polymorphe : type

UrlCitation

Annotation de citation d'URL.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "url_citation".

url string (optional)

URL.

title string (facultatif)

Titre de l'URL.

start_index integer (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer (facultatif)

Fin du segment attribué (exclusif).

FileCitation

Annotation de citation de fichier.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "file_citation".

document_uri string (optional)

URI du fichier.

file_name string (facultatif)

Nom du fichier.

source string (facultatif)

Source attribuée à une partie du texte.

custom_metadata object (facultatif)

Métadonnées fournies par l'utilisateur sur le contexte récupéré.

page_number integer (facultatif)

Numéro de page du document cité, le cas échéant.

media_id string (facultatif)

ID du média en cas de citation d'image, le cas échéant.

start_index integer (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer (facultatif)

Fin du segment attribué (exclusif).

PlaceCitation

Annotation de citation d'un lieu.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "place_citation".

place_id string (facultatif)

ID du lieu, au format `places/{place_id}`.

name string (facultatif)

Titre du lieu.

url string (optional)

Référence URI du lieu.

review_snippets ReviewSnippet (facultatif)

Extraits d'avis utilisés pour générer des réponses sur les caractéristiques d'un lieu donné dans Google Maps.

Champs

title string (facultatif)

Titre de l'avis.

url string (optional)

Lien correspondant à l'avis de l'utilisateur sur Google Maps.

review_id string (facultatif)

ID de l'extrait d'avis.

start_index integer (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer (facultatif)

Fin du segment attribué (exclusif).

ImageContent

Bloc de contenu d'image.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "image".

data string (facultatif)

Contenu de l'image.

uri string (facultatif)

URI de l'image.

mime_type enum (string) (optional)

Type MIME de l'image.

Valeurs possibles :

image/png
image/jpeg
image/webp
image/heic
image/heif
image/gif
image/bmp
image/tiff

resolution MediaResolution (optional)

Résolution du contenu multimédia.

Valeurs possibles :

low
medium
high
ultra_high

FunctionCallStep

Étape d'appel de fonction.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "function_call".

name string (obligatoire)

Obligatoire. Nom de l'outil à appeler.

arguments object (obligatoire)

Obligatoire. Arguments à transmettre à la fonction.

id chaîne (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string (facultatif)

Hachage de signature pour la validation du backend.

CodeExecutionCallStep

Étape d'appel d'exécution du code.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "code_execution_call".

arguments CodeExecutionCallStepArguments (obligatoire)

Obligatoire. Arguments à transmettre à l'exécution du code.

Champs

language enum (string) (facultatif)

Langage de programmation du code.

Valeurs possibles :

python

code string (facultatif)

Code à exécuter.

id chaîne (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string (facultatif)

Hachage de signature pour la validation du backend.

UrlContextCallStep

Étape d'appel du contexte d'URL.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "url_context_call".

arguments UrlContextCallStepArguments (required)

Obligatoire. Arguments à transmettre au contexte de l'URL.

Champs

urls array (string) (optional)

URL à récupérer.

id chaîne (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string (facultatif)

Hachage de signature pour la validation du backend.

McpServerToolCallStep

Étape d'appel d'outil MCPServer.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "mcp_server_tool_call".

name string (obligatoire)

Obligatoire. Nom de l'outil appelé.

server_name string (required)

Obligatoire. Nom du serveur MCP utilisé.

arguments object (obligatoire)

Obligatoire. Objet JSON des arguments de la fonction.

id chaîne (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string (facultatif)

Hachage de signature pour la validation du backend.

GoogleSearchCallStep

Étape d'appel de la recherche Google.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "google_search_call".

arguments GoogleSearchCallStepArguments (obligatoire)

Obligatoire. Arguments à transmettre à la recherche Google.

Champs

queries array (string) (facultatif)

Requêtes de recherche sur le Web pour la recherche sur le Web de suivi.

search_type enum (string) (optional)

Type d'ancrage avec la recherche activé.

Valeurs possibles :

web_search
image_search
enterprise_web_search

id chaîne (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string (facultatif)

Hachage de signature pour la validation du backend.

FileSearchCallStep

Étape d'appel de recherche de fichiers.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "file_search_call".

id chaîne (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string (facultatif)

Hachage de signature pour la validation du backend.

GoogleMapsCallStep

Étape d'appel Google Maps.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "google_maps_call".

arguments GoogleMapsCallStepArguments (facultatif)

Arguments à transmettre à l'outil Google Maps.

Champs

queries array (string) (facultatif)

Requêtes à exécuter.

id chaîne (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string (facultatif)

Hachage de signature pour la validation du backend.

FunctionResultStep

Résultat d'un appel d'outil de fonction.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "function_result".

name string (facultatif)

Nom de l'outil appelé.

is_error boolean (facultatif)

Indique si l'appel d'outil a entraîné une erreur.

call_id string (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string (facultatif)

Hachage de signature pour la validation du backend.

result array (FunctionResultSubcontent) or string (required)

Résultat de l'appel d'outil.

CodeExecutionResultStep

Étape du résultat de l'exécution du code.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "code_execution_result".

result string (obligatoire)

Obligatoire. Sortie de l'exécution du code.

is_error boolean (facultatif)

Indique si l'exécution du code a entraîné une erreur.

call_id string (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string (facultatif)

Hachage de signature pour la validation du backend.

UrlContextResultStep

Étape de résultat du contexte d'URL.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "url_context_result".

result UrlContextResultItem (obligatoire)

Obligatoire. Résultats du contexte de l'URL.

Champs

url string (optional)

URL récupérée.

status enum (string) (facultatif)

État de la récupération de l'URL.

Valeurs possibles :

success
error
paywall
unsafe

is_error boolean (facultatif)

Indique si le contexte de l'URL a entraîné une erreur.

call_id string (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string (facultatif)

Hachage de signature pour la validation du backend.

GoogleSearchResultStep

Étape de résultat de recherche Google.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "google_search_result".

result GoogleSearchResultItem (obligatoire)

Obligatoire. Résultats de la recherche Google.

Champs

search_suggestions string (facultatif)

Extrait de contenu Web pouvant être intégré à une page Web ou à une WebView d'application.

is_error boolean (facultatif)

Indique si la recherche Google a généré une erreur.

call_id string (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string (facultatif)

Hachage de signature pour la validation du backend.

McpServerToolResultStep

Étape de résultat de l'outil MCPServer.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "mcp_server_tool_result".

name string (facultatif)

Nom de l'outil appelé pour cet appel d'outil spécifique.

server_name string (facultatif)

Nom du serveur MCP utilisé.

call_id string (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string (facultatif)

Hachage de signature pour la validation du backend.

result array (FunctionResultSubcontent) or string (required)

Résultat de l'appel du serveur MCP. Il peut s'agir de texte simple ou de contenu enrichi.

FileSearchResultStep

Étape "Résultat de recherche de fichier".

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "file_search_result".

call_id string (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string (facultatif)

Hachage de signature pour la validation du backend.

GoogleMapsResultStep

Étape de résultat Google Maps.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "google_maps_result".

result GoogleMapsResultItem (obligatoire)

Aucune description fournie.

Champs

places GoogleMapsResultPlaces (facultatif)

Aucune description fournie.

Champs

place_id string (facultatif)

Aucune description fournie.

name string (facultatif)

Aucune description fournie.

url string (optional)

Aucune description fournie.

review_snippets ReviewSnippet (facultatif)

Aucune description fournie.

Champs

title string (facultatif)

Titre de l'avis.

url string (optional)

Lien correspondant à l'avis de l'utilisateur sur Google Maps.

review_id string (facultatif)

ID de l'extrait d'avis.

widget_context_token string (facultatif)

Aucune description fournie.

call_id string (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string (facultatif)

Hachage de signature pour la validation du backend.

input Content ou tableau (Content) ou tableau (Step) ou chaîne (facultatif)

Entrée de l'interaction.

response_format ResponseFormat ou ResponseFormatList (facultatif)

Garantit que la réponse générée est un objet JSON conforme au schéma JSON spécifié dans ce champ.

agent_config object (facultatif)

Paramètres de configuration de l'interaction de l'agent.

Types possibles

Discriminant polymorphe : type

DynamicAgentConfig

Configuration des agents dynamiques.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "dynamic".

DeepResearchAgentConfig

Configuration de l'agent Deep Research.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "deep-research".

thinking_summaries ThinkingSummaries (facultatif)

Indique si la réponse doit inclure des résumés de la réflexion.

Valeurs possibles :

auto
none

visualization enum (string) (facultatif)

Indique si la réponse doit inclure des visualisations.

Valeurs possibles :

off
auto

collaborative_planning boolean (facultatif)

Exemples

Exemple

{
  "created": "2025-12-04T15:01:45Z",
  "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg",
  "model": "gemini-3-flash-preview",
  "object": "interaction",
  "steps": [
    {
      "type": "model_output",
      "content": [
        {
          "type": "text",
          "text": "Hello! I'm doing well, functioning as expected. Thank you for asking! How are you doing today?"
        }
      ]
    }
  ],
  "status": "completed",
  "updated": "2025-12-04T15:01:45Z",
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 7
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 7,
    "total_output_tokens": 23,
    "total_thought_tokens": 49,
    "total_tokens": 79,
    "total_tool_use_tokens": 0
  }
}

Modèles de données

Contenu

Contenu de la réponse.

Types possibles

Discriminant polymorphe : type

TextContent

Bloc de contenu textuel.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "text".

text string (obligatoire)

Obligatoire. Contenu textuel.

annotations Annotation (optional)

Informations de citation pour le contenu généré par le modèle.

Types possibles

Discriminant polymorphe : type

UrlCitation

Annotation de citation d'URL.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "url_citation".

url string (optional)

URL.

title string (facultatif)

Titre de l'URL.

start_index integer (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer (facultatif)

Fin du segment attribué (exclusif).

FileCitation

Annotation de citation de fichier.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "file_citation".

document_uri string (optional)

URI du fichier.

file_name string (facultatif)

Nom du fichier.

source string (facultatif)

Source attribuée à une partie du texte.

custom_metadata object (facultatif)

Métadonnées fournies par l'utilisateur sur le contexte récupéré.

page_number integer (facultatif)

Numéro de page du document cité, le cas échéant.

media_id string (facultatif)

ID du média en cas de citation d'image, le cas échéant.

start_index integer (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer (facultatif)

Fin du segment attribué (exclusif).

PlaceCitation

Annotation de citation d'un lieu.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "place_citation".

place_id string (facultatif)

ID du lieu, au format `places/{place_id}`.

name string (facultatif)

Titre du lieu.

url string (optional)

Référence URI du lieu.

review_snippets ReviewSnippet (facultatif)

Extraits d'avis utilisés pour générer des réponses sur les caractéristiques d'un lieu donné dans Google Maps.

Champs

title string (facultatif)

Titre de l'avis.

url string (optional)

Lien correspondant à l'avis de l'utilisateur sur Google Maps.

review_id string (facultatif)

ID de l'extrait d'avis.

start_index integer (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer (facultatif)

Fin du segment attribué (exclusif).

ImageContent

Bloc de contenu d'image.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "image".

data string (facultatif)

Contenu de l'image.

uri string (facultatif)

URI de l'image.

mime_type enum (string) (optional)

Type MIME de l'image.

Valeurs possibles :

image/png
image/jpeg
image/webp
image/heic
image/heif
image/gif
image/bmp
image/tiff

resolution MediaResolution (optional)

Résolution du contenu multimédia.

Valeurs possibles :

low
medium
high
ultra_high

AudioContent

Bloc de contenu audio.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "audio".

data string (facultatif)

Contenu audio.

uri string (facultatif)

URI de l'élément audio.

mime_type enum (string) (optional)

Type MIME du contenu audio.

Valeurs possibles :

audio/wav
audio/mp3
audio/aiff
audio/aac
audio/ogg
audio/flac
audio/mpeg
audio/m4a
audio/l16
audio/opus
audio/alaw
audio/mulaw

channels integer (facultatif)

Nombre de canaux audio.

sample_rate integer (facultatif)

Taux d'échantillonnage de l'audio.

DocumentContent

Bloc de contenu d'un document.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "document".

data string (facultatif)

Contenu du document.

uri string (facultatif)

URI du document.

mime_type enum (string) (optional)

Type MIME du document.

Valeurs possibles :

application/pdf

VideoContent

Bloc de contenu vidéo.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "video".

data string (facultatif)

Le contenu vidéo

uri string (facultatif)

URI de la vidéo.

mime_type enum (string) (optional)

Type MIME de la vidéo.

Valeurs possibles :

video/mp4
video/mpeg
video/mpg
video/mov
video/avi
video/x-flv
video/webm
video/wmv
video/3gpp

resolution MediaResolution (optional)

Résolution du contenu multimédia.

Valeurs possibles :

low
medium
high
ultra_high

Exemples

Texte

{
  "type": "text",
  "text": "Hello, how are you?"
}

Image

{
  "type": "image",
  "data": "BASE64_ENCODED_IMAGE",
  "mime_type": "image/png"
}

Audio

{
  "type": "audio",
  "data": "BASE64_ENCODED_AUDIO",
  "mime_type": "audio/wav"
}

Document

{
  "type": "document",
  "data": "BASE64_ENCODED_DOCUMENT",
  "mime_type": "application/pdf"
}

Vidéo

{
  "type": "video",
  "uri": "https://www.youtube.com/watch?v=9hE5-98ZeCg"
}

Outil

Outil pouvant être utilisé par le modèle.

Types possibles

Discriminant polymorphe : type

Fonction

Outil pouvant être utilisé par le modèle.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "function".

name string (facultatif)

Nom de la fonction.

description string (facultatif)

Description de la fonction.

parameters object (facultatif)

Schéma JSON pour les paramètres de la fonction.

CodeExecution

Outil que le modèle peut utiliser pour exécuter du code.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "code_execution".

UrlContext

Outil que le modèle peut utiliser pour récupérer le contexte d'une URL.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "url_context".

ComputerUse

Outil que le modèle peut utiliser pour interagir avec l'ordinateur.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "computer_use".

environment enum (string) (optional)

Environnement exploité.

Valeurs possibles :

browser

excluded_predefined_functions array (string) (optional)

Liste des fonctions prédéfinies exclues de l'appel de modèle.

McpServer

Un MCPServer est un serveur qui peut être appelé par le modèle pour effectuer des actions.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "mcp_server".

name string (facultatif)

Nom du MCPServer.

url string (optional)

URL complète du point de terminaison MCPServer. Exemple : "https://api.example.com/mcp"

headers object (facultatif)

Facultatif : Champs pour les en-têtes d'authentification, les délais d'attente, etc., si nécessaire.

allowed_tools AllowedTools (facultatif)

Outils autorisés.

Champs

mode ToolChoiceType (facultatif)

Mode de choix de l'outil.

Valeurs possibles :

auto
any
none
validated

tools array (string) (facultatif)

Noms des outils autorisés.

GoogleSearch

Outil que le modèle peut utiliser pour effectuer des recherches sur Google.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "google_search".

search_types array (enum (string)) (optional)

Types d'ancrage de recherche à activer.

Valeurs possibles :

web_search
image_search
enterprise_web_search

FileSearch

Outil que le modèle peut utiliser pour rechercher des fichiers.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "file_search".

file_search_store_names array (string) (optional)

Noms des magasins de fichiers dans lesquels effectuer la recherche.

top_k integer (optional)

Nombre de blocs de récupération sémantique à récupérer.

metadata_filter string (optional)

Filtre de métadonnées à appliquer aux documents et aux blocs de récupération sémantique.

GoogleMaps

Outil que le modèle peut utiliser pour appeler Google Maps.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "google_maps".

enable_widget boolean (facultatif)

Indique s'il faut renvoyer un jeton de contexte de widget dans le résultat de l'appel d'outil de la réponse.

latitude number (facultatif)

Latitude de l'emplacement de l'utilisateur.

longitude number (facultatif)

Longitude de la position de l'utilisateur.

Récupération

Outil que le modèle peut utiliser pour récupérer des fichiers.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "retrieval".

retrieval_types array (enum (string)) (optional)

Types de récupération de fichiers à activer.

Valeurs possibles :

vertex_ai_search

vertex_ai_search_config VertexAISearchConfig (facultatif)

Permet de spécifier la configuration de VertexAISearch.

Champs

engine string (facultatif)

Facultatif. Permet de spécifier le moteur de recherche Vertex AI.

datastores array (string) (optional)

Facultatif. Permet de spécifier les data stores Vertex AI Search.

Exemples

Fonction

CodeExecution

UrlContext

ComputerUse

McpServer

GoogleSearch

FileSearch

GoogleMaps

Récupération

Aucun exemple n'est disponible pour ce type.

InteractionSseEvent

Types possibles

Discriminant polymorphe : event_type

InteractionCreatedEvent

event_type object (obligatoire)

Aucune description fournie.

Toujours défini sur "interaction.created".

interaction Interaction (obligatoire)

Aucune description fournie.

event_id string (facultatif)

Jeton event_id à utiliser pour reprendre le flux d'interaction à partir de cet événement.

InteractionCompletedEvent

event_type object (obligatoire)

Aucune description fournie.

Toujours défini sur "interaction.completed".

interaction Interaction (obligatoire)

Obligatoire. Interaction terminée avec des sorties vides pour réduire la taille de la charge utile. Utilisez les événements ContentDelta précédents pour la sortie réelle.

event_id string (facultatif)

Jeton event_id à utiliser pour reprendre le flux d'interaction à partir de cet événement.

InteractionStatusUpdate

event_type object (obligatoire)

Aucune description fournie.

Toujours défini sur "interaction.status_update".

interaction_id string (required)

Aucune description fournie.

status enum (string) (required)

Aucune description fournie.

Valeurs possibles :

in_progress
requires_action
completed
failed
cancelled
incomplete

event_id string (facultatif)

Jeton event_id à utiliser pour reprendre le flux d'interaction à partir de cet événement.

ErrorEvent

event_type object (obligatoire)

Aucune description fournie.

Toujours défini sur "error".

error Error (facultatif)

Aucune description fournie.

Champs

code string (facultatif)

URI qui identifie le type d'erreur.

message string (facultatif)

Message d'erreur lisible par l'utilisateur.

event_id string (facultatif)

Jeton event_id à utiliser pour reprendre le flux d'interaction à partir de cet événement.

StepStart

event_type object (obligatoire)

Aucune description fournie.

Toujours défini sur "step.start".

index integer (obligatoire)

Aucune description fournie.

step Step (required)

Aucune description fournie.

Types possibles

Discriminant polymorphe : type

UserInputStep

Entrée fournie par l'utilisateur.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "user_input".

content array (Content) (facultatif)

Aucune description fournie.

ModelOutputStep

Sortie générée par le modèle.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "model_output".

content array (Content) (facultatif)

Aucune description fournie.

ThoughtStep

Une étape de réflexion.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "thought".

signature string (facultatif)

Hachage de signature pour la validation du backend.

summary ThoughtSummaryContent (facultatif)

Un résumé de la pensée.

Types possibles

Discriminant polymorphe : type

TextContent

Bloc de contenu textuel.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "text".

text string (obligatoire)

Obligatoire. Contenu textuel.

annotations Annotation (optional)

Informations de citation pour le contenu généré par le modèle.

Types possibles

Discriminant polymorphe : type

UrlCitation

Annotation de citation d'URL.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "url_citation".

url string (optional)

URL.

title string (facultatif)

Titre de l'URL.

start_index integer (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer (facultatif)

Fin du segment attribué (exclusif).

FileCitation

Annotation de citation de fichier.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "file_citation".

document_uri string (optional)

URI du fichier.

file_name string (facultatif)

Nom du fichier.

source string (facultatif)

Source attribuée à une partie du texte.

custom_metadata object (facultatif)

Métadonnées fournies par l'utilisateur sur le contexte récupéré.

page_number integer (facultatif)

Numéro de page du document cité, le cas échéant.

media_id string (facultatif)

ID du média en cas de citation d'image, le cas échéant.

start_index integer (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer (facultatif)

Fin du segment attribué (exclusif).

PlaceCitation

Annotation de citation d'un lieu.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "place_citation".

place_id string (facultatif)

ID du lieu, au format `places/{place_id}`.

name string (facultatif)

Titre du lieu.

url string (optional)

Référence URI du lieu.

review_snippets ReviewSnippet (facultatif)

Extraits d'avis utilisés pour générer des réponses sur les caractéristiques d'un lieu donné dans Google Maps.

Champs

title string (facultatif)

Titre de l'avis.

url string (optional)

Lien correspondant à l'avis de l'utilisateur sur Google Maps.

review_id string (facultatif)

ID de l'extrait d'avis.

start_index integer (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer (facultatif)

Fin du segment attribué (exclusif).

ImageContent

Bloc de contenu d'image.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "image".

data string (facultatif)

Contenu de l'image.

uri string (facultatif)

URI de l'image.

mime_type enum (string) (optional)

Type MIME de l'image.

Valeurs possibles :

image/png
image/jpeg
image/webp
image/heic
image/heif
image/gif
image/bmp
image/tiff

resolution MediaResolution (optional)

Résolution du contenu multimédia.

Valeurs possibles :

low
medium
high
ultra_high

FunctionCallStep

Étape d'appel de fonction.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "function_call".

name string (obligatoire)

Obligatoire. Nom de l'outil à appeler.

arguments object (obligatoire)

Obligatoire. Arguments à transmettre à la fonction.

id chaîne (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string (facultatif)

Hachage de signature pour la validation du backend.

CodeExecutionCallStep

Étape d'appel d'exécution du code.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "code_execution_call".

arguments CodeExecutionCallStepArguments (obligatoire)

Obligatoire. Arguments à transmettre à l'exécution du code.

Champs

language enum (string) (facultatif)

Langage de programmation du code.

Valeurs possibles :

python

code string (facultatif)

Code à exécuter.

id chaîne (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string (facultatif)

Hachage de signature pour la validation du backend.

UrlContextCallStep

Étape d'appel du contexte d'URL.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "url_context_call".

arguments UrlContextCallStepArguments (required)

Obligatoire. Arguments à transmettre au contexte de l'URL.

Champs

urls array (string) (optional)

URL à récupérer.

id chaîne (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string (facultatif)

Hachage de signature pour la validation du backend.

McpServerToolCallStep

Étape d'appel d'outil MCPServer.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "mcp_server_tool_call".

name string (obligatoire)

Obligatoire. Nom de l'outil appelé.

server_name string (required)

Obligatoire. Nom du serveur MCP utilisé.

arguments object (obligatoire)

Obligatoire. Objet JSON des arguments de la fonction.

id chaîne (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string (facultatif)

Hachage de signature pour la validation du backend.

GoogleSearchCallStep

Étape d'appel de la recherche Google.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "google_search_call".

arguments GoogleSearchCallStepArguments (obligatoire)

Obligatoire. Arguments à transmettre à la recherche Google.

Champs

queries array (string) (facultatif)

Requêtes de recherche sur le Web pour la recherche sur le Web de suivi.

search_type enum (string) (optional)

Type d'ancrage avec la recherche activé.

Valeurs possibles :

web_search
image_search
enterprise_web_search

id chaîne (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string (facultatif)

Hachage de signature pour la validation du backend.

FileSearchCallStep

Étape d'appel de recherche de fichiers.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "file_search_call".

id chaîne (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string (facultatif)

Hachage de signature pour la validation du backend.

GoogleMapsCallStep

Étape d'appel Google Maps.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "google_maps_call".

arguments GoogleMapsCallStepArguments (facultatif)

Arguments à transmettre à l'outil Google Maps.

Champs

queries array (string) (facultatif)

Requêtes à exécuter.

id chaîne (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string (facultatif)

Hachage de signature pour la validation du backend.

FunctionResultStep

Résultat d'un appel d'outil de fonction.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "function_result".

name string (facultatif)

Nom de l'outil appelé.

is_error boolean (facultatif)

Indique si l'appel d'outil a entraîné une erreur.

call_id string (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string (facultatif)

Hachage de signature pour la validation du backend.

result array (FunctionResultSubcontent) or string (required)

Résultat de l'appel d'outil.

CodeExecutionResultStep

Étape du résultat de l'exécution du code.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "code_execution_result".

result string (obligatoire)

Obligatoire. Sortie de l'exécution du code.

is_error boolean (facultatif)

Indique si l'exécution du code a entraîné une erreur.

call_id string (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string (facultatif)

Hachage de signature pour la validation du backend.

UrlContextResultStep

Étape de résultat du contexte d'URL.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "url_context_result".

result UrlContextResultItem (obligatoire)

Obligatoire. Résultats du contexte de l'URL.

Champs

url string (optional)

URL récupérée.

status enum (string) (facultatif)

État de la récupération de l'URL.

Valeurs possibles :

success
error
paywall
unsafe

is_error boolean (facultatif)

Indique si le contexte de l'URL a entraîné une erreur.

call_id string (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string (facultatif)

Hachage de signature pour la validation du backend.

GoogleSearchResultStep

Étape de résultat de recherche Google.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "google_search_result".

result GoogleSearchResultItem (obligatoire)

Obligatoire. Résultats de la recherche Google.

Champs

search_suggestions string (facultatif)

Extrait de contenu Web pouvant être intégré à une page Web ou à une WebView d'application.

is_error boolean (facultatif)

Indique si la recherche Google a généré une erreur.

call_id string (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string (facultatif)

Hachage de signature pour la validation du backend.

McpServerToolResultStep

Étape de résultat de l'outil MCPServer.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "mcp_server_tool_result".

name string (facultatif)

Nom de l'outil appelé pour cet appel d'outil spécifique.

server_name string (facultatif)

Nom du serveur MCP utilisé.

call_id string (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string (facultatif)

Hachage de signature pour la validation du backend.

result array (FunctionResultSubcontent) or string (required)

Résultat de l'appel du serveur MCP. Il peut s'agir de texte simple ou de contenu enrichi.

FileSearchResultStep

Étape "Résultat de recherche de fichier".

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "file_search_result".

call_id string (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string (facultatif)

Hachage de signature pour la validation du backend.

GoogleMapsResultStep

Étape de résultat Google Maps.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "google_maps_result".

result GoogleMapsResultItem (obligatoire)

Aucune description fournie.

Champs

places GoogleMapsResultPlaces (facultatif)

Aucune description fournie.

Champs

place_id string (facultatif)

Aucune description fournie.

name string (facultatif)

Aucune description fournie.

url string (optional)

Aucune description fournie.

review_snippets ReviewSnippet (facultatif)

Aucune description fournie.

Champs

title string (facultatif)

Titre de l'avis.

url string (optional)

Lien correspondant à l'avis de l'utilisateur sur Google Maps.

review_id string (facultatif)

ID de l'extrait d'avis.

widget_context_token string (facultatif)

Aucune description fournie.

call_id string (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string (facultatif)

Hachage de signature pour la validation du backend.

event_id string (facultatif)

Jeton event_id à utiliser pour reprendre le flux d'interaction à partir de cet événement.

StepDelta

event_type object (obligatoire)

Aucune description fournie.

Toujours défini sur "step.delta".

index integer (obligatoire)

Aucune description fournie.

delta StepDeltaData (obligatoire)

Aucune description fournie.

Types possibles

Discriminant polymorphe : type

TextDelta

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "text".

text string (obligatoire)

Aucune description fournie.

ImageDelta

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "image".

data string (facultatif)

Aucune description fournie.

uri string (facultatif)

Aucune description fournie.

mime_type enum (string) (optional)

Aucune description fournie.

Valeurs possibles :

image/png
image/jpeg
image/webp
image/heic
image/heif
image/gif
image/bmp
image/tiff

resolution MediaResolution (optional)

Résolution du contenu multimédia.

Valeurs possibles :

low
medium
high
ultra_high

AudioDelta

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "audio".

data string (facultatif)

Aucune description fournie.

uri string (facultatif)

Aucune description fournie.

mime_type enum (string) (optional)

Aucune description fournie.

Valeurs possibles :

audio/wav
audio/mp3
audio/aiff
audio/aac
audio/ogg
audio/flac
audio/mpeg
audio/m4a
audio/l16
audio/opus
audio/alaw
audio/mulaw

rate integer (facultatif)

Obsolète. Utilisez plutôt sample_rate. La valeur est ignorée.

sample_rate integer (facultatif)

Taux d'échantillonnage de l'audio.

channels integer (facultatif)

Nombre de canaux audio.

DocumentDelta

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "document".

data string (facultatif)

Aucune description fournie.

uri string (facultatif)

Aucune description fournie.

mime_type enum (string) (optional)

Aucune description fournie.

Valeurs possibles :

application/pdf

VideoDelta

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "video".

data string (facultatif)

Aucune description fournie.

uri string (facultatif)

Aucune description fournie.

mime_type enum (string) (optional)

Aucune description fournie.

Valeurs possibles :

video/mp4
video/mpeg
video/mpg
video/mov
video/avi
video/x-flv
video/webm
video/wmv
video/3gpp

resolution MediaResolution (optional)

Résolution du contenu multimédia.

Valeurs possibles :

low
medium
high
ultra_high

ThoughtSummaryDelta

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "thought_summary".

content ThoughtSummaryContent (facultatif)

Nouvel élément de résumé à ajouter à la pensée.

Types possibles

Discriminant polymorphe : type

TextContent

Bloc de contenu textuel.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "text".

text string (obligatoire)

Obligatoire. Contenu textuel.

annotations Annotation (optional)

Informations de citation pour le contenu généré par le modèle.

Types possibles

Discriminant polymorphe : type

UrlCitation

Annotation de citation d'URL.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "url_citation".

url string (optional)

URL.

title string (facultatif)

Titre de l'URL.

start_index integer (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer (facultatif)

Fin du segment attribué (exclusif).

FileCitation

Annotation de citation de fichier.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "file_citation".

document_uri string (optional)

URI du fichier.

file_name string (facultatif)

Nom du fichier.

source string (facultatif)

Source attribuée à une partie du texte.

custom_metadata object (facultatif)

Métadonnées fournies par l'utilisateur sur le contexte récupéré.

page_number integer (facultatif)

Numéro de page du document cité, le cas échéant.

media_id string (facultatif)

ID du média en cas de citation d'image, le cas échéant.

start_index integer (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer (facultatif)

Fin du segment attribué (exclusif).

PlaceCitation

Annotation de citation d'un lieu.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "place_citation".

place_id string (facultatif)

ID du lieu, au format `places/{place_id}`.

name string (facultatif)

Titre du lieu.

url string (optional)

Référence URI du lieu.

review_snippets ReviewSnippet (facultatif)

Extraits d'avis utilisés pour générer des réponses sur les caractéristiques d'un lieu donné dans Google Maps.

Champs

title string (facultatif)

Titre de l'avis.

url string (optional)

Lien correspondant à l'avis de l'utilisateur sur Google Maps.

review_id string (facultatif)

ID de l'extrait d'avis.

start_index integer (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer (facultatif)

Fin du segment attribué (exclusif).

ImageContent

Bloc de contenu d'image.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "image".

data string (facultatif)

Contenu de l'image.

uri string (facultatif)

URI de l'image.

mime_type enum (string) (optional)

Type MIME de l'image.

Valeurs possibles :

image/png
image/jpeg
image/webp
image/heic
image/heif
image/gif
image/bmp
image/tiff

resolution MediaResolution (optional)

Résolution du contenu multimédia.

Valeurs possibles :

low
medium
high
ultra_high

ThoughtSignatureDelta

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "thought_signature".

signature string (facultatif)

Signature permettant de faire correspondre la source du backend à inclure dans la génération.

TextAnnotationDelta

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "text_annotation_delta".

annotations Annotation (optional)

Informations de citation pour le contenu généré par le modèle.

Types possibles

Discriminant polymorphe : type

UrlCitation

Annotation de citation d'URL.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "url_citation".

url string (optional)

URL.

title string (facultatif)

Titre de l'URL.

start_index integer (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer (facultatif)

Fin du segment attribué (exclusif).

FileCitation

Annotation de citation de fichier.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "file_citation".

document_uri string (optional)

URI du fichier.

file_name string (facultatif)

Nom du fichier.

source string (facultatif)

Source attribuée à une partie du texte.

custom_metadata object (facultatif)

Métadonnées fournies par l'utilisateur sur le contexte récupéré.

page_number integer (facultatif)

Numéro de page du document cité, le cas échéant.

media_id string (facultatif)

ID du média en cas de citation d'image, le cas échéant.

start_index integer (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer (facultatif)

Fin du segment attribué (exclusif).

PlaceCitation

Annotation de citation d'un lieu.

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "place_citation".

place_id string (facultatif)

ID du lieu, au format `places/{place_id}`.

name string (facultatif)

Titre du lieu.

url string (optional)

Référence URI du lieu.

review_snippets ReviewSnippet (facultatif)

Extraits d'avis utilisés pour générer des réponses sur les caractéristiques d'un lieu donné dans Google Maps.

Champs

title string (facultatif)

Titre de l'avis.

url string (optional)

Lien correspondant à l'avis de l'utilisateur sur Google Maps.

review_id string (facultatif)

ID de l'extrait d'avis.

start_index integer (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer (facultatif)

Fin du segment attribué (exclusif).

ArgumentsDelta

type object (obligatoire)

Aucune description fournie.

Toujours défini sur "arguments_delta".

partial_arguments string (facultatif)

Aucune description fournie.

event_id string (facultatif)

Jeton event_id à utiliser pour reprendre le flux d'interaction à partir de cet événement.

StepStop

event_type object (obligatoire)

Aucune description fournie.

Toujours défini sur "step.stop".

index integer (obligatoire)

Aucune description fournie.

event_id string (facultatif)

Jeton event_id à utiliser pour reprendre le flux d'interaction à partir de cet événement.

Exemples

Interaction créée

{
  "event_type": "interaction.created",
  "interaction": {
    "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg",
    "model": "gemini-3-flash-preview",
    "status": "in_progress",
    "created": "2025-12-04T15:01:45Z",
    "updated": "2025-12-04T15:01:45Z"
  },
  "event_id": "evt_123"
}

Interaction terminée

{
  "event_type": "interaction.completed",
  "interaction": {
    "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg",
    "model": "gemini-3-flash-preview",
    "status": "completed",
    "created": "2025-12-04T15:01:45Z",
    "updated": "2025-12-04T15:01:45Z"
  },
  "event_id": "evt_123"
}

Mise à jour de l'état de l'interaction

{
  "event_type": "interaction.status_update",
  "interaction_id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM",
  "status": "in_progress"
}

Événement d'erreur

{
  "event_type": "error",
  "error": {
    "message": "Failed to get completed interaction: Result not found.",
    "code": "not_found"
  }
}

Début de l'étape

{
  "event_type": "step.start",
  "index": 0,
  "step": {
    "type": "model_output"
  }
}

Delta de pas

{
  "event_type": "step.delta",
  "index": 0,
  "delta": {
    "type": "text",
    "text": "Hello"
  }
}

Arrêt à un pas

{
  "event_type": "step.stop",
  "index": 0
}