Gemini API

L'API Gemini Interactions est une API expérimentale qui permet aux développeurs de créer des applications d'IA générative à l'aide des modèles Gemini. Gemini est notre modèle le plus performant, entièrement conçu pour être multimodal. Il peut généraliser, comprendre avec fluidité, traiter et combiner différents supports d'informations, dont le texte, le code, l'audio, l'image et la vidéo. Vous pouvez utiliser l'API Gemini pour des cas d'utilisation tels que le raisonnement sur du texte et des images, la génération de contenu, les agents de dialogue, les systèmes de synthèse et de classification, et plus encore.

Créer une interaction

post https://generativelanguage.googleapis.com/v1beta/interactions

Crée une interaction.

Corps de la requête

Le corps de la requête contient des données présentant la structure suivante :

model ModelOption  (facultatif)

Nom du `Model` utilisé pour générer l'interaction.
Obligatoire si l'attribut "agent" n'est pas fourni.

Valeurs possibles :

  • gemini-2.5-computer-use-preview-10-2025

    Modèle de capacités agentiques conçu pour l'interaction directe avec l'interface, permettant à Gemini de percevoir et de parcourir les environnements numériques.

  • gemini-2.5-flash

    Notre premier modèle de raisonnement hybride, qui accepte une fenêtre de contexte d'un million de jetons et dispose de budgets de réflexion.

  • gemini-2.5-flash-image

    Notre modèle natif de génération d'images, optimisé pour la vitesse, la flexibilité et la compréhension contextuelle. Les entrées et sorties textuelles sont facturées au même prix que 2,5 Flash.

  • gemini-2.5-flash-lite

    Notre modèle le plus petit et le plus économique, conçu pour une utilisation à grande échelle.

  • gemini-2.5-flash-lite-preview-09-2025

    Dernier modèle basé sur Gemini 2.5 Flash-Lite, optimisé pour la rentabilité, le haut débit et la haute qualité.

  • gemini-2.5-flash-native-audio-preview-12-2025

    Nos modèles audio natifs sont optimisés pour des sorties audio de meilleure qualité, avec un rythme, une voix, une verbosité et une humeur plus naturels.

  • gemini-2.5-flash-preview-09-2025

    Dernier modèle basé sur le modèle 2.5 Flash. 2.5 Flash (version preview) est idéal pour les tâches de traitement à grande échelle, à faible latence et à volume élevé qui nécessitent de la réflexion, ainsi que pour les cas d'utilisation agentiques.

  • gemini-2.5-flash-preview-tts

    Notre modèle de synthèse vocale 2.5 Flash est optimisé pour générer des voix puissantes, contrôlables et à faible latence.

  • gemini-2.5-pro

    Notre modèle polyvalent de pointe, qui excelle dans les tâches de codage et de raisonnement complexe.

  • gemini-2.5-pro-preview-tts

    Notre modèle audio de synthèse vocale 2.5 Pro est optimisé pour générer des voix puissantes et à faible latence, afin de produire des résultats plus naturels et de faciliter la création de requêtes.

  • gemini-3-flash-preview

    Notre modèle le plus intelligent, conçu pour la rapidité, combinant intelligence de pointe, recherche et ancrage supérieurs.

  • gemini-3-pro-image-preview

    Modèle de pointe pour la génération et la retouche d'images.

  • gemini-3-pro-preview

    Notre modèle le plus intelligent, doté d'une compréhension multimodale et d'un raisonnement de pointe, ainsi que de puissantes capacités de vibe coding et agentiques.

  • gemini-3.1-pro-preview

    Notre dernier modèle de raisonnement SOTA, doté d'une profondeur et d'une nuance sans précédent, ainsi que de puissantes capacités de compréhension multimodale et de codage.

  • gemini-3.1-flash-image-preview

    Intelligence visuelle de niveau professionnel, efficacité de Gemini Flash et capacités de génération ancrées dans la réalité.

  • gemini-3.1-flash-lite-preview

    Notre modèle le plus économique, optimisé pour les tâches agentiques à volume élevé, la traduction et le traitement de données simples.

  • gemini-3.1-flash-tts-preview

    Gemini 3.1 Flash TTS : génération vocale puissante et à faible latence. Profitez de résultats naturels, d'invites orientables et de nouvelles balises audio expressives pour un contrôle précis de la narration.

  • lyria-3-clip-preview

    Notre modèle de génération de musique à faible latence est optimisé pour les extraits audio haute fidélité et le contrôle rythmique précis.

  • lyria-3-pro-preview

    Notre modèle génératif avancé de chansons entières, avec une compréhension approfondie de la composition, optimisé pour un contrôle précis de la structure et des transitions complexes dans différents styles musicaux.

Modèle qui complétera votre requête.\n\nPour en savoir plus, consultez [modèles](https://ai.google.dev/gemini-api/docs/models).

agent AgentOption  (facultatif)

Nom de l'agent utilisé pour générer l'interaction.
Obligatoire si `model` n'est pas fourni.

Valeurs possibles :

  • deep-research-pro-preview-12-2025

    Agent Gemini Deep Research

  • deep-research-preview-04-2026

    Agent Gemini Deep Research

  • deep-research-max-preview-04-2026

    Agent Gemini Deep Research Max

Agent avec lequel interagir.

input Content ou tableau (Content) ou tableau (Turn) ou chaîne  (obligatoire)

Entrées de l'interaction (communes au modèle et à l'agent).

system_instruction string  (facultatif)

Instruction système pour l'interaction.

tools array (Tool)  (facultatif)

Liste des déclarations d'outils que le modèle peut appeler lors de l'interaction.

response_format object  (facultatif)

Garantit que la réponse générée est un objet JSON conforme au schéma JSON spécifié dans ce champ.

response_mime_type string  (facultatif)

Type MIME de la réponse. Obligatoire si response_format est défini.

stream boolean  (facultatif)

Uniquement en entrée. Indique si l'interaction sera diffusée en streaming.

store boolean  (facultatif)

Uniquement en entrée. Indique si la réponse et la demande doivent être stockées pour être récupérées ultérieurement.

background boolean  (facultatif)

Uniquement en entrée. Indique si l'interaction du modèle doit s'exécuter en arrière-plan.

generation_config GenerationConfig  (facultatif)

Configuration du modèle :
paramètres de configuration pour l'interaction avec le modèle.
Alternative à `agent_config`. Ne s'applique que lorsque `model` est défini.

Paramètres de configuration pour les interactions avec le modèle.

Champs

temperature number  (facultatif)

Contrôle le caractère aléatoire de la sortie.

top_p number  (facultatif)

Probabilité cumulée maximale des jetons à prendre en compte lors de l'échantillonnage.

seed integer  (facultatif)

Graine utilisée dans le décodage pour la reproductibilité.

stop_sequences array (string)  (optional)

Liste des séquences de caractères qui arrêteront l'interaction de sortie.

thinking_level ThinkingLevel  (facultatif)

Niveau de jetons de réflexion que le modèle doit générer.

Valeurs possibles :

  • minimal
  • low
  • medium
  • high

thinking_summaries ThinkingSummaries  (facultatif)

Indique si la réponse doit inclure des résumés de la réflexion.

Valeurs possibles :

  • auto
  • none

max_output_tokens integer  (facultatif)

Nombre maximal de jetons à inclure dans la réponse.

speech_config SpeechConfig  (facultatif)

Configuration pour l'interaction vocale.

Configuration de l'interaction vocale.

Champs

voice string  (facultatif)

La voix de l'orateur.

language string  (facultatif)

Langue du discours.

speaker string  (facultatif)

Nom de l'intervenant. Il doit correspondre à celui indiqué dans la requête.

image_config ImageConfig  (facultatif)

Configuration de l'interaction avec l'image.

Configuration de l'interaction avec l'image.

Champs

aspect_ratio enum (string)  (optional)

Aucune description fournie.

Valeurs possibles :

  • 1:1
  • 2:3
  • 3:2
  • 3:4
  • 4:3
  • 4:5
  • 5:4
  • 9:16
  • 16:9
  • 21:9
  • 1:8
  • 8:1
  • 1:4
  • 4:1
image_size enum (string)  (facultatif)

Aucune description fournie.

Valeurs possibles :

  • 1K
  • 2K
  • 4K
  • 512
tool_choice ToolChoiceConfig ou ToolChoiceType  (facultatif)

Configuration du choix de l'outil.

agent_config object  (facultatif)

Configuration de l'agent
Configuration de l'agent.
Alternative à `generation_config`. Ne s'applique que lorsque `agent` est défini.

Types possibles

Discriminant polymorphe : type

DynamicAgentConfig

Configuration des agents dynamiques.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "dynamic".

DeepResearchAgentConfig

Configuration de l'agent Deep Research.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "deep-research".

thinking_summaries ThinkingSummaries  (facultatif)

Indique si la réponse doit inclure des résumés de la réflexion.

Valeurs possibles :

  • auto
  • none

visualization enum (string)  (facultatif)

Indique si la réponse doit inclure des visualisations.

Valeurs possibles :

  • off
  • auto
collaborative_planning boolean  (facultatif)

Active la planification human-in-the-loop pour l'agent Deep Research. Si la valeur est définie sur "true", l'agent Deep Research fournira un plan de recherche dans sa réponse. L'agent ne poursuivra la procédure que si l'utilisateur confirme le forfait au prochain tour.

previous_interaction_id string  (facultatif)

ID de l'interaction précédente, le cas échéant.

response_modalities ResponseModality  (facultatif)

Modalités de réponse demandées (TEXT, IMAGE, AUDIO).

Valeurs possibles :

  • text
  • image
  • audio
  • video
  • document

service_tier enum (string)  (optional)

Niveau de service de l'interaction.

Valeurs possibles :

  • flex
  • standard
  • priority

Réponse

Renvoie une ressource Interaction.

Demande simple

Exemple de réponse

{
  "created": "2025-11-26T12:25:15Z",
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "object": "interaction",
  "outputs": [
    {
      "text": "Hello! I'm functioning perfectly and ready to assist you.\n\nHow are you doing today?",
      "type": "text"
    }
  ],
  "role": "model",
  "status": "completed",
  "updated": "2025-11-26T12:25:15Z",
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 7
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 7,
    "total_output_tokens": 20,
    "total_thought_tokens": 22,
    "total_tokens": 49,
    "total_tool_use_tokens": 0
  }
}

Multitours

Exemple de réponse

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "role": "model",
  "outputs": [
    {
      "type": "text",
      "text": "The capital of France is Paris."
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 50
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 50,
    "total_output_tokens": 10,
    "total_thought_tokens": 0,
    "total_tokens": 60,
    "total_tool_use_tokens": 0
  }
}

Image d'entrée

Exemple de réponse

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "role": "model",
  "outputs": [
    {
      "type": "text",
      "text": "A white humanoid robot with glowing blue eyes stands holding a red skateboard."
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 10
      },
      {
        "modality": "image",
        "tokens": 258
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 268,
    "total_output_tokens": 20,
    "total_thought_tokens": 0,
    "total_tokens": 288,
    "total_tool_use_tokens": 0
  }
}

Appel de fonction

Exemple de réponse

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "requires_action",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "role": "model",
  "outputs": [
    {
      "type": "function_call",
      "id": "gth23981",
      "name": "get_weather",
      "arguments": {
        "location": "Boston, MA"
      }
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 100
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 100,
    "total_output_tokens": 25,
    "total_thought_tokens": 0,
    "total_tokens": 125,
    "total_tool_use_tokens": 50
  }
}

Deep Research

Exemple de réponse

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "agent": "deep-research-pro-preview-12-2025",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:22:47Z",
  "updated": "2025-11-26T12:22:47Z",
  "role": "agent",
  "outputs": [
    {
      "type": "text",
      "text": "Here is a comprehensive research report on the current state of cancer research..."
    }
  ],
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 20
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 20,
    "total_output_tokens": 1000,
    "total_thought_tokens": 500,
    "total_tokens": 1520,
    "total_tool_use_tokens": 0
  }
}

Récupérer une interaction

get https://generativelanguage.googleapis.com/v1beta/interactions/{id}

Récupère tous les détails d'une interaction en fonction de son `Interaction.id`.

Paramètres de chemin / de requête

id chaîne  (obligatoire)

Identifiant unique de l'interaction à récupérer.

stream boolean  (facultatif)

Si la valeur est définie sur "true", le contenu généré sera diffusé de manière incrémentielle.

Valeur par défaut : False

last_event_id string  (facultatif)

Facultatif. Si cette option est définie, le flux d'interaction reprend à partir du prochain bloc après l'événement marqué par l'ID d'événement. Ne peut être utilisé que si "stream" est défini sur "true".

include_input boolean  (facultatif)

Si la valeur est définie sur "true", l'entrée est incluse dans la réponse.

Valeur par défaut : False

api_version string  (facultatif)

Version de l'API à utiliser.

Réponse

Renvoie une ressource Interaction.

Obtenir une interaction

Exemple de réponse

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "model": "gemini-3-flash-preview",
  "status": "completed",
  "object": "interaction",
  "created": "2025-11-26T12:25:15Z",
  "updated": "2025-11-26T12:25:15Z",
  "role": "model",
  "outputs": [
    {
      "type": "text",
      "text": "I'm doing great, thank you for asking! How can I help you today?"
    }
  ]
}

Supprimer une interaction

delete https://generativelanguage.googleapis.com/v1beta/interactions/{id}

Supprime l'interaction par ID.

Paramètres de chemin / de requête

id chaîne  (obligatoire)

Identifiant unique de l'interaction à supprimer.

api_version string  (facultatif)

Version de l'API à utiliser.

Réponse

Si l'opération réussit, la réponse est vide.

Supprimer une interaction

Annuler une interaction

post https://generativelanguage.googleapis.com/v1beta/interactions/{id}/cancel

Annule une interaction par ID. Cela ne s'applique qu'aux interactions en arrière-plan qui sont toujours en cours d'exécution.

Paramètres de chemin / de requête

id chaîne  (obligatoire)

Identifiant unique de l'interaction à annuler.

api_version string  (facultatif)

Version de l'API à utiliser.

Réponse

Renvoie une ressource Interaction.

Annuler l'interaction

Exemple de réponse

{
  "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg",
  "agent": "deep-research-pro-preview-12-2025",
  "status": "cancelled",
  "object": "interaction",
  "created": "2025-11-26T12:25:15Z",
  "updated": "2025-11-26T12:25:15Z",
  "role": "agent"
}

Ressources

Interaction

Ressource Interaction.

Champs

model ModelOption  (facultatif)

Nom du `Model` utilisé pour générer l'interaction.

Valeurs possibles :

  • gemini-2.5-computer-use-preview-10-2025

    Modèle de capacités agentiques conçu pour l'interaction directe avec l'interface, permettant à Gemini de percevoir et de parcourir les environnements numériques.

  • gemini-2.5-flash

    Notre premier modèle de raisonnement hybride, qui accepte une fenêtre de contexte d'un million de jetons et dispose de budgets de réflexion.

  • gemini-2.5-flash-image

    Notre modèle natif de génération d'images, optimisé pour la vitesse, la flexibilité et la compréhension contextuelle. Les entrées et sorties textuelles sont facturées au même prix que 2,5 Flash.

  • gemini-2.5-flash-lite

    Notre modèle le plus petit et le plus économique, conçu pour une utilisation à grande échelle.

  • gemini-2.5-flash-lite-preview-09-2025

    Dernier modèle basé sur Gemini 2.5 Flash-Lite, optimisé pour la rentabilité, le haut débit et la haute qualité.

  • gemini-2.5-flash-native-audio-preview-12-2025

    Nos modèles audio natifs sont optimisés pour des sorties audio de meilleure qualité, avec un rythme, une voix, une verbosité et une humeur plus naturels.

  • gemini-2.5-flash-preview-09-2025

    Dernier modèle basé sur le modèle 2.5 Flash. 2.5 Flash (version preview) est idéal pour les tâches de traitement à grande échelle, à faible latence et à volume élevé qui nécessitent de la réflexion, ainsi que pour les cas d'utilisation agentiques.

  • gemini-2.5-flash-preview-tts

    Notre modèle de synthèse vocale 2.5 Flash est optimisé pour générer des voix puissantes, contrôlables et à faible latence.

  • gemini-2.5-pro

    Notre modèle polyvalent de pointe, qui excelle dans les tâches de codage et de raisonnement complexe.

  • gemini-2.5-pro-preview-tts

    Notre modèle audio de synthèse vocale 2.5 Pro est optimisé pour générer des voix puissantes et à faible latence, afin de produire des résultats plus naturels et de faciliter la création de requêtes.

  • gemini-3-flash-preview

    Notre modèle le plus intelligent, conçu pour la rapidité, combinant intelligence de pointe, recherche et ancrage supérieurs.

  • gemini-3-pro-image-preview

    Modèle de pointe pour la génération et la retouche d'images.

  • gemini-3-pro-preview

    Notre modèle le plus intelligent, doté d'une compréhension multimodale et d'un raisonnement de pointe, ainsi que de puissantes capacités de vibe coding et agentiques.

  • gemini-3.1-pro-preview

    Notre dernier modèle de raisonnement SOTA, doté d'une profondeur et d'une nuance sans précédent, ainsi que de puissantes capacités de compréhension multimodale et de codage.

  • gemini-3.1-flash-image-preview

    Intelligence visuelle de niveau professionnel, efficacité de Gemini Flash et capacités de génération ancrées dans la réalité.

  • gemini-3.1-flash-lite-preview

    Notre modèle le plus économique, optimisé pour les tâches agentiques à volume élevé, la traduction et le traitement de données simples.

  • gemini-3.1-flash-tts-preview

    Gemini 3.1 Flash TTS : génération vocale puissante et à faible latence. Profitez de résultats naturels, d'invites orientables et de nouvelles balises audio expressives pour un contrôle précis de la narration.

  • lyria-3-clip-preview

    Notre modèle de génération de musique à faible latence est optimisé pour les extraits audio haute fidélité et le contrôle rythmique précis.

  • lyria-3-pro-preview

    Notre modèle génératif avancé de chansons entières, avec une compréhension approfondie de la composition, optimisé pour un contrôle précis de la structure et des transitions complexes dans différents styles musicaux.

Modèle qui complétera votre requête.\n\nPour en savoir plus, consultez [modèles](https://ai.google.dev/gemini-api/docs/models).

agent AgentOption  (facultatif)

Nom de l'agent utilisé pour générer l'interaction.

Valeurs possibles :

  • deep-research-pro-preview-12-2025

    Agent Gemini Deep Research

  • deep-research-preview-04-2026

    Agent Gemini Deep Research

  • deep-research-max-preview-04-2026

    Agent Gemini Deep Research Max

Agent avec lequel interagir.

id chaîne  (facultatif)

Obligatoire. Uniquement en sortie. Identifiant unique de la fin de l'interaction.

status enum (string)  (facultatif)

Obligatoire. Uniquement en sortie. État de l'interaction.

Valeurs possibles :

  • in_progress
  • requires_action
  • completed
  • failed
  • cancelled
  • incomplete
created string  (facultatif)

Obligatoire. Uniquement en sortie. Heure à laquelle la réponse a été créée, au format ISO 8601 (AAAA-MM-JJThh:mm:ssZ).

updated string  (facultatif)

Obligatoire. Uniquement en sortie. Heure à laquelle la réponse a été mise à jour pour la dernière fois au format ISO 8601 (AAAA-MM-JJThh:mm:ssZ).

role string  (facultatif)

Uniquement en sortie. Rôle de l'interaction.

outputs array (Content)  (facultatif)

Uniquement en sortie. Réponses du modèle.

system_instruction string  (facultatif)

Instruction système pour l'interaction.

tools array (Tool)  (facultatif)

Liste des déclarations d'outils que le modèle peut appeler lors de l'interaction.

usage Usage  (facultatif)

Uniquement en sortie. Statistiques sur l'utilisation des jetons de la demande d'interaction.

Statistiques sur l'utilisation des jetons de la demande d'interaction.

Champs

total_input_tokens integer  (optional)

Nombre de jetons dans le prompt (contexte).

input_tokens_by_modality ModalityTokens  (facultatif)

Répartition de l'utilisation des jetons d'entrée par modalité.

Nombre de jetons pour une seule modalité de réponse.

Champs

modality ResponseModality  (facultatif)

Modalité associée au nombre de jetons.

Valeurs possibles :

  • text
  • image
  • audio
  • video
  • document

tokens integer  (facultatif)

Nombre de jetons pour la modalité.

total_cached_tokens integer  (optional)

Nombre de jetons dans la partie mise en cache de la requête (le contenu mis en cache).

cached_tokens_by_modality ModalityTokens  (facultatif)

Répartition de l'utilisation des jetons mis en cache par modalité.

Nombre de jetons pour une seule modalité de réponse.

Champs

modality ResponseModality  (facultatif)

Modalité associée au nombre de jetons.

Valeurs possibles :

  • text
  • image
  • audio
  • video
  • document

tokens integer  (facultatif)

Nombre de jetons pour la modalité.

total_output_tokens integer  (facultatif)

Nombre total de jetons dans toutes les réponses générées.

output_tokens_by_modality ModalityTokens  (facultatif)

Répartition de l'utilisation des jetons de sortie par modalité.

Nombre de jetons pour une seule modalité de réponse.

Champs

modality ResponseModality  (facultatif)

Modalité associée au nombre de jetons.

Valeurs possibles :

  • text
  • image
  • audio
  • video
  • document

tokens integer  (facultatif)

Nombre de jetons pour la modalité.

total_tool_use_tokens integer  (optional)

Nombre de jetons présents dans la ou les invites d'utilisation d'outils.

tool_use_tokens_by_modality ModalityTokens  (facultatif)

Répartition de l'utilisation des jetons d'outil par modalité.

Nombre de jetons pour une seule modalité de réponse.

Champs

modality ResponseModality  (facultatif)

Modalité associée au nombre de jetons.

Valeurs possibles :

  • text
  • image
  • audio
  • video
  • document

tokens integer  (facultatif)

Nombre de jetons pour la modalité.

total_thought_tokens integer  (facultatif)

Nombre de jetons de pensées pour les modèles à raisonnement.

total_tokens integer  (optional)

Nombre total de jetons pour la requête d'interaction (requête + réponses + autres jetons internes).

response_modalities ResponseModality  (facultatif)

Modalités de réponse demandées (TEXT, IMAGE, AUDIO).

Valeurs possibles :

  • text
  • image
  • audio
  • video
  • document

response_format object  (facultatif)

Garantit que la réponse générée est un objet JSON conforme au schéma JSON spécifié dans ce champ.

response_mime_type string  (facultatif)

Type MIME de la réponse. Obligatoire si response_format est défini.

previous_interaction_id string  (facultatif)

ID de l'interaction précédente, le cas échéant.

service_tier enum (string)  (optional)

Niveau de service de l'interaction.

Valeurs possibles :

  • flex
  • standard
  • priority
input Content ou tableau (Content) ou tableau (Turn) ou chaîne  (facultatif)

Entrée de l'interaction.

agent_config object  (facultatif)

Paramètres de configuration de l'interaction de l'agent.

Types possibles

Discriminant polymorphe : type

DynamicAgentConfig

Configuration des agents dynamiques.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "dynamic".

DeepResearchAgentConfig

Configuration de l'agent Deep Research.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "deep-research".

thinking_summaries ThinkingSummaries  (facultatif)

Indique si la réponse doit inclure des résumés de la réflexion.

Valeurs possibles :

  • auto
  • none

visualization enum (string)  (facultatif)

Indique si la réponse doit inclure des visualisations.

Valeurs possibles :

  • off
  • auto
collaborative_planning boolean  (facultatif)

Active la planification human-in-the-loop pour l'agent Deep Research. Si la valeur est définie sur "true", l'agent Deep Research fournira un plan de recherche dans sa réponse. L'agent ne poursuivra la procédure que si l'utilisateur confirme le forfait au prochain tour.

Exemples

Exemple

{
  "created": "2025-12-04T15:01:45Z",
  "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg",
  "model": "gemini-3-flash-preview",
  "object": "interaction",
  "outputs": [
    {
      "text": "Hello! I'm doing well, functioning as expected. Thank you for asking! How are you doing today?",
      "type": "text"
    }
  ],
  "role": "model",
  "status": "completed",
  "updated": "2025-12-04T15:01:45Z",
  "usage": {
    "input_tokens_by_modality": [
      {
        "modality": "text",
        "tokens": 7
      }
    ],
    "total_cached_tokens": 0,
    "total_input_tokens": 7,
    "total_output_tokens": 23,
    "total_thought_tokens": 49,
    "total_tokens": 79,
    "total_tool_use_tokens": 0
  }
}

Modèles de données

Contenu

Contenu de la réponse.

Types possibles

Discriminant polymorphe : type

TextContent

Bloc de contenu textuel.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "text".

text string  (obligatoire)

Obligatoire. Contenu textuel.

annotations Annotation  (optional)

Informations de citation pour le contenu généré par le modèle.

Informations de citation pour le contenu généré par le modèle.

Types possibles

Discriminant polymorphe : type

UrlCitation

Annotation de citation d'URL.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "url_citation".

url string  (optional)

URL.

title string  (facultatif)

Titre de l'URL.

start_index integer  (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer  (facultatif)

Fin du segment attribué (exclusif).

FileCitation

Annotation de citation de fichier.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "file_citation".

document_uri string  (optional)

URI du fichier.

file_name string  (facultatif)

Nom du fichier.

source string  (facultatif)

Source attribuée à une partie du texte.

start_index integer  (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer  (facultatif)

Fin du segment attribué (exclusif).

PlaceCitation

Annotation de citation d'un lieu.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "place_citation".

place_id string  (facultatif)

ID du lieu, au format `places/{place_id}`.

name string  (facultatif)

Titre du lieu.

url string  (optional)

Référence URI du lieu.

review_snippets ReviewSnippet  (facultatif)

Extraits d'avis utilisés pour générer des réponses sur les caractéristiques d'un lieu donné dans Google Maps.

Encapsule un extrait d'avis d'utilisateur qui répond à une question sur les caractéristiques d'un lieu spécifique dans Google Maps.

Champs

title string  (facultatif)

Titre de l'avis.

url string  (optional)

Lien correspondant à l'avis de l'utilisateur sur Google Maps.

review_id string  (facultatif)

ID de l'extrait d'avis.

start_index integer  (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer  (facultatif)

Fin du segment attribué (exclusif).

ImageContent

Bloc de contenu d'image.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "image".

data string  (facultatif)

Contenu de l'image.

uri string  (facultatif)

URI de l'image.

mime_type enum (string)  (optional)

Type MIME de l'image.

Valeurs possibles :

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
  • image/gif
  • image/bmp
  • image/tiff
resolution MediaResolution  (facultatif)

Résolution du contenu multimédia.

Valeurs possibles :

  • low
  • medium
  • high
  • ultra_high

AudioContent

Bloc de contenu audio.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "audio".

data string  (facultatif)

Contenu audio.

uri string  (facultatif)

URI de l'élément audio.

mime_type enum (string)  (optional)

Type MIME du contenu audio.

Valeurs possibles :

  • audio/wav
  • audio/mp3
  • audio/aiff
  • audio/aac
  • audio/ogg
  • audio/flac
  • audio/mpeg
  • audio/m4a
  • audio/l16
  • audio/opus
  • audio/alaw
  • audio/mulaw
rate integer  (facultatif)

Taux d'échantillonnage de l'audio.

channels integer  (facultatif)

Nombre de canaux audio.

DocumentContent

Bloc de contenu d'un document.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "document".

data string  (facultatif)

Contenu du document.

uri string  (facultatif)

URI du document.

mime_type enum (string)  (optional)

Type MIME du document.

Valeurs possibles :

  • application/pdf
VideoContent

Bloc de contenu vidéo.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "video".

data string  (facultatif)

Le contenu vidéo

uri string  (facultatif)

URI de la vidéo.

mime_type enum (string)  (optional)

Type MIME de la vidéo.

Valeurs possibles :

  • video/mp4
  • video/mpeg
  • video/mpg
  • video/mov
  • video/avi
  • video/x-flv
  • video/webm
  • video/wmv
  • video/3gpp
resolution MediaResolution  (facultatif)

Résolution du contenu multimédia.

Valeurs possibles :

  • low
  • medium
  • high
  • ultra_high

ThoughtContent

Bloc de contenu de réflexion.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "thought".

signature string  (facultatif)

Signature permettant de faire correspondre la source du backend à inclure dans la génération.

summary ThoughtSummaryContent  (facultatif)

Un résumé de la pensée.

Types possibles

Discriminant polymorphe : type

TextContent

Bloc de contenu textuel.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "text".

text string  (obligatoire)

Obligatoire. Contenu textuel.

annotations Annotation  (optional)

Informations de citation pour le contenu généré par le modèle.

Informations de citation pour le contenu généré par le modèle.

Types possibles

Discriminant polymorphe : type

UrlCitation

Annotation de citation d'URL.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "url_citation".

url string  (optional)

URL.

title string  (facultatif)

Titre de l'URL.

start_index integer  (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer  (facultatif)

Fin du segment attribué (exclusif).

FileCitation

Annotation de citation de fichier.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "file_citation".

document_uri string  (optional)

URI du fichier.

file_name string  (facultatif)

Nom du fichier.

source string  (facultatif)

Source attribuée à une partie du texte.

start_index integer  (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer  (facultatif)

Fin du segment attribué (exclusif).

PlaceCitation

Annotation de citation d'un lieu.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "place_citation".

place_id string  (facultatif)

ID du lieu, au format `places/{place_id}`.

name string  (facultatif)

Titre du lieu.

url string  (optional)

Référence URI du lieu.

review_snippets ReviewSnippet  (facultatif)

Extraits d'avis utilisés pour générer des réponses sur les caractéristiques d'un lieu donné dans Google Maps.

Encapsule un extrait d'avis d'utilisateur qui répond à une question sur les caractéristiques d'un lieu spécifique dans Google Maps.

Champs

title string  (facultatif)

Titre de l'avis.

url string  (optional)

Lien correspondant à l'avis de l'utilisateur sur Google Maps.

review_id string  (facultatif)

ID de l'extrait d'avis.

start_index integer  (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer  (facultatif)

Fin du segment attribué (exclusif).

ImageContent

Bloc de contenu d'image.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "image".

data string  (facultatif)

Contenu de l'image.

uri string  (facultatif)

URI de l'image.

mime_type enum (string)  (optional)

Type MIME de l'image.

Valeurs possibles :

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
  • image/gif
  • image/bmp
  • image/tiff
resolution MediaResolution  (facultatif)

Résolution du contenu multimédia.

Valeurs possibles :

  • low
  • medium
  • high
  • ultra_high

FunctionCallContent

Bloc de contenu d'appel d'outil de fonction.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "function_call".

name string  (obligatoire)

Obligatoire. Nom de l'outil à appeler.

arguments object  (obligatoire)

Obligatoire. Arguments à transmettre à la fonction.

id chaîne  (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

CodeExecutionCallContent

Contenu d'exécution de code.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "code_execution_call".

arguments CodeExecutionCallArguments  (obligatoire)

Obligatoire. Arguments à transmettre à l'exécution du code.

Arguments à transmettre à l'exécution du code.

Champs

language enum (string)  (facultatif)

Langage de programmation du code.

Valeurs possibles :

  • python
code string  (facultatif)

Code à exécuter.

id chaîne  (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

UrlContextCallContent

Contenu du contexte de l'URL.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "url_context_call".

arguments UrlContextCallArguments  (obligatoire)

Obligatoire. Arguments à transmettre au contexte de l'URL.

Arguments à transmettre au contexte de l'URL.

Champs

urls array (string)  (optional)

URL à récupérer.

id chaîne  (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

McpServerToolCallContent

Contenu de l'appel d'outil MCPServer.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "mcp_server_tool_call".

name string  (obligatoire)

Obligatoire. Nom de l'outil appelé.

server_name string  (required)

Obligatoire. Nom du serveur MCP utilisé.

arguments object  (obligatoire)

Obligatoire. Objet JSON des arguments de la fonction.

id chaîne  (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

GoogleSearchCallContent

Contenu de la recherche Google.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "google_search_call".

arguments GoogleSearchCallArguments  (obligatoire)

Obligatoire. Arguments à transmettre à la recherche Google.

Arguments à transmettre à la recherche Google.

Champs

queries array (string)  (facultatif)

Requêtes de recherche sur le Web pour la recherche sur le Web de suivi.

search_type enum (string)  (optional)

Type d'ancrage avec la recherche activé.

Valeurs possibles :

  • web_search
  • image_search
  • enterprise_web_search
id chaîne  (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

FileSearchCallContent

Contenu de la recherche de fichiers.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "file_search_call".

id chaîne  (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

GoogleMapsCallContent

Contenu Google Maps.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "google_maps_call".

arguments GoogleMapsCallArguments  (facultatif)

Arguments à transmettre à l'outil Google Maps.

Arguments à transmettre à l'outil Google Maps.

Champs

queries array (string)  (facultatif)

Requêtes à exécuter.

id chaîne  (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

FunctionResultContent

Bloc de contenu de résultat d'outil de fonction.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "function_result".

name string  (facultatif)

Nom de l'outil appelé.

is_error boolean  (facultatif)

Indique si l'appel d'outil a entraîné une erreur.

call_id string  (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

result array (FunctionResultSubcontent) or string  (required)

Résultat de l'appel d'outil.

CodeExecutionResultContent

Contenu du résultat de l'exécution du code.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "code_execution_result".

result string  (obligatoire)

Obligatoire. Sortie de l'exécution du code.

is_error boolean  (facultatif)

Indique si l'exécution du code a entraîné une erreur.

call_id string  (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

UrlContextResultContent

Contenu du résultat du contexte de l'URL.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "url_context_result".

result UrlContextResult  (obligatoire)

Obligatoire. Résultats du contexte de l'URL.

Résultat du contexte de l'URL.

Champs

url string  (optional)

URL récupérée.

status enum (string)  (facultatif)

État de la récupération de l'URL.

Valeurs possibles :

  • success
  • error
  • paywall
  • unsafe
is_error boolean  (facultatif)

Indique si le contexte de l'URL a entraîné une erreur.

call_id string  (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

GoogleSearchResultContent

Contenu des résultats de recherche Google.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "google_search_result".

result GoogleSearchResult  (required)

Obligatoire. Résultats de la recherche Google.

Résultat de la recherche Google.

Champs

search_suggestions string  (facultatif)

Extrait de contenu Web pouvant être intégré à une page Web ou à une WebView d'application.

is_error boolean  (facultatif)

Indique si la recherche Google a généré une erreur.

call_id string  (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

McpServerToolResultContent

Contenu des résultats de l'outil MCPServer.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "mcp_server_tool_result".

name string  (facultatif)

Nom de l'outil appelé pour cet appel d'outil spécifique.

server_name string  (facultatif)

Nom du serveur MCP utilisé.

call_id string  (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

result array (FunctionResultSubcontent) or string  (required)

Résultat de l'appel du serveur MCP. Il peut s'agir de texte simple ou de contenu enrichi.

FileSearchResultContent

Contenu des résultats de recherche de fichiers.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "file_search_result".

result FileSearchResult  (obligatoire)

Obligatoire. Résultats de la recherche de fichiers.

Résultat de la recherche de fichiers.

Champs

custom_metadata array (object)  (optional)

Métadonnées fournies par l'utilisateur concernant FileSearchResult.

call_id string  (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

GoogleMapsResultContent

Contenu des résultats Google Maps.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "google_maps_result".

result GoogleMapsResult  (obligatoire)

Obligatoire. Résultats de Google Maps.

Résultat de Google Maps.

Champs

places Places  (facultatif)

Les lieux trouvés.

Champs

place_id string  (facultatif)

ID du lieu, au format `places/{place_id}`.

name string  (facultatif)

Titre du lieu.

url string  (optional)

Référence URI du lieu.

review_snippets ReviewSnippet  (facultatif)

Extraits d'avis utilisés pour générer des réponses sur les caractéristiques d'un lieu donné dans Google Maps.

Encapsule un extrait d'avis d'utilisateur qui répond à une question sur les caractéristiques d'un lieu spécifique dans Google Maps.

Champs

title string  (facultatif)

Titre de l'avis.

url string  (optional)

Lien correspondant à l'avis de l'utilisateur sur Google Maps.

review_id string  (facultatif)

ID de l'extrait d'avis.

widget_context_token string  (facultatif)

Nom de ressource du jeton de contexte du widget Google Maps.

call_id string  (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

Exemples

Texte

{
  "type": "text",
  "text": "Hello, how are you?"
}

Image

{
  "type": "image",
  "data": "BASE64_ENCODED_IMAGE",
  "mime_type": "image/png"
}

Audio

{
  "type": "audio",
  "data": "BASE64_ENCODED_AUDIO",
  "mime_type": "audio/wav"
}

Document

{
  "type": "document",
  "data": "BASE64_ENCODED_DOCUMENT",
  "mime_type": "application/pdf"
}

Vidéo

{
  "type": "video",
  "uri": "https://www.youtube.com/watch?v=9hE5-98ZeCg"
}

Réflexion

{
  "type": "thought",
  "summary": [
    {
      "type": "text",
      "text": "The user is asking about the weather. I should use the get_weather tool."
    }
  ],
  "signature": "CoMDAXLI2nynRYojJIy6B1Jh9os2crpWLfB0+19xcLsGG46bd8wjkF/6RNlRUdvHrXyjsHkG0BZFcuO/bPOyA6Xh5jANNgx82wPHjGExN8A4ZQn56FlMwyZoqFVQz0QyY1lfibFJ2zU3J87uw26OewzcuVX0KEcs+GIsZa3EA6WwqhbsOd3wtZB3Ua2Qf98VAWZTS5y/tWpql7jnU3/CU7pouxQr/Bwft3hwnJNesQ9/dDJTuaQ8Zprh9VRWf1aFFjpIueOjBRrlT3oW6/y/eRl/Gt9BQXCYTqg/38vHFUU4Wo/d9dUpvfCe/a3o97t2Jgxp34oFKcsVb4S5WJrykIkw+14DzVnTpCpbQNFckqvFLuqnJCkL0EQFtunBXI03FJpPu3T1XU6id8S7ojoJQZSauGUCgmaLqUGdMrd08oo81ecoJSLs51Re9N/lISGmjWFPGpqJLoGq6uo4FHz58hmeyXCgHG742BHz2P3MiH1CXHUT2J8mF6zLhf3SR9Qb3lkrobAh"
}

Appel de fonction

{
  "type": "function_call",
  "name": "get_weather",
  "id": "gth23981",
  "arguments": {
    "location": "Boston, MA"
  }
}

Appel d'exécution de code

{
  "type": "code_execution_call",
  "id": "call_123456",
  "arguments": {
    "language": "python",
    "code": "print('hello world')"
  }
}

Appel de contexte d'URL

{
  "type": "url_context_call",
  "id": "call_123456",
  "arguments": {
    "urls": [
      "https://www.example.com"
    ]
  }
}

Appel d'outil du serveur MCP

{
  "type": "mcp_server_tool_call",
  "id": "call_123456",
  "name": "get_forecast",
  "server_name": "weather_server",
  "arguments": {
    "city": "London"
  }
}

Appel depuis la recherche Google

{
  "type": "google_search_call",
  "id": "call_123456",
  "arguments": {
    "queries": [
      "weather in Boston"
    ]
  }
}

Appel de recherche de fichier

{
  "type": "file_search_call",
  "id": "call_123456"
}

Appel Google Maps

{
  "type": "google_maps_call",
  "id": "call_123456",
  "arguments": {
    "query": "best food near me"
  }
}

Résultat de la fonction

{
  "type": "function_result",
  "name": "get_weather",
  "call_id": "gth23981",
  "result": [
    {
      "type": "text",
      "text": "{\"weather\":\"sunny\"}"
    }
  ]
}

Résultat de l'exécution du code

{
  "type": "code_execution_result",
  "call_id": "call_123456",
  "result": "hello world"
}

Résultat du contexte de l'URL

{
  "type": "url_context_result",
  "call_id": "call_123456",
  "result": [
    {
      "url": "https://www.example.com",
      "status": "SUCCESS"
    }
  ]
}

Résultat de recherche Google

{
  "type": "google_search_result",
  "call_id": "call_123456",
  "result": [
    {
      "url": "https://www.google.com/search?q=weather+in+Boston",
      "title": "Weather in Boston"
    }
  ]
}

Résultat de l'outil de serveur MCP

{
  "type": "mcp_server_tool_result",
  "name": "get_forecast",
  "server_name": "weather_server",
  "call_id": "call_123456",
  "result": "sunny"
}

Résultat de recherche de fichier

{
  "type": "file_search_result",
  "call_id": "call_123456",
  "result": [
    {
      "text": "search result chunk",
      "file_search_store": "file_search_store"
    }
  ]
}

Résultat Google Maps

{
  "type": "google_maps_result",
  "call_id": "call_123456",
  "result": [
    {
      "places": [
        {
          "url": "https://www.google.com/maps/search/best+food+near+me",
          "name": "Tasty Restaurant"
        }
      ]
    }
  ]
}

Outil

Outil pouvant être utilisé par le modèle.

Types possibles

Discriminant polymorphe : type

Fonction

Outil pouvant être utilisé par le modèle.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "function".

name string  (facultatif)

Nom de la fonction.

description string  (facultatif)

Description de la fonction.

parameters object  (facultatif)

Schéma JSON pour les paramètres de la fonction.

CodeExecution

Outil que le modèle peut utiliser pour exécuter du code.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "code_execution".

UrlContext

Outil que le modèle peut utiliser pour récupérer le contexte d'une URL.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "url_context".

ComputerUse

Outil que le modèle peut utiliser pour interagir avec l'ordinateur.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "computer_use".

environment enum (string)  (optional)

Environnement exploité.

Valeurs possibles :

  • browser
excludedPredefinedFunctions array (string)  (facultatif)

Liste des fonctions prédéfinies exclues de l'appel de modèle.

McpServer

Un MCPServer est un serveur qui peut être appelé par le modèle pour effectuer des actions.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "mcp_server".

name string  (facultatif)

Nom du MCPServer.

url string  (optional)

URL complète du point de terminaison MCPServer. Exemple : "https://api.example.com/mcp"

headers object  (facultatif)

Facultatif : Champs pour les en-têtes d'authentification, les délais d'attente, etc., si nécessaire.

allowed_tools AllowedTools  (facultatif)

Outils autorisés.

Configuration des outils autorisés.

Champs

mode ToolChoiceType  (facultatif)

Mode de choix de l'outil.

Valeurs possibles :

  • auto
  • any
  • none
  • validated

tools array (string)  (facultatif)

Noms des outils autorisés.

GoogleSearch

Outil que le modèle peut utiliser pour effectuer des recherches sur Google.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "google_search".

search_types array (enum (string))  (optional)

Types d'ancrage de recherche à activer.

Valeurs possibles :

  • web_search
  • image_search
  • enterprise_web_search
FileSearch

Outil que le modèle peut utiliser pour rechercher des fichiers.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "file_search".

file_search_store_names array (string)  (optional)

Noms des magasins de fichiers à rechercher.

top_k integer  (optional)

Nombre de blocs de récupération sémantique à récupérer.

metadata_filter string  (optional)

Filtre de métadonnées à appliquer aux documents et aux blocs de récupération sémantique.

GoogleMaps

Outil que le modèle peut utiliser pour appeler Google Maps.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "google_maps".

enable_widget boolean  (facultatif)

Indique s'il faut renvoyer un jeton de contexte de widget dans le résultat de l'appel d'outil de la réponse.

latitude number  (facultatif)

Latitude de l'emplacement de l'utilisateur.

longitude number  (facultatif)

Longitude de la position de l'utilisateur.

Récupération

Outil que le modèle peut utiliser pour récupérer des fichiers.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "retrieval".

retrieval_types array (enum (string))  (optional)

Types de récupération de fichiers à activer.

Valeurs possibles :

  • vertex_ai_search
vertex_ai_search_config VertexAISearchConfig  (facultatif)

Permet de spécifier la configuration de VertexAISearch.

Permet de spécifier la configuration de VertexAISearch.

Champs

engine string  (facultatif)

Facultatif. Permet de spécifier le moteur de recherche Vertex AI.

datastores array (string)  (optional)

Facultatif. Permet de spécifier les data stores Vertex AI Search.

Exemples

Fonction

CodeExecution

UrlContext

ComputerUse

McpServer

GoogleSearch

FileSearch

GoogleMaps

Récupération

Aucun exemple n'est disponible pour ce type.

CANNOT TRANSLATE

Champs

role string  (facultatif)

L'auteur de ce tour. Doit être "user" pour l'entrée ou "model" pour la sortie du modèle.

content array (Content) or string  (optional)

Aucune description fournie.

Exemples

Tour de l'utilisateur

{
  "role": "user",
  "content": [
    {
      "type": "text",
      "text": "user turn"
    }
  ]
}

Tour de modèle

{
  "role": "model",
  "content": [
    {
      "type": "text",
      "text": "model turn"
    }
  ]
}

InteractionSseEvent

Types possibles

Discriminant polymorphe : event_type

InteractionStartEvent

event_type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "interaction.start".

interaction Interaction  (obligatoire)

Aucune description fournie.

event_id string  (facultatif)

Jeton event_id à utiliser pour reprendre le flux d'interaction à partir de cet événement.

InteractionCompleteEvent

event_type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "interaction.complete".

interaction Interaction  (obligatoire)

Obligatoire. Interaction terminée avec des sorties vides pour réduire la taille de la charge utile. Utilisez les événements ContentDelta précédents pour la sortie réelle.

event_id string  (facultatif)

Jeton event_id à utiliser pour reprendre le flux d'interaction à partir de cet événement.

InteractionStatusUpdate

event_type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "interaction.status_update".

interaction_id string  (required)

Aucune description fournie.

status enum (string)  (required)

Aucune description fournie.

Valeurs possibles :

  • in_progress
  • requires_action
  • completed
  • failed
  • cancelled
  • incomplete
event_id string  (facultatif)

Jeton event_id à utiliser pour reprendre le flux d'interaction à partir de cet événement.

ContentStart

event_type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "content.start".

index integer  (obligatoire)

Aucune description fournie.

content Content  (obligatoire)

Aucune description fournie.

event_id string  (facultatif)

Jeton event_id à utiliser pour reprendre le flux d'interaction à partir de cet événement.

ContentDelta

event_type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "content.delta".

index integer  (obligatoire)

Aucune description fournie.

delta ContentDeltaData  (required)

Aucune description fournie.

Données de contenu delta pour un bloc de contenu.

Types possibles

Discriminant polymorphe : type

TextDelta

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "text".

text string  (obligatoire)

Aucune description fournie.

ImageDelta

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "image".

data string  (facultatif)

Aucune description fournie.

uri string  (facultatif)

Aucune description fournie.

mime_type enum (string)  (optional)

Aucune description fournie.

Valeurs possibles :

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
  • image/gif
  • image/bmp
  • image/tiff
resolution MediaResolution  (facultatif)

Résolution du contenu multimédia.

Valeurs possibles :

  • low
  • medium
  • high
  • ultra_high

AudioDelta

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "audio".

data string  (facultatif)

Aucune description fournie.

uri string  (facultatif)

Aucune description fournie.

mime_type enum (string)  (optional)

Aucune description fournie.

Valeurs possibles :

  • audio/wav
  • audio/mp3
  • audio/aiff
  • audio/aac
  • audio/ogg
  • audio/flac
  • audio/mpeg
  • audio/m4a
  • audio/l16
  • audio/opus
  • audio/alaw
  • audio/mulaw
rate integer  (facultatif)

Taux d'échantillonnage de l'audio.

channels integer  (facultatif)

Nombre de canaux audio.

DocumentDelta

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "document".

data string  (facultatif)

Aucune description fournie.

uri string  (facultatif)

Aucune description fournie.

mime_type enum (string)  (optional)

Aucune description fournie.

Valeurs possibles :

  • application/pdf
VideoDelta

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "video".

data string  (facultatif)

Aucune description fournie.

uri string  (facultatif)

Aucune description fournie.

mime_type enum (string)  (optional)

Aucune description fournie.

Valeurs possibles :

  • video/mp4
  • video/mpeg
  • video/mpg
  • video/mov
  • video/avi
  • video/x-flv
  • video/webm
  • video/wmv
  • video/3gpp
resolution MediaResolution  (facultatif)

Résolution du contenu multimédia.

Valeurs possibles :

  • low
  • medium
  • high
  • ultra_high

ThoughtSummaryDelta

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "thought_summary".

content ThoughtSummaryContent  (facultatif)

Nouvel élément de résumé à ajouter à la pensée.

Types possibles

Discriminant polymorphe : type

TextContent

Bloc de contenu textuel.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "text".

text string  (obligatoire)

Obligatoire. Contenu textuel.

annotations Annotation  (optional)

Informations de citation pour le contenu généré par le modèle.

Informations de citation pour le contenu généré par le modèle.

Types possibles

Discriminant polymorphe : type

UrlCitation

Annotation de citation d'URL.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "url_citation".

url string  (optional)

URL.

title string  (facultatif)

Titre de l'URL.

start_index integer  (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer  (facultatif)

Fin du segment attribué (exclusif).

FileCitation

Annotation de citation de fichier.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "file_citation".

document_uri string  (optional)

URI du fichier.

file_name string  (facultatif)

Nom du fichier.

source string  (facultatif)

Source attribuée à une partie du texte.

start_index integer  (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer  (facultatif)

Fin du segment attribué (exclusif).

PlaceCitation

Annotation de citation d'un lieu.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "place_citation".

place_id string  (facultatif)

ID du lieu, au format `places/{place_id}`.

name string  (facultatif)

Titre du lieu.

url string  (optional)

Référence URI du lieu.

review_snippets ReviewSnippet  (facultatif)

Extraits d'avis utilisés pour générer des réponses sur les caractéristiques d'un lieu donné dans Google Maps.

Encapsule un extrait d'avis d'utilisateur qui répond à une question sur les caractéristiques d'un lieu spécifique dans Google Maps.

Champs

title string  (facultatif)

Titre de l'avis.

url string  (optional)

Lien correspondant à l'avis de l'utilisateur sur Google Maps.

review_id string  (facultatif)

ID de l'extrait d'avis.

start_index integer  (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer  (facultatif)

Fin du segment attribué (exclusif).

ImageContent

Bloc de contenu d'image.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "image".

data string  (facultatif)

Contenu de l'image.

uri string  (facultatif)

URI de l'image.

mime_type enum (string)  (optional)

Type MIME de l'image.

Valeurs possibles :

  • image/png
  • image/jpeg
  • image/webp
  • image/heic
  • image/heif
  • image/gif
  • image/bmp
  • image/tiff
resolution MediaResolution  (facultatif)

Résolution du contenu multimédia.

Valeurs possibles :

  • low
  • medium
  • high
  • ultra_high

ThoughtSignatureDelta

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "thought_signature".

signature string  (facultatif)

Signature permettant de faire correspondre la source du backend à inclure dans la génération.

FunctionCallDelta

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "function_call".

name string  (obligatoire)

Aucune description fournie.

arguments object  (obligatoire)

Aucune description fournie.

id chaîne  (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

CodeExecutionCallDelta

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "code_execution_call".

arguments CodeExecutionCallArguments  (obligatoire)

Aucune description fournie.

Arguments à transmettre à l'exécution du code.

Champs

language enum (string)  (facultatif)

Langage de programmation du code.

Valeurs possibles :

  • python
code string  (facultatif)

Code à exécuter.

id chaîne  (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

UrlContextCallDelta

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "url_context_call".

arguments UrlContextCallArguments  (obligatoire)

Aucune description fournie.

Arguments à transmettre au contexte de l'URL.

Champs

urls array (string)  (optional)

URL à récupérer.

id chaîne  (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

GoogleSearchCallDelta

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "google_search_call".

arguments GoogleSearchCallArguments  (obligatoire)

Aucune description fournie.

Arguments à transmettre à la recherche Google.

Champs

queries array (string)  (facultatif)

Requêtes de recherche sur le Web pour la recherche sur le Web de suivi.

id chaîne  (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

McpServerToolCallDelta

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "mcp_server_tool_call".

name string  (obligatoire)

Aucune description fournie.

server_name string  (required)

Aucune description fournie.

arguments object  (obligatoire)

Aucune description fournie.

id chaîne  (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

FileSearchCallDelta

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "file_search_call".

id chaîne  (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

GoogleMapsCallDelta

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "google_maps_call".

arguments GoogleMapsCallArguments  (facultatif)

Arguments à transmettre à l'outil Google Maps.

Arguments à transmettre à l'outil Google Maps.

Champs

queries array (string)  (facultatif)

Requêtes à exécuter.

id chaîne  (obligatoire)

Obligatoire. ID unique pour cet appel d'outil spécifique.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

FunctionResultDelta

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "function_result".

name string  (facultatif)

Aucune description fournie.

is_error boolean  (facultatif)

Aucune description fournie.

call_id string  (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

result array (FunctionResultSubcontent) or string  (required)

Aucune description fournie.

CodeExecutionResultDelta

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "code_execution_result".

result string  (obligatoire)

Aucune description fournie.

is_error boolean  (facultatif)

Aucune description fournie.

call_id string  (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

UrlContextResultDelta

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "url_context_result".

result UrlContextResult  (obligatoire)

Aucune description fournie.

Résultat du contexte de l'URL.

Champs

url string  (optional)

URL récupérée.

status enum (string)  (facultatif)

État de la récupération de l'URL.

Valeurs possibles :

  • success
  • error
  • paywall
  • unsafe
is_error boolean  (facultatif)

Aucune description fournie.

call_id string  (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

GoogleSearchResultDelta

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "google_search_result".

result GoogleSearchResult  (required)

Aucune description fournie.

Résultat de la recherche Google.

Champs

search_suggestions string  (facultatif)

Extrait de contenu Web pouvant être intégré à une page Web ou à une WebView d'application.

is_error boolean  (facultatif)

Aucune description fournie.

call_id string  (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

McpServerToolResultDelta

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "mcp_server_tool_result".

name string  (facultatif)

Aucune description fournie.

server_name string  (facultatif)

Aucune description fournie.

call_id string  (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

result array (FunctionResultSubcontent) or string  (required)

Aucune description fournie.

FileSearchResultDelta

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "file_search_result".

result FileSearchResult  (obligatoire)

Aucune description fournie.

Résultat de la recherche de fichiers.

Champs

custom_metadata array (object)  (optional)

Métadonnées fournies par l'utilisateur concernant FileSearchResult.

call_id string  (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

GoogleMapsResultDelta

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "google_maps_result".

result GoogleMapsResult  (facultatif)

Résultats de Google Maps.

Résultat de Google Maps.

Champs

places Places  (facultatif)

Les lieux trouvés.

Champs

place_id string  (facultatif)

ID du lieu, au format `places/{place_id}`.

name string  (facultatif)

Titre du lieu.

url string  (optional)

Référence URI du lieu.

review_snippets ReviewSnippet  (facultatif)

Extraits d'avis utilisés pour générer des réponses sur les caractéristiques d'un lieu donné dans Google Maps.

Encapsule un extrait d'avis d'utilisateur qui répond à une question sur les caractéristiques d'un lieu spécifique dans Google Maps.

Champs

title string  (facultatif)

Titre de l'avis.

url string  (optional)

Lien correspondant à l'avis de l'utilisateur sur Google Maps.

review_id string  (facultatif)

ID de l'extrait d'avis.

widget_context_token string  (facultatif)

Nom de ressource du jeton de contexte du widget Google Maps.

call_id string  (obligatoire)

Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.

signature string  (facultatif)

Hachage de signature pour la validation du backend.

TextAnnotationDelta

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "text_annotation".

annotations Annotation  (optional)

Informations de citation pour le contenu généré par le modèle.

Informations de citation pour le contenu généré par le modèle.

Types possibles

Discriminant polymorphe : type

UrlCitation

Annotation de citation d'URL.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "url_citation".

url string  (optional)

URL.

title string  (facultatif)

Titre de l'URL.

start_index integer  (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer  (facultatif)

Fin du segment attribué (exclusif).

FileCitation

Annotation de citation de fichier.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "file_citation".

document_uri string  (optional)

URI du fichier.

file_name string  (facultatif)

Nom du fichier.

source string  (facultatif)

Source attribuée à une partie du texte.

start_index integer  (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer  (facultatif)

Fin du segment attribué (exclusif).

PlaceCitation

Annotation de citation d'un lieu.

type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "place_citation".

place_id string  (facultatif)

ID du lieu, au format `places/{place_id}`.

name string  (facultatif)

Titre du lieu.

url string  (optional)

Référence URI du lieu.

review_snippets ReviewSnippet  (facultatif)

Extraits d'avis utilisés pour générer des réponses sur les caractéristiques d'un lieu donné dans Google Maps.

Encapsule un extrait d'avis d'utilisateur qui répond à une question sur les caractéristiques d'un lieu spécifique dans Google Maps.

Champs

title string  (facultatif)

Titre de l'avis.

url string  (optional)

Lien correspondant à l'avis de l'utilisateur sur Google Maps.

review_id string  (facultatif)

ID de l'extrait d'avis.

start_index integer  (facultatif)

Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.

end_index integer  (facultatif)

Fin du segment attribué (exclusif).

event_id string  (facultatif)

Jeton event_id à utiliser pour reprendre le flux d'interaction à partir de cet événement.

ContentStop

event_type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "content.stop".

index integer  (obligatoire)

Aucune description fournie.

event_id string  (facultatif)

Jeton event_id à utiliser pour reprendre le flux d'interaction à partir de cet événement.

ErrorEvent

event_type object  (obligatoire)

Aucune description fournie.

Toujours défini sur "error".

error Error  (facultatif)

Aucune description fournie.

Message d'erreur provenant d'une interaction.

Champs

code string  (facultatif)

URI qui identifie le type d'erreur.

message string  (facultatif)

Message d'erreur lisible par l'utilisateur.

event_id string  (facultatif)

Jeton event_id à utiliser pour reprendre le flux d'interaction à partir de cet événement.

Exemples

Début de l'interaction

{
  "event_type": "interaction.start",
  "interaction": {
    "id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM",
    "model": "gemini-3-flash-preview",
    "object": "interaction",
    "status": "in_progress"
  }
}

Interaction terminée

{
  "event_type": "interaction.complete",
  "interaction": {
    "created": "2025-12-09T18:45:40Z",
    "id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM",
    "model": "gemini-3-flash-preview",
    "object": "interaction",
    "role": "model",
    "status": "completed",
    "updated": "2025-12-09T18:45:40Z",
    "usage": {
      "input_tokens_by_modality": [
        {
          "modality": "text",
          "tokens": 11
        }
      ],
      "total_cached_tokens": 0,
      "total_input_tokens": 11,
      "total_output_tokens": 364,
      "total_thought_tokens": 1120,
      "total_tokens": 1495,
      "total_tool_use_tokens": 0
    }
  }
}

Mise à jour de l'état de l'interaction

{
  "event_type": "interaction.status_update",
  "interaction_id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM",
  "status": "in_progress"
}

Début du contenu

{
  "event_type": "content.start",
  "content": {
    "type": "text"
  },
  "index": 1
}

Delta de contenu

{
  "event_type": "content.delta",
  "delta": {
    "type": "text",
    "text": "Elara\u2019s life was a symphony of quiet moments. A librarian, she found solace in the hushed aisles, the scent of aged paper, and the predictable rhythm of her days. Her small apartment, meticulously ordered, reflected this internal calm, save"
  },
  "index": 1
}

Arrêt du contenu

{
  "event_type": "content.stop",
  "index": 1
}

Événement d'erreur

{
  "event_type": "error",
  "error": {
    "message": "Failed to get completed interaction: Result not found.",
    "code": "not_found"
  }
}