L'API Gemini Interactions est une API expérimentale qui permet aux développeurs de créer des applications d'IA générative à l'aide des modèles Gemini. Gemini est notre modèle le plus performant, entièrement conçu pour être multimodal. Il peut généraliser, comprendre avec fluidité, traiter et combiner différents supports d'informations, dont le texte, le code, l'audio, l'image et la vidéo. Vous pouvez utiliser l'API Gemini pour des cas d'utilisation tels que le raisonnement sur du texte et des images, la génération de contenu, les agents de dialogue, les systèmes de synthèse et de classification, et plus encore.
Créer une interaction
Crée une interaction.
Corps de la requête
Le corps de la requête contient des données présentant la structure suivante :
model ModelOption (facultatif)
Nom du `Model` utilisé pour générer l'interaction.
Obligatoire si l'attribut "agent" n'est pas fourni.
Valeurs possibles :
-
gemini-2.5-computer-use-preview-10-2025Modèle de capacité agentique conçu pour l'interaction directe avec l'interface, permettant à Gemini de percevoir et de parcourir les environnements numériques.
-
gemini-2.5-flashNotre premier modèle de raisonnement hybride, qui accepte une fenêtre de contexte d'un million de jetons et dispose de budgets de réflexion.
-
gemini-2.5-flash-imageNotre modèle natif de génération d'images, optimisé pour la vitesse, la flexibilité et la compréhension contextuelle. Les entrées et sorties de texte sont facturées au même prix que Gemini 2.5 Flash.
-
gemini-2.5-flash-liteNotre modèle le plus petit et le plus économique, conçu pour une utilisation à grande échelle.
-
gemini-2.5-flash-lite-preview-09-2025Dernier modèle basé sur Gemini 2.5 Flash-Lite, optimisé pour la rentabilité, le haut débit et la qualité.
-
gemini-2.5-flash-native-audio-preview-12-2025Nos modèles audio natifs sont optimisés pour des sorties audio de meilleure qualité, avec un rythme, une voix, une verbosité et une humeur plus naturels.
-
gemini-2.5-flash-preview-09-2025Dernier modèle basé sur le modèle 2.5 Flash. La version Preview de 2.5 Flash est idéale pour les tâches de traitement à grande échelle, à faible latence et à volume élevé qui nécessitent de la réflexion, ainsi que pour les cas d'utilisation agentiques.
-
gemini-2.5-flash-preview-ttsNotre modèle de synthèse vocale 2.5 Flash est optimisé pour générer des voix puissantes, contrôlables et à faible latence.
-
gemini-2.5-proNotre modèle polyvalent de pointe, qui excelle dans les tâches de codage et de raisonnement complexe.
-
gemini-2.5-pro-preview-ttsNotre modèle audio de synthèse vocale 2.5 Pro est optimisé pour générer des voix puissantes et à faible latence, afin d'obtenir des résultats plus naturels et des requêtes plus faciles à orienter.
-
gemini-3-flash-previewNotre modèle le plus intelligent, conçu pour la rapidité, qui combine une intelligence de pointe avec des capacités de recherche et d'ancrage supérieures.
-
gemini-3-pro-image-previewModèle de pointe pour la génération et la retouche d'images.
-
gemini-3-pro-previewNotre modèle le plus intelligent, doté de capacités de raisonnement et de compréhension multimodale de pointe, ainsi que de puissantes fonctionnalités de codage agentique et de vibe coding.
-
gemini-3.1-pro-previewNotre dernier modèle de raisonnement SOTA, doté d'une profondeur et d'une nuance sans précédent, ainsi que de puissantes capacités de compréhension multimodale et de codage.
-
gemini-3.1-flash-image-previewIntelligence visuelle de niveau professionnel, efficacité de Gemini Flash et capacités de génération ancrées dans la réalité.
-
gemini-3.1-flash-lite-previewNotre modèle le plus économique, optimisé pour les tâches agentiques à volume élevé, la traduction et le traitement de données simples.
-
gemini-3.1-flash-tts-previewGemini 3.1 Flash TTS : génération vocale puissante et à faible latence. Profitez de résultats naturels, d'invites orientables et de nouvelles balises audio expressives pour un contrôle précis de la narration.
-
lyria-3-clip-previewNotre modèle de génération de musique à faible latence est optimisé pour les extraits audio haute fidélité et le contrôle rythmique précis.
-
lyria-3-pro-previewNotre modèle génératif avancé pour les chansons complètes, avec une compréhension approfondie de la composition, optimisé pour un contrôle précis de la structure et des transitions complexes dans différents styles musicaux.
agent AgentOption (facultatif)
Nom de l'agent utilisé pour générer l'interaction.
Obligatoire si `model` n'est pas fourni.
Valeurs possibles :
-
deep-research-pro-preview-12-2025Agent Gemini Deep Research
-
deep-research-preview-04-2026Agent Gemini Deep Research
-
deep-research-max-preview-04-2026Agent Gemini Deep Research Max
Entrées de l'interaction (communes au modèle et à l'agent).
Instruction système pour l'interaction.
Liste des déclarations d'outils que le modèle peut appeler lors de l'interaction.
Garantit que la réponse générée est un objet JSON conforme au schéma JSON spécifié dans ce champ.
Type MIME de la réponse. Obligatoire si response_format est défini.
Uniquement en entrée. Indique si l'interaction sera diffusée en streaming.
Uniquement en entrée. Indique si la réponse et la requête doivent être stockées pour être récupérées ultérieurement.
Uniquement en entrée. Indique si l'interaction du modèle doit s'exécuter en arrière-plan.
generation_config GenerationConfig (facultatif)
Configuration du modèle :
paramètres de configuration pour l'interaction avec le modèle.
Alternative à `agent_config`. Ne s'applique que lorsque `model` est défini.
Champs
Contrôle le caractère aléatoire de la sortie.
Probabilité cumulée maximale des jetons à prendre en compte lors de l'échantillonnage.
Graine utilisée dans le décodage pour la reproductibilité.
Liste des séquences de caractères qui arrêteront l'interaction de sortie.
thinking_level ThinkingLevel (facultatif)
Niveau de jetons de réflexion que le modèle doit générer.
Valeurs possibles :
-
minimal -
low -
medium -
high
thinking_summaries ThinkingSummaries (facultatif)
Indique si la réponse doit inclure des résumés de la réflexion.
Valeurs possibles :
-
auto -
none
Nombre maximal de jetons à inclure dans la réponse.
speech_config SpeechConfig (facultatif)
Configuration pour l'interaction vocale.
Champs
La voix de l'orateur.
Langue du discours.
Nom de l'intervenant. Il doit correspondre à celui indiqué dans la requête.
image_config ImageConfig (facultatif)
Configuration de l'interaction avec l'image.
Champs
Aucune description fournie.
Valeurs possibles :
-
1:1 -
2:3 -
3:2 -
3:4 -
4:3 -
4:5 -
5:4 -
9:16 -
16:9 -
21:9 -
1:8 -
8:1 -
1:4 -
4:1
Aucune description fournie.
Valeurs possibles :
-
1K -
2K -
4K -
512
Configuration du choix de l'outil.
agent_config object (facultatif)
Configuration de l'agent
Configuration de l'agent.
Alternative à `generation_config`. Ne s'applique que lorsque `agent` est défini.
Types possibles
Discriminant polymorphe : type
DynamicAgentConfig
Configuration des agents dynamiques.
Aucune description fournie.
Toujours défini sur "dynamic".
DeepResearchAgentConfig
Configuration de l'agent Deep Research.
Aucune description fournie.
Toujours défini sur "deep-research".
thinking_summaries ThinkingSummaries (facultatif)
Indique si la réponse doit inclure des résumés de la réflexion.
Valeurs possibles :
-
auto -
none
Indique si la réponse doit inclure des visualisations.
Valeurs possibles :
-
off -
auto
Active la planification human-in-the-loop pour l'agent Deep Research. Si la valeur est définie sur "true", l'agent Deep Research fournira un plan de recherche dans sa réponse. L'agent ne poursuivra la procédure que si l'utilisateur confirme le forfait au prochain tour.
ID de l'interaction précédente, le cas échéant.
response_modalities ResponseModality (facultatif)
Modalités de réponse demandées (TEXT, IMAGE, AUDIO).
Valeurs possibles :
-
text -
image -
audio -
video -
document
service_tier ServiceTier (facultatif)
Niveau de service de l'interaction.
Valeurs possibles :
-
flex -
standard -
priority
webhook_config WebhookConfig (facultatif)
Facultatif. Configuration du webhook pour recevoir des notifications lorsque l'interaction est terminée.
Champs
Facultatif. Si elles sont définies, ces URI de webhook seront utilisés pour les événements de webhook au lieu des webhooks enregistrés.
Facultatif. Métadonnées utilisateur qui seront renvoyées à chaque émission d'événement aux webhooks.
Réponse
Renvoie une ressource Interaction.
Demande simple
Exemple de réponse
{ "created": "2025-11-26T12:25:15Z", "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "object": "interaction", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "Hello! I'm functioning perfectly and ready to assist you.\n\nHow are you doing today?" } ] } ], "status": "completed", "updated": "2025-11-26T12:25:15Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 7 } ], "total_cached_tokens": 0, "total_input_tokens": 7, "total_output_tokens": 20, "total_thought_tokens": 22, "total_tokens": 49, "total_tool_use_tokens": 0 } }
Multitours
Exemple de réponse
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "The capital of France is Paris." } ] } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 50 } ], "total_cached_tokens": 0, "total_input_tokens": 50, "total_output_tokens": 10, "total_thought_tokens": 0, "total_tokens": 60, "total_tool_use_tokens": 0 } }
Image d'entrée
Exemple de réponse
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "A white humanoid robot with glowing blue eyes stands holding a red skateboard." } ] } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 10 }, { "modality": "image", "tokens": 258 } ], "total_cached_tokens": 0, "total_input_tokens": 268, "total_output_tokens": 20, "total_thought_tokens": 0, "total_tokens": 288, "total_tool_use_tokens": 0 } }
Appel de fonction
Exemple de réponse
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "requires_action", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "steps": [ { "type": "function_call", "id": "gth23981", "name": "get_weather", "arguments": { "location": "Boston, MA" } } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 100 } ], "total_cached_tokens": 0, "total_input_tokens": 100, "total_output_tokens": 25, "total_thought_tokens": 0, "total_tokens": 125, "total_tool_use_tokens": 50 } }
Deep Research
Exemple de réponse
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "agent": "deep-research-pro-preview-12-2025", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "Here is a comprehensive research report on the current state of cancer research..." } ] } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 20 } ], "total_cached_tokens": 0, "total_input_tokens": 20, "total_output_tokens": 1000, "total_thought_tokens": 500, "total_tokens": 1520, "total_tool_use_tokens": 0 } }
Récupérer une interaction
Récupère tous les détails d'une interaction en fonction de son `Interaction.id`.
Paramètres de chemin / de requête
Identifiant unique de l'interaction à récupérer.
Si la valeur est définie sur "true", le contenu généré sera diffusé de manière incrémentielle.
Valeur par défaut : False
Facultatif. Si cette option est définie, le flux d'interaction reprend à partir du prochain bloc après l'événement marqué par l'ID d'événement. Ne peut être utilisé que si "stream" est défini sur "true".
Si la valeur est définie sur "true", l'entrée est incluse dans la réponse.
Valeur par défaut : False
Version de l'API à utiliser.
Réponse
Renvoie une ressource Interaction.
Obtenir une interaction
Exemple de réponse
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:25:15Z", "updated": "2025-11-26T12:25:15Z", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "I'm doing great, thank you for asking! How can I help you today?" } ] } ] }
Supprimer une interaction
Supprime l'interaction par ID.
Paramètres de chemin / de requête
Identifiant unique de l'interaction à supprimer.
Version de l'API à utiliser.
Réponse
Si l'opération réussit, la réponse est vide.
Supprimer une interaction
Annuler une interaction
Annule une interaction par ID. Cela ne s'applique qu'aux interactions en arrière-plan qui sont toujours en cours d'exécution.
Paramètres de chemin / de requête
Identifiant unique de l'interaction à annuler.
Version de l'API à utiliser.
Réponse
Renvoie une ressource Interaction.
Annuler l'interaction
Exemple de réponse
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "agent": "deep-research-pro-preview-12-2025", "status": "cancelled", "object": "interaction", "created": "2025-11-26T12:25:15Z", "updated": "2025-11-26T12:25:15Z" }
Ressources
Interaction
Ressource Interaction.
Champs
model ModelOption (facultatif)
Nom du `Model` utilisé pour générer l'interaction.
Valeurs possibles :
-
gemini-2.5-computer-use-preview-10-2025Modèle de capacité agentique conçu pour l'interaction directe avec l'interface, permettant à Gemini de percevoir et de parcourir les environnements numériques.
-
gemini-2.5-flashNotre premier modèle de raisonnement hybride, qui accepte une fenêtre de contexte d'un million de jetons et dispose de budgets de réflexion.
-
gemini-2.5-flash-imageNotre modèle natif de génération d'images, optimisé pour la vitesse, la flexibilité et la compréhension contextuelle. Les entrées et sorties de texte sont facturées au même prix que Gemini 2.5 Flash.
-
gemini-2.5-flash-liteNotre modèle le plus petit et le plus économique, conçu pour une utilisation à grande échelle.
-
gemini-2.5-flash-lite-preview-09-2025Dernier modèle basé sur Gemini 2.5 Flash-Lite, optimisé pour la rentabilité, le haut débit et la qualité.
-
gemini-2.5-flash-native-audio-preview-12-2025Nos modèles audio natifs sont optimisés pour des sorties audio de meilleure qualité, avec un rythme, une voix, une verbosité et une humeur plus naturels.
-
gemini-2.5-flash-preview-09-2025Dernier modèle basé sur le modèle 2.5 Flash. La version Preview de 2.5 Flash est idéale pour les tâches de traitement à grande échelle, à faible latence et à volume élevé qui nécessitent de la réflexion, ainsi que pour les cas d'utilisation agentiques.
-
gemini-2.5-flash-preview-ttsNotre modèle de synthèse vocale 2.5 Flash est optimisé pour générer des voix puissantes, contrôlables et à faible latence.
-
gemini-2.5-proNotre modèle polyvalent de pointe, qui excelle dans les tâches de codage et de raisonnement complexe.
-
gemini-2.5-pro-preview-ttsNotre modèle audio de synthèse vocale 2.5 Pro est optimisé pour générer des voix puissantes et à faible latence, afin d'obtenir des résultats plus naturels et des requêtes plus faciles à orienter.
-
gemini-3-flash-previewNotre modèle le plus intelligent, conçu pour la rapidité, qui combine une intelligence de pointe avec des capacités de recherche et d'ancrage supérieures.
-
gemini-3-pro-image-previewModèle de pointe pour la génération et la retouche d'images.
-
gemini-3-pro-previewNotre modèle le plus intelligent, doté de capacités de raisonnement et de compréhension multimodale de pointe, ainsi que de puissantes fonctionnalités de codage agentique et de vibe coding.
-
gemini-3.1-pro-previewNotre dernier modèle de raisonnement SOTA, doté d'une profondeur et d'une nuance sans précédent, ainsi que de puissantes capacités de compréhension multimodale et de codage.
-
gemini-3.1-flash-image-previewIntelligence visuelle de niveau professionnel, efficacité de Gemini Flash et capacités de génération ancrées dans la réalité.
-
gemini-3.1-flash-lite-previewNotre modèle le plus économique, optimisé pour les tâches agentiques à volume élevé, la traduction et le traitement de données simples.
-
gemini-3.1-flash-tts-previewGemini 3.1 Flash TTS : génération vocale puissante et à faible latence. Profitez de résultats naturels, d'invites orientables et de nouvelles balises audio expressives pour un contrôle précis de la narration.
-
lyria-3-clip-previewNotre modèle de génération de musique à faible latence est optimisé pour les extraits audio haute fidélité et le contrôle rythmique précis.
-
lyria-3-pro-previewNotre modèle génératif avancé pour les chansons complètes, avec une compréhension approfondie de la composition, optimisé pour un contrôle précis de la structure et des transitions complexes dans différents styles musicaux.
agent AgentOption (facultatif)
Nom de l'agent utilisé pour générer l'interaction.
Valeurs possibles :
-
deep-research-pro-preview-12-2025Agent Gemini Deep Research
-
deep-research-preview-04-2026Agent Gemini Deep Research
-
deep-research-max-preview-04-2026Agent Gemini Deep Research Max
Obligatoire. Uniquement en sortie. Identifiant unique de la fin de l'interaction.
Obligatoire. Uniquement en sortie. État de l'interaction.
Valeurs possibles :
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
Obligatoire. Uniquement en sortie. Heure à laquelle la réponse a été créée, au format ISO 8601 (AAAA-MM-JJThh:mm:ssZ).
Obligatoire. Uniquement en sortie. Heure à laquelle la réponse a été mise à jour pour la dernière fois au format ISO 8601 (AAAA-MM-JJThh:mm:ssZ).
Uniquement en sortie. Rôle de l'interaction.
Instruction système pour l'interaction.
Liste des déclarations d'outils que le modèle peut appeler lors de l'interaction.
usage Usage (facultatif)
Uniquement en sortie. Statistiques sur l'utilisation des jetons de la demande d'interaction.
Champs
Nombre de jetons dans le prompt (contexte).
input_tokens_by_modality ModalityTokens (facultatif)
Répartition de l'utilisation des jetons d'entrée par modalité.
Champs
modality ResponseModality (facultatif)
Modalité associée au nombre de jetons.
Valeurs possibles :
-
text -
image -
audio -
video -
document
Nombre de jetons pour la modalité.
Nombre de jetons dans la partie mise en cache de la requête (le contenu mis en cache).
cached_tokens_by_modality ModalityTokens (facultatif)
Répartition de l'utilisation des jetons mis en cache par modalité.
Champs
modality ResponseModality (facultatif)
Modalité associée au nombre de jetons.
Valeurs possibles :
-
text -
image -
audio -
video -
document
Nombre de jetons pour la modalité.
Nombre total de jetons dans toutes les réponses générées.
output_tokens_by_modality ModalityTokens (facultatif)
Répartition de l'utilisation des jetons de sortie par modalité.
Champs
modality ResponseModality (facultatif)
Modalité associée au nombre de jetons.
Valeurs possibles :
-
text -
image -
audio -
video -
document
Nombre de jetons pour la modalité.
Nombre de jetons présents dans la ou les invites d'utilisation d'outils.
tool_use_tokens_by_modality ModalityTokens (facultatif)
Répartition de l'utilisation des jetons d'utilisation des outils par modalité.
Champs
modality ResponseModality (facultatif)
Modalité associée au nombre de jetons.
Valeurs possibles :
-
text -
image -
audio -
video -
document
Nombre de jetons pour la modalité.
Nombre de jetons de pensées pour les modèles à raisonnement.
Nombre total de jetons pour la requête d'interaction (requête + réponses + autres jetons internes).
grounding_tool_count GroundingToolCount (facultatif)
Nombre d'outils d'ancrage.
Champs
Type d'outil d'ancrage associé au nombre.
Valeurs possibles :
-
google_search -
google_maps -
retrieval
Nombre d'outils d'ancrage.
response_modalities ResponseModality (facultatif)
Modalités de réponse demandées (TEXT, IMAGE, AUDIO).
Valeurs possibles :
-
text -
image -
audio -
video -
document
Type MIME de la réponse. Obligatoire si response_format est défini.
ID de l'interaction précédente, le cas échéant.
service_tier ServiceTier (facultatif)
Niveau de service de l'interaction.
Valeurs possibles :
-
flex -
standard -
priority
webhook_config WebhookConfig (facultatif)
Facultatif. Configuration du webhook pour recevoir des notifications lorsque l'interaction est terminée.
Champs
Facultatif. Si elles sont définies, ces URI de webhook seront utilisés pour les événements de webhook au lieu des webhooks enregistrés.
Facultatif. Métadonnées utilisateur qui seront renvoyées à chaque émission d'événement aux webhooks.
steps Step (optional)
Uniquement en sortie. Étapes qui composent l'interaction.
Types possibles
Discriminant polymorphe : type
UserInputStep
Entrée fournie par l'utilisateur.
Aucune description fournie.
Toujours défini sur "user_input".
Aucune description fournie.
ModelOutputStep
Sortie générée par le modèle.
Aucune description fournie.
Toujours défini sur "model_output".
Aucune description fournie.
ThoughtStep
Une étape de réflexion.
Aucune description fournie.
Toujours défini sur "thought".
Hachage de signature pour la validation du backend.
summary ThoughtSummaryContent (facultatif)
Un résumé de la pensée.
Types possibles
Discriminant polymorphe : type
TextContent
Bloc de contenu textuel.
Aucune description fournie.
Toujours défini sur "text".
Obligatoire. Contenu textuel.
annotations Annotation (optional)
Informations de citation pour le contenu généré par le modèle.
Types possibles
Discriminant polymorphe : type
UrlCitation
Annotation de citation d'URL.
Aucune description fournie.
Toujours défini sur "url_citation".
URL.
Titre de l'URL.
Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.
Fin du segment attribué (exclusif).
FileCitation
Annotation de citation de fichier.
Aucune description fournie.
Toujours défini sur "file_citation".
URI du fichier.
Nom du fichier.
Source attribuée à une partie du texte.
Métadonnées fournies par l'utilisateur sur le contexte récupéré.
Numéro de page du document cité, le cas échéant.
ID du média en cas de citation d'image, le cas échéant.
Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.
Fin du segment attribué (exclusif).
PlaceCitation
Annotation de citation d'un lieu.
Aucune description fournie.
Toujours défini sur "place_citation".
ID du lieu, au format `places/{place_id}`.
Titre du lieu.
Référence URI du lieu.
review_snippets ReviewSnippet (facultatif)
Extraits d'avis utilisés pour générer des réponses sur les caractéristiques d'un lieu donné dans Google Maps.
Champs
Titre de l'avis.
Lien correspondant à l'avis de l'utilisateur sur Google Maps.
ID de l'extrait d'avis.
Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.
Fin du segment attribué (exclusif).
ImageContent
Bloc de contenu d'image.
Aucune description fournie.
Toujours défini sur "image".
Contenu de l'image.
URI de l'image.
Type MIME de l'image.
Valeurs possibles :
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (optional)
Résolution du contenu multimédia.
Valeurs possibles :
-
low -
medium -
high -
ultra_high
FunctionCallStep
Étape d'appel de fonction.
Aucune description fournie.
Toujours défini sur "function_call".
Obligatoire. Nom de l'outil à appeler.
Obligatoire. Arguments à transmettre à la fonction.
Obligatoire. ID unique pour cet appel d'outil spécifique.
Hachage de signature pour la validation du backend.
CodeExecutionCallStep
Étape d'appel d'exécution du code.
Aucune description fournie.
Toujours défini sur "code_execution_call".
arguments CodeExecutionCallStepArguments (obligatoire)
Obligatoire. Arguments à transmettre à l'exécution du code.
Champs
Langage de programmation du code.
Valeurs possibles :
-
python
Code à exécuter.
Obligatoire. ID unique pour cet appel d'outil spécifique.
Hachage de signature pour la validation du backend.
UrlContextCallStep
Étape d'appel du contexte d'URL.
Aucune description fournie.
Toujours défini sur "url_context_call".
arguments UrlContextCallStepArguments (required)
Obligatoire. Arguments à transmettre au contexte de l'URL.
Champs
URL à récupérer.
Obligatoire. ID unique pour cet appel d'outil spécifique.
Hachage de signature pour la validation du backend.
McpServerToolCallStep
Étape d'appel d'outil MCPServer.
Aucune description fournie.
Toujours défini sur "mcp_server_tool_call".
Obligatoire. Nom de l'outil appelé.
Obligatoire. Nom du serveur MCP utilisé.
Obligatoire. Objet JSON des arguments de la fonction.
Obligatoire. ID unique pour cet appel d'outil spécifique.
Hachage de signature pour la validation du backend.
GoogleSearchCallStep
Étape d'appel de la recherche Google.
Aucune description fournie.
Toujours défini sur "google_search_call".
arguments GoogleSearchCallStepArguments (obligatoire)
Obligatoire. Arguments à transmettre à la recherche Google.
Champs
Requêtes de recherche sur le Web pour la recherche sur le Web de suivi.
Type d'ancrage avec la recherche activé.
Valeurs possibles :
-
web_search -
image_search -
enterprise_web_search
Obligatoire. ID unique pour cet appel d'outil spécifique.
Hachage de signature pour la validation du backend.
FileSearchCallStep
Étape d'appel de recherche de fichiers.
Aucune description fournie.
Toujours défini sur "file_search_call".
Obligatoire. ID unique pour cet appel d'outil spécifique.
Hachage de signature pour la validation du backend.
GoogleMapsCallStep
Étape d'appel Google Maps.
Aucune description fournie.
Toujours défini sur "google_maps_call".
arguments GoogleMapsCallStepArguments (facultatif)
Arguments à transmettre à l'outil Google Maps.
Champs
Requêtes à exécuter.
Obligatoire. ID unique pour cet appel d'outil spécifique.
Hachage de signature pour la validation du backend.
FunctionResultStep
Résultat d'un appel d'outil de fonction.
Aucune description fournie.
Toujours défini sur "function_result".
Nom de l'outil appelé.
Indique si l'appel d'outil a entraîné une erreur.
Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.
Hachage de signature pour la validation du backend.
Résultat de l'appel d'outil.
CodeExecutionResultStep
Étape du résultat de l'exécution du code.
Aucune description fournie.
Toujours défini sur "code_execution_result".
Obligatoire. Sortie de l'exécution du code.
Indique si l'exécution du code a entraîné une erreur.
Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.
Hachage de signature pour la validation du backend.
UrlContextResultStep
Étape de résultat du contexte d'URL.
Aucune description fournie.
Toujours défini sur "url_context_result".
result UrlContextResultItem (obligatoire)
Obligatoire. Résultats du contexte de l'URL.
Champs
URL récupérée.
État de la récupération de l'URL.
Valeurs possibles :
-
success -
error -
paywall -
unsafe
Indique si le contexte de l'URL a entraîné une erreur.
Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.
Hachage de signature pour la validation du backend.
GoogleSearchResultStep
Étape de résultat de recherche Google.
Aucune description fournie.
Toujours défini sur "google_search_result".
result GoogleSearchResultItem (obligatoire)
Obligatoire. Résultats de la recherche Google.
Champs
Extrait de contenu Web pouvant être intégré à une page Web ou à une WebView d'application.
Indique si la recherche Google a généré une erreur.
Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.
Hachage de signature pour la validation du backend.
McpServerToolResultStep
Étape de résultat de l'outil MCPServer.
Aucune description fournie.
Toujours défini sur "mcp_server_tool_result".
Nom de l'outil appelé pour cet appel d'outil spécifique.
Nom du serveur MCP utilisé.
Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.
Hachage de signature pour la validation du backend.
Résultat de l'appel du serveur MCP. Il peut s'agir de texte simple ou de contenu enrichi.
FileSearchResultStep
Étape "Résultat de recherche de fichier".
Aucune description fournie.
Toujours défini sur "file_search_result".
Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.
Hachage de signature pour la validation du backend.
GoogleMapsResultStep
Étape de résultat Google Maps.
Aucune description fournie.
Toujours défini sur "google_maps_result".
result GoogleMapsResultItem (obligatoire)
Aucune description fournie.
Champs
places GoogleMapsResultPlaces (facultatif)
Aucune description fournie.
Champs
Aucune description fournie.
Aucune description fournie.
Aucune description fournie.
review_snippets ReviewSnippet (facultatif)
Aucune description fournie.
Champs
Titre de l'avis.
Lien correspondant à l'avis de l'utilisateur sur Google Maps.
ID de l'extrait d'avis.
Aucune description fournie.
Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.
Hachage de signature pour la validation du backend.
Entrée de l'interaction.
Garantit que la réponse générée est un objet JSON conforme au schéma JSON spécifié dans ce champ.
agent_config object (facultatif)
Paramètres de configuration de l'interaction de l'agent.
Types possibles
Discriminant polymorphe : type
DynamicAgentConfig
Configuration des agents dynamiques.
Aucune description fournie.
Toujours défini sur "dynamic".
DeepResearchAgentConfig
Configuration de l'agent Deep Research.
Aucune description fournie.
Toujours défini sur "deep-research".
thinking_summaries ThinkingSummaries (facultatif)
Indique si la réponse doit inclure des résumés de la réflexion.
Valeurs possibles :
-
auto -
none
Indique si la réponse doit inclure des visualisations.
Valeurs possibles :
-
off -
auto
Active la planification human-in-the-loop pour l'agent Deep Research. Si la valeur est définie sur "true", l'agent Deep Research fournira un plan de recherche dans sa réponse. L'agent ne poursuivra la procédure que si l'utilisateur confirme le forfait lors du prochain tour.
Exemples
Exemple
{ "created": "2025-12-04T15:01:45Z", "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg", "model": "gemini-3-flash-preview", "object": "interaction", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "Hello! I'm doing well, functioning as expected. Thank you for asking! How are you doing today?" } ] } ], "status": "completed", "updated": "2025-12-04T15:01:45Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 7 } ], "total_cached_tokens": 0, "total_input_tokens": 7, "total_output_tokens": 23, "total_thought_tokens": 49, "total_tokens": 79, "total_tool_use_tokens": 0 } }
Modèles de données
Contenu
Contenu de la réponse.
Types possibles
Discriminant polymorphe : type
TextContent
Bloc de contenu textuel.
Aucune description fournie.
Toujours défini sur "text".
Obligatoire. Contenu textuel.
annotations Annotation (optional)
Informations de citation pour le contenu généré par le modèle.
Types possibles
Discriminant polymorphe : type
UrlCitation
Annotation de citation d'URL.
Aucune description fournie.
Toujours défini sur "url_citation".
URL.
Titre de l'URL.
Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.
Fin du segment attribué (exclusif).
FileCitation
Annotation de citation de fichier.
Aucune description fournie.
Toujours défini sur "file_citation".
URI du fichier.
Nom du fichier.
Source attribuée à une partie du texte.
Métadonnées fournies par l'utilisateur sur le contexte récupéré.
Numéro de page du document cité, le cas échéant.
ID du média en cas de citation d'image, le cas échéant.
Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.
Fin du segment attribué (exclusif).
PlaceCitation
Annotation de citation d'un lieu.
Aucune description fournie.
Toujours défini sur "place_citation".
ID du lieu, au format `places/{place_id}`.
Titre du lieu.
Référence URI du lieu.
review_snippets ReviewSnippet (facultatif)
Extraits d'avis utilisés pour générer des réponses sur les caractéristiques d'un lieu donné dans Google Maps.
Champs
Titre de l'avis.
Lien correspondant à l'avis de l'utilisateur sur Google Maps.
ID de l'extrait d'avis.
Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.
Fin du segment attribué (exclusif).
ImageContent
Bloc de contenu d'image.
Aucune description fournie.
Toujours défini sur "image".
Contenu de l'image.
URI de l'image.
Type MIME de l'image.
Valeurs possibles :
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (optional)
Résolution du contenu multimédia.
Valeurs possibles :
-
low -
medium -
high -
ultra_high
AudioContent
Bloc de contenu audio.
Aucune description fournie.
Toujours défini sur "audio".
Contenu audio.
URI de l'élément audio.
Type MIME du contenu audio.
Valeurs possibles :
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
Nombre de canaux audio.
Taux d'échantillonnage de l'audio.
DocumentContent
Bloc de contenu d'un document.
Aucune description fournie.
Toujours défini sur "document".
Contenu du document.
URI du document.
Type MIME du document.
Valeurs possibles :
-
application/pdf
VideoContent
Bloc de contenu vidéo.
Aucune description fournie.
Toujours défini sur "video".
Le contenu vidéo
URI de la vidéo.
Type MIME de la vidéo.
Valeurs possibles :
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
resolution MediaResolution (optional)
Résolution du contenu multimédia.
Valeurs possibles :
-
low -
medium -
high -
ultra_high
Exemples
Texte
{ "type": "text", "text": "Hello, how are you?" }
Image
{ "type": "image", "data": "BASE64_ENCODED_IMAGE", "mime_type": "image/png" }
Audio
{ "type": "audio", "data": "BASE64_ENCODED_AUDIO", "mime_type": "audio/wav" }
Document
{ "type": "document", "data": "BASE64_ENCODED_DOCUMENT", "mime_type": "application/pdf" }
Vidéo
{ "type": "video", "uri": "https://www.youtube.com/watch?v=9hE5-98ZeCg" }
Outil
Outil pouvant être utilisé par le modèle.
Types possibles
Discriminant polymorphe : type
Fonction
Outil pouvant être utilisé par le modèle.
Aucune description fournie.
Toujours défini sur "function".
Nom de la fonction.
Description de la fonction.
Schéma JSON pour les paramètres de la fonction.
CodeExecution
Outil que le modèle peut utiliser pour exécuter du code.
Aucune description fournie.
Toujours défini sur "code_execution".
UrlContext
Outil que le modèle peut utiliser pour récupérer le contexte d'une URL.
Aucune description fournie.
Toujours défini sur "url_context".
ComputerUse
Outil que le modèle peut utiliser pour interagir avec l'ordinateur.
Aucune description fournie.
Toujours défini sur "computer_use".
Environnement exploité.
Valeurs possibles :
-
browser
Liste des fonctions prédéfinies exclues de l'appel de modèle.
McpServer
Un MCPServer est un serveur qui peut être appelé par le modèle pour effectuer des actions.
Aucune description fournie.
Toujours défini sur "mcp_server".
Nom du MCPServer.
URL complète du point de terminaison MCPServer. Exemple : "https://api.example.com/mcp"
Facultatif : Champs pour les en-têtes d'authentification, les délais d'attente, etc., si nécessaire.
allowed_tools AllowedTools (facultatif)
Outils autorisés.
Champs
mode ToolChoiceType (facultatif)
Mode de choix de l'outil.
Valeurs possibles :
-
auto -
any -
none -
validated
Noms des outils autorisés.
GoogleSearch
Outil que le modèle peut utiliser pour effectuer des recherches sur Google.
Aucune description fournie.
Toujours défini sur "google_search".
Types d'ancrage de recherche à activer.
Valeurs possibles :
-
web_search -
image_search -
enterprise_web_search
FileSearch
Outil que le modèle peut utiliser pour rechercher des fichiers.
Aucune description fournie.
Toujours défini sur "file_search".
Noms des magasins de fichiers dans lesquels effectuer la recherche.
Nombre de blocs de récupération sémantique à récupérer.
Filtre de métadonnées à appliquer aux documents et aux blocs de récupération sémantique.
GoogleMaps
Outil que le modèle peut utiliser pour appeler Google Maps.
Aucune description fournie.
Toujours défini sur "google_maps".
Indique s'il faut renvoyer un jeton de contexte de widget dans le résultat de l'appel d'outil de la réponse.
Latitude de l'emplacement de l'utilisateur.
Longitude de la position de l'utilisateur.
Récupération
Outil que le modèle peut utiliser pour récupérer des fichiers.
Aucune description fournie.
Toujours défini sur "retrieval".
Types de récupération de fichiers à activer.
Valeurs possibles :
-
vertex_ai_search
vertex_ai_search_config VertexAISearchConfig (facultatif)
Permet de spécifier la configuration de VertexAISearch.
Champs
Facultatif. Permet de spécifier le moteur de recherche Vertex AI.
Facultatif. Permet de spécifier les data stores Vertex AI Search.
Exemples
Fonction
CodeExecution
UrlContext
ComputerUse
McpServer
GoogleSearch
FileSearch
GoogleMaps
Récupération
Aucun exemple n'est disponible pour ce type.
InteractionSseEvent
Types possibles
Discriminant polymorphe : event_type
InteractionCreatedEvent
Aucune description fournie.
Toujours défini sur "interaction.created".
Aucune description fournie.
Jeton event_id à utiliser pour reprendre le flux d'interaction à partir de cet événement.
InteractionCompletedEvent
Aucune description fournie.
Toujours défini sur "interaction.completed".
Obligatoire. Interaction terminée avec des sorties vides pour réduire la taille de la charge utile. Utilisez les événements ContentDelta précédents pour la sortie réelle.
Jeton event_id à utiliser pour reprendre le flux d'interaction à partir de cet événement.
InteractionStatusUpdate
Aucune description fournie.
Toujours défini sur "interaction.status_update".
Aucune description fournie.
Aucune description fournie.
Valeurs possibles :
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
Jeton event_id à utiliser pour reprendre le flux d'interaction à partir de cet événement.
ErrorEvent
Aucune description fournie.
Toujours défini sur "error".
error Error (facultatif)
Aucune description fournie.
Champs
URI qui identifie le type d'erreur.
Message d'erreur lisible par l'utilisateur.
Jeton event_id à utiliser pour reprendre le flux d'interaction à partir de cet événement.
StepStart
Aucune description fournie.
Toujours défini sur "step.start".
Aucune description fournie.
step Step (required)
Aucune description fournie.
Types possibles
Discriminant polymorphe : type
UserInputStep
Entrée fournie par l'utilisateur.
Aucune description fournie.
Toujours défini sur "user_input".
Aucune description fournie.
ModelOutputStep
Sortie générée par le modèle.
Aucune description fournie.
Toujours défini sur "model_output".
Aucune description fournie.
ThoughtStep
Une étape de réflexion.
Aucune description fournie.
Toujours défini sur "thought".
Hachage de signature pour la validation du backend.
summary ThoughtSummaryContent (facultatif)
Un résumé de la pensée.
Types possibles
Discriminant polymorphe : type
TextContent
Bloc de contenu textuel.
Aucune description fournie.
Toujours défini sur "text".
Obligatoire. Contenu textuel.
annotations Annotation (optional)
Informations de citation pour le contenu généré par le modèle.
Types possibles
Discriminant polymorphe : type
UrlCitation
Annotation de citation d'URL.
Aucune description fournie.
Toujours défini sur "url_citation".
URL.
Titre de l'URL.
Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.
Fin du segment attribué (exclusif).
FileCitation
Annotation de citation de fichier.
Aucune description fournie.
Toujours défini sur "file_citation".
URI du fichier.
Nom du fichier.
Source attribuée à une partie du texte.
Métadonnées fournies par l'utilisateur sur le contexte récupéré.
Numéro de page du document cité, le cas échéant.
ID du média en cas de citation d'image, le cas échéant.
Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.
Fin du segment attribué (exclusif).
PlaceCitation
Annotation de citation d'un lieu.
Aucune description fournie.
Toujours défini sur "place_citation".
ID du lieu, au format `places/{place_id}`.
Titre du lieu.
Référence URI du lieu.
review_snippets ReviewSnippet (facultatif)
Extraits d'avis utilisés pour générer des réponses sur les caractéristiques d'un lieu donné dans Google Maps.
Champs
Titre de l'avis.
Lien correspondant à l'avis de l'utilisateur sur Google Maps.
ID de l'extrait d'avis.
Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.
Fin du segment attribué (exclusif).
ImageContent
Bloc de contenu d'image.
Aucune description fournie.
Toujours défini sur "image".
Contenu de l'image.
URI de l'image.
Type MIME de l'image.
Valeurs possibles :
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (optional)
Résolution du contenu multimédia.
Valeurs possibles :
-
low -
medium -
high -
ultra_high
FunctionCallStep
Étape d'appel de fonction.
Aucune description fournie.
Toujours défini sur "function_call".
Obligatoire. Nom de l'outil à appeler.
Obligatoire. Arguments à transmettre à la fonction.
Obligatoire. ID unique pour cet appel d'outil spécifique.
Hachage de signature pour la validation du backend.
CodeExecutionCallStep
Étape d'appel d'exécution du code.
Aucune description fournie.
Toujours défini sur "code_execution_call".
arguments CodeExecutionCallStepArguments (obligatoire)
Obligatoire. Arguments à transmettre à l'exécution du code.
Champs
Langage de programmation du code.
Valeurs possibles :
-
python
Code à exécuter.
Obligatoire. ID unique pour cet appel d'outil spécifique.
Hachage de signature pour la validation du backend.
UrlContextCallStep
Étape d'appel du contexte d'URL.
Aucune description fournie.
Toujours défini sur "url_context_call".
arguments UrlContextCallStepArguments (required)
Obligatoire. Arguments à transmettre au contexte de l'URL.
Champs
URL à récupérer.
Obligatoire. ID unique pour cet appel d'outil spécifique.
Hachage de signature pour la validation du backend.
McpServerToolCallStep
Étape d'appel d'outil MCPServer.
Aucune description fournie.
Toujours défini sur "mcp_server_tool_call".
Obligatoire. Nom de l'outil appelé.
Obligatoire. Nom du serveur MCP utilisé.
Obligatoire. Objet JSON des arguments de la fonction.
Obligatoire. ID unique pour cet appel d'outil spécifique.
Hachage de signature pour la validation du backend.
GoogleSearchCallStep
Étape d'appel de la recherche Google.
Aucune description fournie.
Toujours défini sur "google_search_call".
arguments GoogleSearchCallStepArguments (obligatoire)
Obligatoire. Arguments à transmettre à la recherche Google.
Champs
Requêtes de recherche sur le Web pour la recherche sur le Web de suivi.
Type d'ancrage avec la recherche activé.
Valeurs possibles :
-
web_search -
image_search -
enterprise_web_search
Obligatoire. ID unique pour cet appel d'outil spécifique.
Hachage de signature pour la validation du backend.
FileSearchCallStep
Étape d'appel de recherche de fichiers.
Aucune description fournie.
Toujours défini sur "file_search_call".
Obligatoire. ID unique pour cet appel d'outil spécifique.
Hachage de signature pour la validation du backend.
GoogleMapsCallStep
Étape d'appel Google Maps.
Aucune description fournie.
Toujours défini sur "google_maps_call".
arguments GoogleMapsCallStepArguments (facultatif)
Arguments à transmettre à l'outil Google Maps.
Champs
Requêtes à exécuter.
Obligatoire. ID unique pour cet appel d'outil spécifique.
Hachage de signature pour la validation du backend.
FunctionResultStep
Résultat d'un appel d'outil de fonction.
Aucune description fournie.
Toujours défini sur "function_result".
Nom de l'outil appelé.
Indique si l'appel d'outil a entraîné une erreur.
Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.
Hachage de signature pour la validation du backend.
Résultat de l'appel d'outil.
CodeExecutionResultStep
Étape du résultat de l'exécution du code.
Aucune description fournie.
Toujours défini sur "code_execution_result".
Obligatoire. Sortie de l'exécution du code.
Indique si l'exécution du code a entraîné une erreur.
Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.
Hachage de signature pour la validation du backend.
UrlContextResultStep
Étape de résultat du contexte d'URL.
Aucune description fournie.
Toujours défini sur "url_context_result".
result UrlContextResultItem (obligatoire)
Obligatoire. Résultats du contexte de l'URL.
Champs
URL récupérée.
État de la récupération de l'URL.
Valeurs possibles :
-
success -
error -
paywall -
unsafe
Indique si le contexte de l'URL a entraîné une erreur.
Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.
Hachage de signature pour la validation du backend.
GoogleSearchResultStep
Étape de résultat de recherche Google.
Aucune description fournie.
Toujours défini sur "google_search_result".
result GoogleSearchResultItem (obligatoire)
Obligatoire. Résultats de la recherche Google.
Champs
Extrait de contenu Web pouvant être intégré à une page Web ou à une WebView d'application.
Indique si la recherche Google a généré une erreur.
Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.
Hachage de signature pour la validation du backend.
McpServerToolResultStep
Étape de résultat de l'outil MCPServer.
Aucune description fournie.
Toujours défini sur "mcp_server_tool_result".
Nom de l'outil appelé pour cet appel d'outil spécifique.
Nom du serveur MCP utilisé.
Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.
Hachage de signature pour la validation du backend.
Résultat de l'appel du serveur MCP. Il peut s'agir de texte simple ou de contenu enrichi.
FileSearchResultStep
Étape "Résultat de recherche de fichier".
Aucune description fournie.
Toujours défini sur "file_search_result".
Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.
Hachage de signature pour la validation du backend.
GoogleMapsResultStep
Étape de résultat Google Maps.
Aucune description fournie.
Toujours défini sur "google_maps_result".
result GoogleMapsResultItem (obligatoire)
Aucune description fournie.
Champs
places GoogleMapsResultPlaces (facultatif)
Aucune description fournie.
Champs
Aucune description fournie.
Aucune description fournie.
Aucune description fournie.
review_snippets ReviewSnippet (facultatif)
Aucune description fournie.
Champs
Titre de l'avis.
Lien correspondant à l'avis de l'utilisateur sur Google Maps.
ID de l'extrait d'avis.
Aucune description fournie.
Obligatoire. ID correspondant à l'ID du bloc d'appel de fonction.
Hachage de signature pour la validation du backend.
Jeton event_id à utiliser pour reprendre le flux d'interaction à partir de cet événement.
StepDelta
Aucune description fournie.
Toujours défini sur "step.delta".
Aucune description fournie.
delta StepDeltaData (obligatoire)
Aucune description fournie.
Types possibles
Discriminant polymorphe : type
TextDelta
Aucune description fournie.
Toujours défini sur "text".
Aucune description fournie.
ImageDelta
Aucune description fournie.
Toujours défini sur "image".
Aucune description fournie.
Aucune description fournie.
Aucune description fournie.
Valeurs possibles :
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (optional)
Résolution du contenu multimédia.
Valeurs possibles :
-
low -
medium -
high -
ultra_high
AudioDelta
Aucune description fournie.
Toujours défini sur "audio".
Aucune description fournie.
Aucune description fournie.
Aucune description fournie.
Valeurs possibles :
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
Obsolète. Utilisez plutôt sample_rate. La valeur est ignorée.
Taux d'échantillonnage de l'audio.
Nombre de canaux audio.
DocumentDelta
Aucune description fournie.
Toujours défini sur "document".
Aucune description fournie.
Aucune description fournie.
Aucune description fournie.
Valeurs possibles :
-
application/pdf
VideoDelta
Aucune description fournie.
Toujours défini sur "video".
Aucune description fournie.
Aucune description fournie.
Aucune description fournie.
Valeurs possibles :
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
resolution MediaResolution (optional)
Résolution du contenu multimédia.
Valeurs possibles :
-
low -
medium -
high -
ultra_high
ThoughtSummaryDelta
Aucune description fournie.
Toujours défini sur "thought_summary".
content ThoughtSummaryContent (facultatif)
Nouvel élément de résumé à ajouter à la pensée.
Types possibles
Discriminant polymorphe : type
TextContent
Bloc de contenu textuel.
Aucune description fournie.
Toujours défini sur "text".
Obligatoire. Contenu textuel.
annotations Annotation (optional)
Informations de citation pour le contenu généré par le modèle.
Types possibles
Discriminant polymorphe : type
UrlCitation
Annotation de citation d'URL.
Aucune description fournie.
Toujours défini sur "url_citation".
URL.
Titre de l'URL.
Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.
Fin du segment attribué (exclusif).
FileCitation
Annotation de citation de fichier.
Aucune description fournie.
Toujours défini sur "file_citation".
URI du fichier.
Nom du fichier.
Source attribuée à une partie du texte.
Métadonnées fournies par l'utilisateur sur le contexte récupéré.
Numéro de page du document cité, le cas échéant.
ID du média en cas de citation d'image, le cas échéant.
Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.
Fin du segment attribué (exclusif).
PlaceCitation
Annotation de citation d'un lieu.
Aucune description fournie.
Toujours défini sur "place_citation".
ID du lieu, au format `places/{place_id}`.
Titre du lieu.
Référence URI du lieu.
review_snippets ReviewSnippet (facultatif)
Extraits d'avis utilisés pour générer des réponses sur les caractéristiques d'un lieu donné dans Google Maps.
Champs
Titre de l'avis.
Lien correspondant à l'avis de l'utilisateur sur Google Maps.
ID de l'extrait d'avis.
Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.
Fin du segment attribué (exclusif).
ImageContent
Bloc de contenu d'image.
Aucune description fournie.
Toujours défini sur "image".
Contenu de l'image.
URI de l'image.
Type MIME de l'image.
Valeurs possibles :
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (optional)
Résolution du contenu multimédia.
Valeurs possibles :
-
low -
medium -
high -
ultra_high
ThoughtSignatureDelta
Aucune description fournie.
Toujours défini sur "thought_signature".
Signature permettant de faire correspondre la source du backend à inclure dans la génération.
TextAnnotationDelta
Aucune description fournie.
Toujours défini sur "text_annotation_delta".
annotations Annotation (optional)
Informations de citation pour le contenu généré par le modèle.
Types possibles
Discriminant polymorphe : type
UrlCitation
Annotation de citation d'URL.
Aucune description fournie.
Toujours défini sur "url_citation".
URL.
Titre de l'URL.
Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.
Fin du segment attribué (exclusif).
FileCitation
Annotation de citation de fichier.
Aucune description fournie.
Toujours défini sur "file_citation".
URI du fichier.
Nom du fichier.
Source attribuée à une partie du texte.
Métadonnées fournies par l'utilisateur sur le contexte récupéré.
Numéro de page du document cité, le cas échéant.
ID du média en cas de citation d'image, le cas échéant.
Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.
Fin du segment attribué (exclusif).
PlaceCitation
Annotation de citation d'un lieu.
Aucune description fournie.
Toujours défini sur "place_citation".
ID du lieu, au format `places/{place_id}`.
Titre du lieu.
Référence URI du lieu.
review_snippets ReviewSnippet (facultatif)
Extraits d'avis utilisés pour générer des réponses sur les caractéristiques d'un lieu donné dans Google Maps.
Champs
Titre de l'avis.
Lien correspondant à l'avis de l'utilisateur sur Google Maps.
ID de l'extrait d'avis.
Début du segment de la réponse attribué à cette source. L'index indique le début du segment, mesuré en octets.
Fin du segment attribué (exclusif).
ArgumentsDelta
Aucune description fournie.
Toujours défini sur "arguments_delta".
Aucune description fournie.
Jeton event_id à utiliser pour reprendre le flux d'interaction à partir de cet événement.
StepStop
Aucune description fournie.
Toujours défini sur "step.stop".
Aucune description fournie.
Jeton event_id à utiliser pour reprendre le flux d'interaction à partir de cet événement.
Exemples
Interaction créée
{ "event_type": "interaction.created", "interaction": { "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg", "model": "gemini-3-flash-preview", "status": "in_progress", "created": "2025-12-04T15:01:45Z", "updated": "2025-12-04T15:01:45Z" }, "event_id": "evt_123" }
Interaction terminée
{ "event_type": "interaction.completed", "interaction": { "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg", "model": "gemini-3-flash-preview", "status": "completed", "created": "2025-12-04T15:01:45Z", "updated": "2025-12-04T15:01:45Z" }, "event_id": "evt_123" }
Mise à jour de l'état de l'interaction
{ "event_type": "interaction.status_update", "interaction_id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM", "status": "in_progress" }
Événement d'erreur
{ "event_type": "error", "error": { "message": "Failed to get completed interaction: Result not found.", "code": "not_found" } }
Début de l'étape
{ "event_type": "step.start", "index": 0, "step": { "type": "model_output" } }
Delta de pas
{ "event_type": "step.delta", "index": 0, "delta": { "type": "text", "text": "Hello" } }
Arrêt à un pas
{ "event_type": "step.stop", "index": 0 }