Essayez le nouveau modèle Gemini 3.1 Flash TTS Preview pour générer une parole expressive et multilingue.

Gemini Robotics-ER 1.5

Gemini Robotics-ER 1.5 est un modèle vision-langage (VLM) qui apporte les fonctionnalités d'agent de Gemini à la robotique. Il est conçu pour un raisonnement avancé dans le monde physique, ce qui permet aux robots d'interpréter des données visuelles complexes, d'effectuer un raisonnement spatial et de planifier des actions à partir de commandes en langage naturel.

Essayer dans Google AI Studio

Documentation

Consultez la page Robotics pour obtenir une couverture complète des fonctionnalités.

gemini-robotics-er-1.5-preview

Propriété	Description
Code du modèle	`gemini-robotics-er-1.5-preview`
Types de données compatibles	Entrées Texte, images, vidéo, audio Résultat Texte
^{Limites de jetons[*]}	Limite de jetons d'entrée 1 048 576 Limite de jetons de sortie 65 536
Fonctionnalités	Génération audio Not supported API par lot Not supported Mise en cache Not supported Exécution de code Compatible Appel de fonction Compatible Ancrage avec Google Maps Not supported Génération d'images Not supported API Live Not supported Ancrage de recherche Compatible Sorties structurées Compatible Raisonnement Compatible Contexte d'URL Compatible
Versions	Pour en savoir plus, consultez les modèles de version de modèle. Aperçu : `gemini-robotics-er-1.5-preview`
Dernière mise à jour	Septembre 2025
Date limite des connaissances	Janvier 2025