Gemini Robotics-ER 1.5 est un modèle vision-langage (VLM) qui apporte les fonctionnalités d'agent de Gemini à la robotique. Il est conçu pour un raisonnement avancé dans le monde physique, ce qui permet aux robots d'interpréter des données visuelles complexes, d'effectuer un raisonnement spatial et de planifier des actions à partir de commandes en langage naturel.
Documentation
Consultez la page Robotics pour obtenir une couverture complète des fonctionnalités.
gemini-robotics-er-1.5-preview
| Propriété | Description |
|---|---|
| Code du modèle | gemini-robotics-er-1.5-preview |
| Types de données compatibles |
Entrées Texte, images, vidéo, audio Résultat Texte |
| Limites de jetons[*] |
Limite de jetons d'entrée 1 048 576 Limite de jetons de sortie 65 536 |
| Fonctionnalités |
Génération audio Not supported API par lot Not supported Mise en cache Not supported Exécution de code Compatible Appel de fonction Compatible Ancrage avec Google Maps Not supported Génération d'images Not supported API Live Not supported Ancrage de recherche Compatible Sorties structurées Compatible Raisonnement Compatible Contexte d'URL Compatible |
| Versions |
|
| Dernière mise à jour | Septembre 2025 |
| Date limite des connaissances | Janvier 2025 |