Gemini Robotics-ER 1.5 est un modèle de vision-langage (VLM) qui apporte les capacités d'agent de Gemini à la robotique. Il est conçu pour le raisonnement avancé dans le monde physique, ce qui permet aux robots d'interpréter des données visuelles complexes, d'effectuer un raisonnement spatial et de planifier des actions à partir de commandes en langage naturel.
Documentation
Consultez la page Robotique pour obtenir une couverture complète des fonctionnalités.
gemini-robotics-er-1.5-preview
| Propriété | Description |
|---|---|
| Code du modèle | gemini-robotics-er-1.5-preview |
| Types de données acceptés pour |
Entrées Texte, images, vidéos, audio Résultat Envoyer un message |
| Limites de jetons[*] |
Limite de jetons d'entrée 1 048 576 Limite de jetons de sortie 65 536 |
| Fonctionnalités |
Génération audio Not supported API Batch Not supported Mise en cache Not supported Exécution de code Compatible Appel de fonction Compatible Ancrage avec Google Maps Not supported Génération d'images Not supported API Live Not supported Ancrage de recherche Compatible Sorties structurées Compatible Raisonnement Compatible Contexte de l'URL Compatible |
| Versions |
|
| Dernière mise à jour | Septembre 2025 |
| Date limite des connaissances | Janvier 2025 |