Gemini Robotics-ER 1.6 est un modèle de vision-langage (VLM) qui apporte les capacités d'agent de Gemini à la robotique. Il est conçu pour le raisonnement avancé dans le monde physique, ce qui permet aux robots d'interpréter des données visuelles complexes, d'effectuer un raisonnement spatial et de planifier des actions à partir de commandes en langage naturel.
Documentation
Consultez la page Robotique pour obtenir une couverture complète des fonctionnalités.
gemini-robotics-er-1.6-preview
| Propriété | Description |
|---|---|
| Code du modèle | gemini-robotics-er-1.6-preview |
| Types de données acceptés pour |
Entrées Texte, images, vidéos, audio Résultat Texte |
| Limites de jetons[*] |
Limite de jetons d'entrée 1 048 576 Limite de jetons de sortie 65 536 |
| Fonctionnalités |
Génération audio Not supported API Batch Compatible Mise en cache Compatible Exécution de code Compatible Utilisation de l'ordinateur Compatible Recherche de fichiers Compatible Inférence Flex Compatible Appel de fonction Compatible Ancrage avec Google Maps Compatible Génération d'images Not supported API Live Not supported Inférence prioritaire Compatible Ancrage de recherche Compatible Sorties structurées Compatible Raisonnement Compatible Contexte de l'URL Compatible |
| Versions |
|
| Dernière mise à jour | Décembre 2025 |
| Date limite des connaissances | Janvier 2025 |