Gemini Robotics-ER 1.6

Gemini Robotics-ER 1.6 est un modèle de vision-langage (VLM) qui apporte les capacités d'agent de Gemini à la robotique. Il est conçu pour le raisonnement avancé dans le monde physique, ce qui permet aux robots d'interpréter des données visuelles complexes, d'effectuer un raisonnement spatial et de planifier des actions à partir de commandes en langage naturel.

Documentation

Consultez la page Robotique pour obtenir une couverture complète des fonctionnalités.

gemini-robotics-er-1.6-preview

Propriété Description
Code du modèle gemini-robotics-er-1.6-preview
Types de données acceptés pour

Entrées

Texte, images, vidéos, audio

Résultat

Texte

Limites de jetons[*]

Limite de jetons d'entrée

1 048 576

Limite de jetons de sortie

65 536

 Fonctionnalités

Génération audio

Not supported

API Batch

Compatible

Mise en cache

Compatible

Exécution de code

Compatible

Utilisation de l'ordinateur

Compatible

Recherche de fichiers

Compatible

Inférence Flex

Compatible

Appel de fonction

Compatible

Ancrage avec Google Maps

Compatible

Génération d'images

Not supported

API Live

Not supported

Inférence prioritaire

Compatible

Ancrage de recherche

Compatible

Sorties structurées

Compatible

Raisonnement

Compatible

Contexte de l'URL

Compatible

Versions
Pour en savoir plus, consultez les schémas de version de modèle.
  • Aperçu : gemini-robotics-er-1.6-preview
Dernière mise à jour Décembre 2025
Date limite des connaissances Janvier 2025