Gemini Robotics-ER 1.5

Gemini Robotics-ER 1.5 est un modèle vision-langage (VLM) qui apporte les fonctionnalités d'agent de Gemini à la robotique. Il est conçu pour un raisonnement avancé dans le monde physique, ce qui permet aux robots d'interpréter des données visuelles complexes, d'effectuer un raisonnement spatial et de planifier des actions à partir de commandes en langage naturel.

Documentation

Consultez la page Robotics pour obtenir une couverture complète des fonctionnalités.

gemini-robotics-er-1.5-preview

Propriété Description
Code du modèle gemini-robotics-er-1.5-preview
Types de données compatibles

Entrées

Texte, images, vidéo, audio

Résultat

Texte

Limites de jetons[*]

Limite de jetons d'entrée

1 048 576

Limite de jetons de sortie

65 536

Fonctionnalités

Génération audio

Not supported

API par lot

Not supported

Mise en cache

Not supported

Exécution de code

Compatible

Appel de fonction

Compatible

Ancrage avec Google Maps

Not supported

Génération d'images

Not supported

API Live

Not supported

Ancrage de recherche

Compatible

Sorties structurées

Compatible

Raisonnement

Compatible

Contexte d'URL

Compatible

Versions
Pour en savoir plus, consultez les modèles de version de modèle.
  • Aperçu : gemini-robotics-er-1.5-preview
Dernière mise à jour Septembre 2025
Date limite des connaissances Janvier 2025