Gemini Robotics-ER 1.5

Gemini Robotics-ER 1.5 est un modèle de vision-langage (VLM) qui apporte les capacités d'agent de Gemini à la robotique. Il est conçu pour le raisonnement avancé dans le monde physique, ce qui permet aux robots d'interpréter des données visuelles complexes, d'effectuer un raisonnement spatial et de planifier des actions à partir de commandes en langage naturel.

Documentation

Consultez la page Robotique pour obtenir une couverture complète des fonctionnalités.

gemini-robotics-er-1.5-preview

Propriété Description
Code du modèle gemini-robotics-er-1.5-preview
Types de données acceptés pour

Entrées

Texte, images, vidéos, audio

Résultat

Envoyer un message

Limites de jetons[*]

Limite de jetons d'entrée

1 048 576

Limite de jetons de sortie

65 536

 Fonctionnalités

Génération audio

Not supported

API Batch

Not supported

Mise en cache

Not supported

Exécution de code

Compatible

Appel de fonction

Compatible

Ancrage avec Google Maps

Not supported

Génération d'images

Not supported

API Live

Not supported

Ancrage de recherche

Compatible

Sorties structurées

Compatible

Raisonnement

Compatible

Contexte de l'URL

Compatible

Versions
Pour en savoir plus, consultez les schémas de version de modèle.
  • Aperçu : gemini-robotics-er-1.5-preview
Dernière mise à jour Septembre 2025
Date limite des connaissances Janvier 2025