Gemini Robotics-ER 1.6 ist ein Vision-Language-Modell (VLM), das die agentischen Funktionen von Gemini in die Robotik bringt. Es wurde für fortgeschrittenes logisches Schlussfolgern in der physischen Welt entwickelt und ermöglicht Robotern, komplexe visuelle Daten zu interpretieren, räumliches Schlussfolgern durchzuführen und Aktionen anhand von Befehlen in natürlicher Sprache zu planen.
Dokumentation
Auf der Seite Robotik finden Sie eine vollständige Übersicht der Funktionen.
gemini-robotics-er-1.6-preview
| Attribut | Beschreibung |
|---|---|
| Modellcode | gemini-robotics-er-1.6-preview |
| Unterstützte Datentypen |
Eingaben Text, Bilder, Video, Audio Ausgabe Text |
| Token limits[*] |
Tokenlimit für Eingaben 131.072 Tokenlimit für Ausgaben 65.536 |
| Funktionen |
Audiogenerierung Nicht unterstützt Batch API Unterstützt Caching Unterstützt Codeausführung Unterstützt Computer verwenden Unterstützt Dateisuche Unterstützt Flex-Inferenz Unterstützt Funktionsaufrufe Unterstützt Fundierung mit Google Maps Unterstützt Bildgenerierung Nicht unterstützt Live API Nicht unterstützt Prioritätsinferenz Unterstützt Suchfundierung Unterstützt Strukturierte Ausgaben Unterstützt Überlegung Unterstützt URL-Kontext Unterstützt |
| Versionen |
|
| Letzte Aktualisierung | Dezember 2025 |
| Wissensstand | Januar 2025 |