Gemini Robotics-ER 1.6 ist ein Vision-Language-Modell (VLM), das die Agent-Funktionen von Gemini in die Robotik bringt. Es wurde für fortschrittliche Schlussfolgerungen in der physischen Welt entwickelt und ermöglicht es Robotern, komplexe visuelle Daten zu interpretieren, räumliche Schlussfolgerungen zu ziehen und Aktionen aus Befehlen in natürlicher Sprache zu planen.
Dokumentation
Auf der Seite Robotics finden Sie eine vollständige Übersicht über die Funktionen.
gemini-robotics-er-1.6-preview
| Attribut | Beschreibung |
|---|---|
| Modellcode | gemini-robotics-er-1.6-preview |
| Unterstützte Datentypen |
Eingaben Text, Bilder, Video, Audio Ausgabe Text |
| Token-Limits[*] |
Eingabetokenlimit 1.048.576 Tokenausgabelimit 65.536 |
| Funktionen |
Audiogenerierung Nicht unterstützt Batch API Unterstützt Caching Unterstützt Codeausführung Unterstützt Computernutzung Unterstützt Dateisuche Unterstützt Flex-Inferenz Unterstützt Funktionsaufrufe Unterstützt Fundierung mit Google Maps Unterstützt Bildgenerierung Nicht unterstützt Live API Nicht unterstützt Prioritätsinferenz Unterstützt Suchfundierung Unterstützt Strukturierte Ausgaben Unterstützt Denken Unterstützt URL-Kontext Unterstützt |
| -Versionen |
|
| Letzte Aktualisierung | Dezember 2025 |
| Wissensstichtag | Januar 2025 |