Gemini Robotics-ER 1.6

Gemini Robotics-ER 1.6 ist ein Vision-Language-Modell (VLM), das die agentischen Funktionen von Gemini für die Robotik nutzt. Es wurde für fortschrittliche Schlussfolgerungen in der physischen Welt entwickelt und ermöglicht es Robotern, komplexe visuelle Daten zu interpretieren, räumliche Schlussfolgerungen zu ziehen und Aktionen aus Befehlen in natürlicher Sprache zu planen.

Dokumentation

Auf der Seite Robotics finden Sie eine vollständige Übersicht über die Funktionen.

gemini-robotics-er-1.6-preview

Attribut Beschreibung
Modellcode gemini-robotics-er-1.6-preview
Unterstützte Datentypen

Eingaben

Text, Bilder, Video, Audio

Ausgabe

Text

Token-Limits[*]

Eingabetokenlimit

131.072

Tokenausgabelimit

65.536

Funktionen

Audiogenerierung

Nicht unterstützt

Caching

Unterstützt

Code-Ausführung

Unterstützt

Computernutzung

Unterstützt

Dateisuche

Unterstützt

Funktionsaufrufe

Unterstützt

Fundierung mit Google Maps

Unterstützt

Bildgenerierung

Nicht unterstützt

Live API

Nicht unterstützt

Suchfundierung

Unterstützt

Strukturierte Ausgaben

Unterstützt

Denken

Unterstützt

URL-Kontext

Unterstützt

Nutzungsoptionen

Batch API

Unterstützt

Flex-Inferenz

Unterstützt

Prioritätsinferenz

Unterstützt

-Versionen
Weitere Informationen finden Sie unter Muster für Modellversionen.
  • Vorschau für: gemini-robotics-er-1.6-preview
Letzte Aktualisierung Dezember 2025
Wissensstichtag Januar 2025