Gemini Robotics-ER 1.6

Gemini Robotics-ER 1.6 ist ein Vision-Language-Modell (VLM), das die Agent-Funktionen von Gemini in die Robotik bringt. Es wurde für fortschrittliche Schlussfolgerungen in der physischen Welt entwickelt und ermöglicht es Robotern, komplexe visuelle Daten zu interpretieren, räumliche Schlussfolgerungen zu ziehen und Aktionen aus Befehlen in natürlicher Sprache zu planen.

Dokumentation

Auf der Seite Robotics finden Sie eine vollständige Übersicht über die Funktionen.

gemini-robotics-er-1.6-preview

Attribut Beschreibung
Modellcode gemini-robotics-er-1.6-preview
Unterstützte Datentypen

Eingaben

Text, Bilder, Video, Audio

Ausgabe

Text

Token-Limits[*]

Eingabetokenlimit

1.048.576

Tokenausgabelimit

65.536

Funktionen

Audiogenerierung

Nicht unterstützt

Batch API

Unterstützt

Caching

Unterstützt

Codeausführung

Unterstützt

Computernutzung

Unterstützt

Dateisuche

Unterstützt

Flex-Inferenz

Unterstützt

Funktionsaufrufe

Unterstützt

Fundierung mit Google Maps

Unterstützt

Bildgenerierung

Nicht unterstützt

Live API

Nicht unterstützt

Prioritätsinferenz

Unterstützt

Suchfundierung

Unterstützt

Strukturierte Ausgaben

Unterstützt

Denken

Unterstützt

URL-Kontext

Unterstützt

-Versionen
Weitere Informationen finden Sie unter Muster für Modellversionen.
  • Vorschau für: gemini-robotics-er-1.6-preview
Letzte Aktualisierung Dezember 2025
Wissensstichtag Januar 2025