Die Interactions API ist jetzt allgemein verfügbar. Wir empfehlen, diese API zu verwenden, um auf alle aktuellen Funktionen und Modelle zuzugreifen.

Google verwendet KI-Technologie, um Inhalte in Ihre bevorzugte Sprache zu übersetzen. KI-Übersetzungen können Fehler enthalten.

Gemini Robotics ER 1.6

Gemini Robotics ER 1.6 ist ein Vision-Language-Modell (VLM), das die agentischen Funktionen von Gemini in die Robotik bringt. Es wurde für komplexes Reasoning in der physischen Welt entwickelt und ermöglicht Robotern, komplexe visuelle Daten zu interpretieren, räumliche Schlussfolgerungen zu ziehen und Aktionen anhand von Befehlen in natürlicher Sprache zu planen.

In Google AI Studio testen

Dokumentation

Auf der Seite Robotik finden Sie eine vollständige Übersicht der Funktionen.

gemini-robotics-er-1.6-preview

Attribut	Beschreibung
Modellcode	`gemini-robotics-er-1.6-preview`
Unterstützte Datentypen	Eingaben Text, Bilder, Video, Audio Ausgabe Text
Token limits^[*]	Tokenlimit für Eingaben 131.072 Tokenlimit für Ausgaben 65.536
Funktionen	Audiogenerierung Nicht unterstützt Caching Unterstützt Code-Ausführung Unterstützt Computerverwendung Unterstützt Dateisuche Unterstützt Funktionsaufrufe Unterstützt Fundierung mit Google Maps Unterstützt Bildgenerierung Nicht unterstützt Live-API Nicht unterstützt Suchfundierung Unterstützt Strukturierte Ausgaben Unterstützt Antwort wird generiert Unterstützt URL-Kontext Unterstützt
Verbrauchsoptionen	Batch-API Unterstützt Flex-Inferenz Unterstützt Prioritätsinferenz Unterstützt
Versionen	Weitere Informationen finden Sie unter Modellversionsmuster. Vorschau für: `gemini-robotics-er-1.6-preview`
Letzte Aktualisierung	Dezember 2025
Wissensstand	Januar 2025