Interfejs Interactions API jest już ogólnie dostępny. Zalecamy korzystanie z tego interfejsu API, aby mieć dostęp do wszystkich najnowszych funkcji i modeli.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini Robotics-ER 1.6

Gemini Robotics-ER 1.6 to model wizyjno-językowy (VLM), który wprowadza możliwości agenta Gemini do robotyki. Jest on przeznaczony do zaawansowanego wnioskowania w świecie fizycznym, dzięki czemu roboty mogą interpretować złożone dane wizualne, przeprowadzać rozumowanie przestrzenne i planować działania na podstawie poleceń w języku naturalnym.

Wypróbuj w Google AI Studio

Dokumentacja

Więcej informacji o funkcjach i możliwościach znajdziesz na stronie Robotyka.

gemini-robotics-er-1.6-preview

Właściwość	Opis
Kod modelu	`gemini-robotics-er-1.6-preview`
Obsługiwane typy danych	Dane wejściowe Tekst, obrazy, filmy, dźwięk Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 131 072 Limit tokenów wyjściowych 65 536
Możliwości	Generowanie dźwięku Nieobsługiwane Zapisywanie w pamięci podręcznej Obsługiwane Wykonywanie kodu Obsługiwane Korzystanie z komputera Obsługiwane Wyszukiwanie plików Obsługiwane Wywoływanie funkcji Obsługiwane Powiązanie ze źródłami informacji przy użyciu Map Google Obsługiwane Generowanie obrazów Nieobsługiwane Interfejs API na żywo Nieobsługiwane Szukaj groundingu Obsługiwane Ustrukturyzowane dane wyjściowe Obsługiwane Myślę Obsługiwane Kontekst adresu URL Obsługiwane
Opcje zużycia	Interfejs API wsadowy Obsługiwane Wnioskowanie Flex Obsługiwane Wnioskowanie priorytetowe Obsługiwane
Wersje	Więcej informacji znajdziesz w artykule Wzorce wersji modelu. Wersja testowa: `gemini-robotics-er-1.6-preview`
Najnowsza aktualizacja	Grudzień 2025 r.
Granica wiedzy	Styczeń 2025 r.