Gemini Robotics-ER 1.6

Gemini Robotics-ER 1.6 to model wizyjno-językowy (VLM), który wprowadza możliwości agenta Gemini do robotyki. Jest on przeznaczony do zaawansowanego wnioskowania w świecie fizycznym, dzięki czemu roboty mogą interpretować złożone dane wizualne, przeprowadzać rozumowanie przestrzenne i planować działania na podstawie poleceń w języku naturalnym.

Dokumentacja

Więcej informacji o funkcjach i możliwościach znajdziesz na stronie Robotyka.

gemini-robotics-er-1.6-preview

Właściwość Opis
Kod modelu gemini-robotics-er-1.6-preview
Obsługiwane typy danych

Dane wejściowe

Tekst, obrazy, filmy, dźwięk

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

131 072

Limit tokenów wyjściowych

65 536

Możliwości

Generowanie dźwięku

Nieobsługiwane

Zapisywanie w pamięci podręcznej

Obsługiwane

Wykonywanie kodu

Obsługiwane

Korzystanie z komputera

Obsługiwane

Wyszukiwanie plików

Obsługiwane

Wywoływanie funkcji

Obsługiwane

Powiązanie ze źródłami informacji przy użyciu Map Google

Obsługiwane

Generowanie obrazów

Nieobsługiwane

Interfejs API na żywo

Nieobsługiwane

Szukaj groundingu

Obsługiwane

Ustrukturyzowane dane wyjściowe

Obsługiwane

Myślę

Obsługiwane

Kontekst adresu URL

Obsługiwane

Opcje zużycia

Interfejs API wsadowy

Obsługiwane

Wnioskowanie Flex

Obsługiwane

Wnioskowanie priorytetowe

Obsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Wersja testowa: gemini-robotics-er-1.6-preview
Najnowsza aktualizacja Grudzień 2025 r.
Granica wiedzy Styczeń 2025 r.