Gemini Robotics-ER 1.5

Gemini Robotics-ER 1.5 to model wizyjno-językowy (VLM), który wprowadza możliwości agenta Gemini do robotyki. Jest on przeznaczony do zaawansowanego wnioskowania w świecie fizycznym, dzięki czemu roboty mogą interpretować złożone dane wizualne, przeprowadzać rozumowanie przestrzenne i planować działania na podstawie poleceń w języku naturalnym.

Dokumentacja

Więcej informacji o funkcjach i możliwościach znajdziesz na stronie Robotyka.

gemini-robotics-er-1.5-preview

Właściwość Opis
Kod modelu gemini-robotics-er-1.5-preview
Obsługiwane typy danych

Dane wejściowe

Tekst, obrazy, filmy, dźwięk

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

65 536

Możliwości

Generowanie dźwięku

Nieobsługiwane

Interfejs Batch API

Nieobsługiwane

Zapisywanie w pamięci podręcznej

Nieobsługiwane

Wykonywanie kodu

Obsługiwane

Wywoływanie funkcji

Obsługiwane

Powiązanie ze źródłem informacji przy użyciu Map Google

Nieobsługiwane

Generowanie obrazów

Nieobsługiwane

Interfejs Live API

Nieobsługiwane

Szukaj groundingu

Obsługiwane

Ustrukturyzowane dane wyjściowe

Obsługiwane

Myślę

Obsługiwane

Kontekst adresu URL

Obsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Wersja testowa: gemini-robotics-er-1.5-preview
Ostatnia aktualizacja Wrzesień 2025 r.
Granica wiedzy Styczeń 2025 r.