Gemini Robotics-ER 1.5

Gemini Robotics-ER 1.5 to model wizualno-językowy (VLM), który udostępnia funkcje agenta Gemini w robotyce. Został on zaprojektowany z myślą o zaawansowanym rozumowaniu w świecie fizycznym, dzięki czemu roboty mogą interpretować złożone dane wizualne, przeprowadzać rozumowanie przestrzenne i planować działania na podstawie poleceń w języku naturalnym.

Dokumentacja

Więcej informacji o funkcjach i możliwościach znajdziesz na stronie Robotyka.

gemini-robotics-er-1.5-preview

Właściwość Opis
Kod modelu gemini-robotics-er-1.5-preview
Obsługiwane typy danych

Dane wejściowe

Tekst, obrazy, filmy, dźwięk

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

65 536

Uprawnienia

Generowanie dźwięku

Nieobsługiwane

Batch API

Nieobsługiwane

Zapisywanie w pamięci podręcznej

Nieobsługiwane

Wykonanie kodu

Obsługiwane

Wywoływanie funkcji

Obsługiwane

Grounding z użyciem Map Google

Nieobsługiwane

Generowanie obrazów

Nieobsługiwane

Live API

Nieobsługiwane

Szukaj groundingu

Obsługiwane

Ustrukturyzowane dane wyjściowe

Obsługiwane

Myślenie

Obsługiwane

Kontekst adresu URL

Obsługiwane

Wersje
Więcej informacji znajdziesz w wzorcach wersji modelu.
  • Podgląd: gemini-robotics-er-1.5-preview
Ostatnia aktualizacja Wrzesień 2025 r.
Granica wiedzy Styczeń 2025 r.