Gemini Robotics-ER 1.5 to model wizualno-językowy (VLM), który udostępnia funkcje agenta Gemini w robotyce. Został on zaprojektowany z myślą o zaawansowanym rozumowaniu w świecie fizycznym, dzięki czemu roboty mogą interpretować złożone dane wizualne, przeprowadzać rozumowanie przestrzenne i planować działania na podstawie poleceń w języku naturalnym.
Dokumentacja
Więcej informacji o funkcjach i możliwościach znajdziesz na stronie Robotyka.
gemini-robotics-er-1.5-preview
| Właściwość | Opis |
|---|---|
| Kod modelu | gemini-robotics-er-1.5-preview |
| Obsługiwane typy danych |
Dane wejściowe Tekst, obrazy, filmy, dźwięk Dane wyjściowe Tekst |
| Limity tokenów[*] |
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 65 536 |
| Uprawnienia |
Generowanie dźwięku Nieobsługiwane Batch API Nieobsługiwane Zapisywanie w pamięci podręcznej Nieobsługiwane Wykonanie kodu Obsługiwane Wywoływanie funkcji Obsługiwane Grounding z użyciem Map Google Nieobsługiwane Generowanie obrazów Nieobsługiwane Live API Nieobsługiwane Szukaj groundingu Obsługiwane Ustrukturyzowane dane wyjściowe Obsługiwane Myślenie Obsługiwane Kontekst adresu URL Obsługiwane |
| Wersje |
|
| Ostatnia aktualizacja | Wrzesień 2025 r. |
| Granica wiedzy | Styczeń 2025 r. |