Gemini Robotics-ER 1.5 to model wizualno-językowy (VLM), który przenosi funkcje agenta Gemini do robotyki. Został on zaprojektowany z myślą o zaawansowanym wnioskowaniu w świecie fizycznym, dzięki czemu roboty mogą interpretować złożone dane wizualne, przeprowadzać rozumowanie przestrzenne i planować działania na podstawie poleceń w języku naturalnym.
Dokumentacja
Więcej informacji o funkcjach i możliwościach znajdziesz na stronie Robotyka.
gemini-robotics-er-1.5-preview
| Właściwość | Opis |
|---|---|
| Kod modelu | gemini-robotics-er-1.5-preview |
| Obsługiwane typy danych |
Dane wejściowe Tekst, obrazy, filmy, dźwięk Dane wyjściowe Tekst |
| Limity tokenów[*] |
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 65 536 |
| Uprawnienia |
Generowanie dźwięku Nieobsługiwane Batch API Nieobsługiwane Zapisywanie w pamięci podręcznej Nieobsługiwane Wykonanie kodu Obsługiwane Wywoływanie funkcji Obsługiwane Powiązanie ze źródłem informacji przy użyciu Map Google Nieobsługiwane Generowanie obrazów Nieobsługiwane Live API Nieobsługiwane Szukaj groundingu Obsługiwane Ustrukturyzowane dane wyjściowe Obsługiwane Myślenie Obsługiwane Kontekst adresu URL Obsługiwane |
| Wersje |
|
| Ostatnia aktualizacja | Wrzesień 2025 r. |
| Granica wiedzy | Styczeń 2025 r. |