Gemini Robotics-ER 1.6 to model wizualno-językowy (VLM), który wykorzystuje funkcje agenta Gemini w robotyce. Został on zaprojektowany z myślą o zaawansowanym wnioskowaniu w świecie fizycznym, dzięki czemu roboty mogą interpretować złożone dane wizualne, przeprowadzać rozumowanie przestrzenne i planować działania na podstawie poleceń w języku naturalnym.
Dokumentacja
Więcej informacji o funkcjach i możliwościach znajdziesz na stronie Robotyka.
gemini-robotics-er-1.6-preview
| Właściwość | Opis |
|---|---|
| Kod modelu | gemini-robotics-er-1.6-preview |
| Obsługiwane typy danych |
Dane wejściowe Tekst, obrazy, filmy, dźwięk Dane wyjściowe Tekst |
| Limity tokenów[*] |
Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 65 536 |
| Uprawnienia |
Generowanie dźwięku Nieobsługiwane Batch API Obsługiwane Zapisywanie w pamięci podręcznej Obsługiwane Wykonanie kodu Obsługiwane Korzystanie z komputera Obsługiwane Wyszukiwanie plików Obsługiwane Elastyczne wnioskowanie Obsługiwane Wywoływanie funkcji Obsługiwane Powiązanie ze źródłem informacji przy użyciu Map Google Obsługiwane Generowanie obrazów Nieobsługiwane Live API Nieobsługiwane Wnioskowanie o priorytecie Obsługiwane Szukaj groundingu Obsługiwane Ustrukturyzowane dane wyjściowe Obsługiwane Myślenie Obsługiwane Kontekst adresu URL Obsługiwane |
| Wersje |
|
| Ostatnia aktualizacja | Grudzień 2025 r. |
| Granica wiedzy | Styczeń 2025 r. |