Wypróbuj nowy model Gemini 3.1 Flash TTS Preview, który umożliwia ekspresywną generację mowy w wielu językach.

Gemini Robotics-ER 1.5

Gemini Robotics-ER 1.5 to model wizualno-językowy (VLM), który przenosi funkcje agenta Gemini do robotyki. Został on zaprojektowany z myślą o zaawansowanym wnioskowaniu w świecie fizycznym, dzięki czemu roboty mogą interpretować złożone dane wizualne, przeprowadzać rozumowanie przestrzenne i planować działania na podstawie poleceń w języku naturalnym.

Wypróbuj w Google AI Studio

Dokumentacja

Więcej informacji o funkcjach i możliwościach znajdziesz na stronie Robotyka.

gemini-robotics-er-1.5-preview

Właściwość	Opis
Kod modelu	`gemini-robotics-er-1.5-preview`
Obsługiwane typy danych	Dane wejściowe Tekst, obrazy, filmy, dźwięk Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 65 536
Uprawnienia	Generowanie dźwięku Nieobsługiwane Batch API Nieobsługiwane Zapisywanie w pamięci podręcznej Nieobsługiwane Wykonanie kodu Obsługiwane Wywoływanie funkcji Obsługiwane Powiązanie ze źródłem informacji przy użyciu Map Google Nieobsługiwane Generowanie obrazów Nieobsługiwane Live API Nieobsługiwane Szukaj groundingu Obsługiwane Ustrukturyzowane dane wyjściowe Obsługiwane Myślenie Obsługiwane Kontekst adresu URL Obsługiwane
Wersje	Więcej informacji znajdziesz w wzorcach wersji modelu. Podgląd: `gemini-robotics-er-1.5-preview`
Ostatnia aktualizacja	Wrzesień 2025 r.
Granica wiedzy	Styczeń 2025 r.