Gemini Deep Research jest teraz dostępna w wersji testowej z funkcjami planowania współpracy, wizualizacji, obsługi MCP i nie tylko.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini Robotics-ER 1.5

Gemini Robotics-ER 1.5 to model wizyjno-językowy (VLM), który wprowadza możliwości agenta Gemini do robotyki. Jest on przeznaczony do zaawansowanego wnioskowania w świecie fizycznym, dzięki czemu roboty mogą interpretować złożone dane wizualne, przeprowadzać rozumowanie przestrzenne i planować działania na podstawie poleceń w języku naturalnym.

Wypróbuj w Google AI Studio

Dokumentacja

Więcej informacji o funkcjach i możliwościach znajdziesz na stronie Robotyka.

gemini-robotics-er-1.5-preview

Właściwość	Opis
Kod modelu	`gemini-robotics-er-1.5-preview`
Obsługiwane typy danych	Dane wejściowe Tekst, obrazy, filmy, dźwięk Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 65 536
Możliwości	Generowanie dźwięku Nieobsługiwane Interfejs Batch API Nieobsługiwane Zapisywanie w pamięci podręcznej Nieobsługiwane Wykonywanie kodu Obsługiwane Wywoływanie funkcji Obsługiwane Powiązanie ze źródłem informacji przy użyciu Map Google Nieobsługiwane Generowanie obrazów Nieobsługiwane Interfejs Live API Nieobsługiwane Szukaj groundingu Obsługiwane Ustrukturyzowane dane wyjściowe Obsługiwane Myślę Obsługiwane Kontekst adresu URL Obsługiwane
Wersje	Więcej informacji znajdziesz w artykule Wzorce wersji modelu. Wersja testowa: `gemini-robotics-er-1.5-preview`
Ostatnia aktualizacja	Wrzesień 2025 r.
Granica wiedzy	Styczeń 2025 r.