API для взаимодействия теперь общедоступн. Мы рекомендуем использовать этот API для доступа ко всем новейшим функциям и моделям.

Эта страница переведена с помощью Cloud Translation API.

Gemini Robotics-ER 1.6

Gemini Robotics-ER 1.6 — это модель визуально-языкового взаимодействия (VLM), которая переносит возможности Gemini в области робототехники. Она разработана для сложных рассуждений в физическом мире, позволяя роботам интерпретировать сложные визуальные данные, выполнять пространственное мышление и планировать действия на основе команд на естественном языке.

Попробуйте в Google AI Studio

Документация

Для получения полной информации о функциях и возможностях посетите страницу «Робототехника» .

gemini-robotics-er-1.6-preview

Свойство	Описание
Код модели	`gemini-robotics-er-1.6-preview`
Поддерживаемые типы данных	Входные данные Текст, изображения, видео, аудио Выход Текст
Ограничения на количество токенов ^[*]	Ограничение на количество введенных токенов 131,072 лимит выходных токенов 65,536
Возможности	Генерация аудио Не поддерживается Кэширование Поддерживается Выполнение кода Поддерживается Использование компьютера Поддерживается Поиск файлов Поддерживается Вызов функции Поддерживается Определить местоположение с помощью Google Maps Поддерживается генерация изображений Не поддерживается API в реальном времени Не поддерживается Поиск заземления Поддерживается Структурированные выходные данные Поддерживается Мышление Поддерживается контекст URL Поддерживается
Варианты потребления	Пакетный API Поддерживается Гибкий вывод Поддерживается Приоритетный вывод Поддерживается
версии	Для получения более подробной информации ознакомьтесь с шаблонами версий модели . Предварительный просмотр: `gemini-robotics-er-1.6-preview`
Последнее обновление	Декабрь 2025 г.
Порог знаний	Январь 2025 г.