Gemini Robotics-ER 1.6

Gemini Robotics-ER 1.6 — это модель визуально-языкового взаимодействия (VLM), которая переносит возможности Gemini в области робототехники. Она разработана для сложных рассуждений в физическом мире, позволяя роботам интерпретировать сложные визуальные данные, выполнять пространственное мышление и планировать действия на основе команд на естественном языке.

Документация

Для получения полной информации о функциях и возможностях посетите страницу «Робототехника» .

gemini-robotics-er-1.6-preview

Свойство Описание
Код модели gemini-robotics-er-1.6-preview
Поддерживаемые типы данных

Входные данные

Текст, изображения, видео, аудио

Выход

Текст

Ограничения на количество токенов [*]

Ограничение на количество введенных токенов

1 048 576

лимит выходных токенов

65,536

Возможности

Генерация аудио

Не поддерживается

Пакетный API

Поддерживается

Кэширование

Поддерживается

Выполнение кода

Поддерживается

Использование компьютера

Поддерживается

Поиск файлов

Поддерживается

Гибкий вывод

Поддерживается

Вызов функции

Поддерживается

Определить местоположение с помощью Google Maps

Поддерживается

генерация изображений

Не поддерживается

API в реальном времени

Не поддерживается

Приоритетный вывод

Поддерживается

Поиск заземления

Поддерживается

Структурированные выходные данные

Поддерживается

Мышление

Поддерживается

контекст URL

Поддерживается

версии
Для получения более подробной информации ознакомьтесь с шаблонами версий модели .
  • Предварительный просмотр: gemini-robotics-er-1.6-preview
Последнее обновление Декабрь 2025 г.
Порог знаний Январь 2025 г.