Gemini Robotics-ER 1.6

O Gemini Robotics-ER 1.6 é um modelo de visão-linguagem (VLM) que traz os recursos de agente do Gemini para a robótica. Ele foi projetado para o raciocínio avançado no mundo físico, permitindo que os robôs interpretem dados visuais complexos, façam raciocínio espacial e planejem ações com base em comandos de linguagem natural.

Documentação

Acesse a página Robótica para conferir todos os recursos e funcionalidades.

gemini-robotics-er-1.6-preview

Propriedade Descrição
Código do modelo gemini-robotics-er-1.6-preview
Tipos de dados aceitos

Entradas (link em inglês)

Texto, imagens, vídeo, áudio

Saída

Texto

Limites de token[*]

Limite de tokens de entrada

1.048.576

Limite de token de saída

65.536

Recursos

Geração de áudio

incompatível

API Batch

Compatível

Armazenamento em cache

Compatível

Execução de código

Compatível

Uso do computador

Compatível

Pesquisa de arquivos

Compatível

Inferência flexível

Compatível

Chamadas de função

Compatível

Embasamento com o Google Maps

Compatível

Geração de imagens

incompatível

API Live

incompatível

Inferência de prioridade

Compatível

Embasamento da pesquisa

Compatível

Saídas estruturadas

Compatível

Raciocínio

Compatível

Contexto do URL

Compatível

Versões do
Leia os padrões de versão do modelo para mais detalhes.
  • Visualização: gemini-robotics-er-1.6-preview
Última atualização Dezembro de 2025
Limite de conhecimento Janeiro de 2025