Gemini Robotics-ER 1.6

O Gemini Robotics-ER 1.6 é um modelo de linguagem de visão (VLM, na sigla em inglês) que traz os recursos de agente do Gemini para a robótica. Ele foi projetado para raciocínio avançado no mundo físico, permitindo que os robôs interpretem dados visuais complexos, realizem raciocínio espacial e planejem ações com comandos de linguagem natural.

Documentação

Acesse a página de robótica para conferir a cobertura completa de recursos e funcionalidades.

gemini-robotics-er-1.6-preview

Propriedade Descrição
Código do modelo gemini-robotics-er-1.6-preview
Tipos de dados com suporte

Entradas

Texto, imagens, vídeo, áudio

Saída

Texto

Limites de token[*]

Limite de token de entrada

131.072

Limite de token de saída

65.536

Recursos

Geração de áudio

indisponível

Armazenamento em cache

Compatível

Execução de código

Compatível

Uso do computador

Compatível

Pesquisa de arquivos

Compatível

Chamadas de função

Compatível

Embasamento com o Google Maps

Compatível

Geração de imagens

indisponível

API Live

indisponível

Embasamento da pesquisa

Compatível

Respostas estruturadas

Compatível

Raciocínio

Compatível

Contexto de URL

Compatível

Opções de consumo

API em lote

Compatível

Inferência flexível

Compatível

Inferência prioritária

Compatível

Versões
Leia os padrões de versão do modelo para mais detalhes.
  • Visualização: gemini-robotics-er-1.6-preview
Atualização mais recente Dezembro de 2025
Limite de conhecimento Janeiro de 2025