Gemini Robotics-ER 1.5

O Gemini Robotics-ER 1.5 é um modelo de visão-linguagem (VLM) que traz os recursos de agente do Gemini para a robótica. Ele foi projetado para o raciocínio avançado no mundo físico, permitindo que os robôs interpretem dados visuais complexos, façam raciocínio espacial e planejem ações com base em comandos de linguagem natural.

Documentação

Acesse a página Robótica para conferir todos os recursos e funcionalidades.

gemini-robotics-er-1.5-preview

Propriedade Descrição
Código do modelo gemini-robotics-er-1.5-preview
Tipos de dados compatíveis

Entradas (link em inglês)

Texto, imagens, vídeo, áudio

Saída

Texto

Limites de token[*]

Limite de tokens de entrada

1.048.576

Limite de token de saída

65.536

Recursos

Geração de áudio

incompatível

API Batch

incompatível

Armazenamento em cache

incompatível

Execução de código

Compatível

Chamadas de função

Compatível

Embasamento com o Google Maps

incompatível

Geração de imagens

incompatível

API Live

incompatível

Pesquisar conteúdo de embasamento

Compatível

Respostas estruturadas

Compatível

Pensar

Compatível

Contexto do URL

Compatível

Versões do
Leia os padrões de versão do modelo para mais detalhes.
  • Visualização: gemini-robotics-er-1.5-preview
Última atualização Setembro de 2025
Limite de conhecimento Janeiro de 2025