Gemini Robotics-ER 1.5

O Gemini Robotics-ER 1.5 é um modelo de visão-linguagem (VLM, na sigla em inglês) que traz os recursos de agente do Gemini para a robótica. Ele foi projetado para raciocínio avançado no mundo físico, permitindo que os robôs interpretem dados visuais complexos, realizem raciocínio espacial e planejem ações com base em comandos de linguagem natural.

Documentação

Acesse a página de robótica para conferir a cobertura completa de recursos e funcionalidades.

gemini-robotics-er-1.5-preview

Propriedade Descrição
Código do modelo gemini-robotics-er-1.5-preview
Tipos de dados compatíveis

Entradas

Texto, imagens, vídeo, áudio

Saída

Texto

Limites de token[*]

Limite de token de entrada

1.048.576

Limite de token de saída

65.536

Recursos

Geração de áudio

indisponível

API em lote

indisponível

Armazenamento em cache

indisponível

Execução de código

Compatível

Chamadas de função

Compatível

Embasamento com o Google Maps

indisponível

Geração de imagens

indisponível

API Live

indisponível

Embasamento da pesquisa

Compatível

Respostas estruturadas

Compatível

Raciocínio

Compatível

Contexto de URL

Compatível

Versões
Leia os padrões de versão do modelo para mais detalhes.
  • Visualização: gemini-robotics-er-1.5-preview
Atualização mais recente Setembro de 2025
Limite de conhecimento Janeiro de 2025