O Gemini Robotics-ER 1.5 é um modelo de linguagem de visão (VLM, na sigla em inglês) que traz os recursos de agente do Gemini para a robótica. Ele foi projetado para raciocínio avançado no mundo físico, permitindo que os robôs interpretem dados visuais complexos, realizem raciocínio espacial e planejem ações a partir de comandos de linguagem natural.
Documentação
Acesse a página de robótica para conferir a cobertura completa de recursos e funcionalidades.
gemini-robotics-er-1.5-preview
| Propriedade | Descrição |
|---|---|
| Código do modelo | gemini-robotics-er-1.5-preview |
| Tipos de dados compatíveis |
Entradas (link em inglês) Texto, imagens, vídeo, áudio Saída Texto |
| Limites de token[*] |
Limite de token de entrada 1.048.576 Limite de token de saída 65.536 |
| Recursos |
Geração de áudio Indisponível API em lote Indisponível Armazenamento em cache Indisponível Execução de código Compatível Chamadas de função Compatível Embasamento com o Google Maps Indisponível Geração de imagens Indisponível API Live Indisponível Embasamento da pesquisa Compatível Respostas estruturadas Compatível Raciocínio Compatível Contexto de URL Compatível |
| Versões |
|
| Atualização mais recente | Setembro de 2025 |
| Limite de conhecimento | Janeiro de 2025 |