O Gemini Robotics-ER 1.5 é um modelo de visão-linguagem (VLM, na sigla em inglês) que traz os recursos de agente do Gemini para a robótica. Ele foi projetado para raciocínio avançado no mundo físico, permitindo que os robôs interpretem dados visuais complexos, realizem raciocínio espacial e planejem ações com base em comandos de linguagem natural.
Documentação
Acesse a página de robótica para conferir a cobertura completa de recursos e funcionalidades.
gemini-robotics-er-1.5-preview
| Propriedade | Descrição |
|---|---|
| Código do modelo | gemini-robotics-er-1.5-preview |
| Tipos de dados compatíveis |
Entradas Texto, imagens, vídeo, áudio Saída Texto |
| Limites de token[*] |
Limite de token de entrada 1.048.576 Limite de token de saída 65.536 |
| Recursos |
Geração de áudio indisponível API em lote indisponível Armazenamento em cache indisponível Execução de código Compatível Chamadas de função Compatível Embasamento com o Google Maps indisponível Geração de imagens indisponível API Live indisponível Embasamento da pesquisa Compatível Respostas estruturadas Compatível Raciocínio Compatível Contexto de URL Compatível |
| Versões |
|
| Atualização mais recente | Setembro de 2025 |
| Limite de conhecimento | Janeiro de 2025 |