O Gemini Robotics-ER 1.6 é um modelo de linguagem de visão (VLM, na sigla em inglês) que traz os recursos de agente do Gemini para a robótica. Ele foi projetado para raciocínio avançado no mundo físico, permitindo que os robôs interpretem dados visuais complexos, realizem raciocínio espacial e planejem ações a partir de comandos de linguagem natural.
Documentação
Acesse a página de robótica para conferir a cobertura completa de recursos e funcionalidades.
gemini-robotics-er-1.6-preview
| Propriedade | Descrição |
|---|---|
| Código do modelo | gemini-robotics-er-1.6-preview |
| Tipos de dados compatíveis |
Entradas Texto, imagens, vídeo, áudio Saída Texto |
| Limites de token[*] |
Limite de token de entrada 131.072 Limite de token de saída 65.536 |
| Recursos |
Geração de áudio indisponível API em lote Compatível Armazenamento em cache Compatível Execução de código Compatível Uso do computador Compatível Pesquisa de arquivos Compatível Inferência flexível Compatível Chamadas de função Compatível Embasamento com o Google Maps Compatível Geração de imagens indisponível API em tempo real indisponível Inferência de prioridade Compatível Embasamento da pesquisa Compatível Respostas estruturadas Compatível Raciocínio Compatível Contexto de URL Compatível |
| Versões |
|
| Última atualização | Dezembro de 2025 |
| Limite de conhecimento | Janeiro de 2025 |