O Gemini Robotics-ER 1.6 é um modelo de visão-linguagem (VLM) que traz os recursos de agente do Gemini para a robótica. Ele foi projetado para o raciocínio avançado no mundo físico, permitindo que os robôs interpretem dados visuais complexos, façam raciocínio espacial e planejem ações com base em comandos de linguagem natural.
Documentação
Acesse a página Robótica para conferir todos os recursos e funcionalidades.
gemini-robotics-er-1.6-preview
| Propriedade | Descrição |
|---|---|
| Código do modelo | gemini-robotics-er-1.6-preview |
| Tipos de dados aceitos |
Entradas (link em inglês) Texto, imagens, vídeo, áudio Saída Texto |
| Limites de token[*] |
Limite de tokens de entrada 1.048.576 Limite de token de saída 65.536 |
| Recursos |
Geração de áudio incompatível API Batch Compatível Armazenamento em cache Compatível Execução de código Compatível Uso do computador Compatível Pesquisa de arquivos Compatível Inferência flexível Compatível Chamadas de função Compatível Embasamento com o Google Maps Compatível Geração de imagens incompatível API Live incompatível Inferência de prioridade Compatível Embasamento da pesquisa Compatível Saídas estruturadas Compatível Raciocínio Compatível Contexto do URL Compatível |
| Versões do |
|
| Última atualização | Dezembro de 2025 |
| Limite de conhecimento | Janeiro de 2025 |