O Gemini Robotics-ER 1.5 é um modelo de visão-linguagem (VLM) que traz os recursos de agente do Gemini para a robótica. Ele foi projetado para o raciocínio avançado no mundo físico, permitindo que os robôs interpretem dados visuais complexos, façam raciocínio espacial e planejem ações com base em comandos de linguagem natural.
Documentação
Acesse a página Robótica para conferir todos os recursos e funcionalidades.
gemini-robotics-er-1.5-preview
| Propriedade | Descrição |
|---|---|
| Código do modelo | gemini-robotics-er-1.5-preview |
| Tipos de dados compatíveis |
Entradas (link em inglês) Texto, imagens, vídeo, áudio Saída Texto |
| Limites de token[*] |
Limite de tokens de entrada 1.048.576 Limite de token de saída 65.536 |
| Recursos |
Geração de áudio incompatível API Batch incompatível Armazenamento em cache incompatível Execução de código Compatível Chamadas de função Compatível Embasamento com o Google Maps incompatível Geração de imagens incompatível API Live incompatível Pesquisar conteúdo de embasamento Compatível Respostas estruturadas Compatível Pensar Compatível Contexto do URL Compatível |
| Versões do |
|
| Última atualização | Setembro de 2025 |
| Limite de conhecimento | Janeiro de 2025 |