Experimente o novo modelo de pré-lançamento do Gemini 3.1 Flash TTS para geração de fala expressiva e multilíngue.

Gemini Robotics-ER 1.5

O Gemini Robotics-ER 1.5 é um modelo de visão-linguagem (VLM, na sigla em inglês) que traz os recursos de agente do Gemini para a robótica. Ele foi projetado para raciocínio avançado no mundo físico, permitindo que os robôs interpretem dados visuais complexos, realizem raciocínio espacial e planejem ações com base em comandos de linguagem natural.

Testar no Google AI Studio

Documentação

Acesse a página de robótica para conferir a cobertura completa de recursos e funcionalidades.

gemini-robotics-er-1.5-preview

Propriedade	Descrição
Código do modelo	`gemini-robotics-er-1.5-preview`
Tipos de dados compatíveis	Entradas Texto, imagens, vídeo, áudio Saída Texto
Limites de token^[*]	Limite de token de entrada 1.048.576 Limite de token de saída 65.536
Recursos	Geração de áudio indisponível API em lote indisponível Armazenamento em cache indisponível Execução de código Compatível Chamadas de função Compatível Embasamento com o Google Maps indisponível Geração de imagens indisponível API Live indisponível Embasamento da pesquisa Compatível Respostas estruturadas Compatível Raciocínio Compatível Contexto de URL Compatível
Versões	Leia os padrões de versão do modelo para mais detalhes. Visualização: `gemini-robotics-er-1.5-preview`
Atualização mais recente	Setembro de 2025
Limite de conhecimento	Janeiro de 2025