Consulta la página de modelos para obtener la versión más reciente del modelo.
Gemini Robotics-ER 1.5 es un modelo de lenguaje de visión (VLM) que lleva las capacidades de agente de Gemini a la robótica. Está diseñado para el razonamiento avanzado en el mundo físico, lo que permite que los robots interpreten datos visuales complejos, realicen razonamientos espaciales y planifiquen acciones a partir de comandos en lenguaje natural.
Documentación
Visita la página de robótica para obtener una cobertura completa de las funciones y capacidades.
gemini-robotics-er-1.5-preview
| Propiedad | Descripción |
|---|---|
| Código del modelo | gemini-robotics-er-1.5-preview |
| Tipos de datos admitidos |
Entradas Texto, imágenes, video y audio Resultado Texto |
| Límites de tokens[*] |
Límite de tokens de entrada 1,048,576 Límite de tokens de salida 65,536 |
| Capacidades |
Generación de audio No admitido API de lotes No admitido Almacenamiento en caché No admitido Ejecución de código Admitido Llamada a función Admitido Fundamentación con Google Maps No admitido Generación de imágenes No admitido API en vivo No admitido Fundamentación con la Búsqueda Admitido Salidas estructuradas Admitido Razonamiento Admitido Contexto de URL Admitido |
| Versiones |
|
| Última actualización | Septiembre de 2025 |
| Fecha límite de conocimiento | Enero de 2025 |