Gemini Robotics-ER 1.5 es un modelo de lenguaje de visión (VLM) que aporta las capacidades de agente de Gemini a la robótica. Está diseñado para el razonamiento avanzado en el mundo físico, lo que permite que los robots interpreten datos visuales complejos, realicen razonamientos espaciales y planifiquen acciones a partir de comandos en lenguaje natural.
Documentación
Visita la página de Robótica para obtener una cobertura completa de las funciones y capacidades.
gemini-robotics-er-1.5-preview
| Propiedad | Descripción |
|---|---|
| Código del modelo | gemini-robotics-er-1.5-preview |
| Tipos de datos admitidos |
Entradas Texto, imágenes, video y audio Resultado Texto |
| Límites de tokens[*] |
Límite de tokens de entrada 1,048,576 Límite de tokens de salida 65,536 |
| Funciones |
Generación de audio No compatible API de Batch No compatible Almacenamiento en caché No compatible Ejecución de código Admitido Llamada a función Admitido Fundamentación con Google Maps No compatible Generación de imágenes No compatible API de Live No compatible Fundamentación de la búsqueda Admitido Resultados estructurados Admitido Pensamiento Admitido Contexto de la URL Admitido |
| Versiones |
|
| Última actualización | Septiembre de 2025 |
| Fecha límite de conocimiento | Enero de 2025 |