Gemini Robotics-ER 1.6 es un modelo de lenguaje visual (VLM) que incorpora las capacidades de agente de Gemini a la robótica. Está diseñado para el razonamiento avanzado en el mundo físico, lo que permite que los robots interpreten datos visuales complejos, realicen razonamientos espaciales y planifiquen acciones a partir de comandos de lenguaje natural.
Documentación
Visita la página de robótica para obtener una cobertura completa de las funciones y capacidades.
gemini-robotics-er-1.6-preview
| Propiedad | Descripción |
|---|---|
| Código del modelo | gemini-robotics-er-1.6-preview |
| Tipos de datos admitidos |
Entradas Texto, imágenes, video y audio Resultado Texto |
| Límites de tokens[*] |
Límite de tokens de entrada 1,048,576 Límite de tokens de salida 65,536 |
| Capacidades |
Generación de audio No compatible API de lotes Admitido Almacenamiento en caché Admitido Ejecución de código Admitido Uso de la computadora Admitido Búsqueda de archivos Admitido Inferencia flexible Admitido Llamada a función Admitido Fundamentación con Google Maps Admitido Generación de imágenes No compatible API en vivo No compatible Inferencia prioritaria Admitido Fundamentación de la búsqueda Admitido Salidas estructuradas Admitido Razonamiento Admitido Contexto de la URL Admitido |
| Versiones |
|
| Última actualización | Diciembre de 2025 |
| Fecha límite de conocimiento | Enero de 2025 |