Gemini Robotics-ER 1.6 es un modelo de lenguaje de visión (VLM) que aporta las capacidades de agente de Gemini a la robótica. Está diseñado para el razonamiento avanzado en el mundo físico, lo que permite que los robots interpreten datos visuales complejos, realicen razonamiento espacial y planifiquen acciones a partir de comandos en lenguaje natural.
Documentación
Visita la página de Robótica para obtener una cobertura completa de las funciones y capacidades.
gemini-robotics-er-1.6-preview
| Propiedad | Descripción |
|---|---|
| Código del modelo | gemini-robotics-er-1.6-preview |
| Tipos de datos admitidos |
Entradas Texto, imágenes, video y audio Resultado Texto |
| Límites de tokens[*] |
Límite de tokens de entrada 131,072 Límite de tokens de salida 65,536 |
| Funciones |
Generación de audio No compatible API de Batch Admitido Almacenamiento en caché Admitido Ejecución de código Admitido Uso de la computadora Admitido Búsqueda de archivos Admitido Inferencia flexible Admitido Llamada a función Admitido Fundamentación con Google Maps Admitido Generación de imágenes No compatible API de Live No compatible Inferencia de prioridad Admitido Fundamentación con la Búsqueda Admitido Resultados estructurados Admitido Pensamiento Admitido Contexto de la URL Admitido |
| Versiones |
|
| Última actualización | Diciembre de 2025 |
| Fecha límite de conocimiento | Enero de 2025 |