Gemini Robotics-ER 1.6

Gemini Robotics-ER 1.6 es un modelo de lenguaje de visión (VLM) que aporta las capacidades de agente de Gemini a la robótica. Está diseñado para el razonamiento avanzado en el mundo físico, lo que permite a los robots interpretar datos visuales complejos, realizar razonamiento espacial y planificar acciones a partir de comandos en lenguaje natural.

Documentación

Visita la página de Robótica para obtener una cobertura completa de las funciones y capacidades.

gemini-robotics-er-1.6-preview

Propiedad Descripción
Código del modelo gemini-robotics-er-1.6-preview
Tipos de datos admitidos

Entradas

Texto, imágenes, video y audio

Resultado

Texto

Límites de tokens[*]

Límite de tokens de entrada

131,072

Límite de tokens de salida

65,536

Funciones

Generación de audio

No compatible

Almacenamiento en caché

Admitido

Ejecución de código

Admitido

Uso de la computadora

Admitido

Búsqueda de archivos

Admitido

Llamada a función

Admitido

Fundamentación con Google Maps

Admitido

Generación de imágenes

No compatible

API de Live

No compatible

Fundamentación con la Búsqueda

Admitido

Resultados estructurados

Admitido

Pensamiento

Admitido

Contexto de la URL

Admitido

Opciones de consumo

API de Batch

Admitido

Inferencia flexible

Admitido

Inferencia de prioridad

Admitido

Versiones
Lee los patrones de versiones del modelo para obtener más detalles.
  • Vista previa: gemini-robotics-er-1.6-preview
Última actualización Diciembre de 2025
Fecha límite de conocimiento Enero de 2025