Gemini Robotics-ER 1.5

Gemini Robotics-ER 1.5 es un modelo de lenguaje de visión (VLM) que lleva las capacidades de agente de Gemini a la robótica. Está diseñado para el razonamiento avanzado en el mundo físico, lo que permite que los robots interpreten datos visuales complejos, realicen razonamientos espaciales y planifiquen acciones a partir de comandos en lenguaje natural.

Documentación

Visita la página de robótica para obtener una cobertura completa de las funciones y capacidades.

gemini-robotics-er-1.5-preview

Propiedad Descripción
Código del modelo gemini-robotics-er-1.5-preview
Tipos de datos admitidos

Entradas

Texto, imágenes, video y audio

Resultado

Texto

Límites de tokens[*]

Límite de tokens de entrada

1,048,576

Límite de tokens de salida

65,536

Capacidades

Generación de audio

No admitido

API de lotes

No admitido

Almacenamiento en caché

No admitido

Ejecución de código

Admitido

Llamada a función

Admitido

Fundamentación con Google Maps

No admitido

Generación de imágenes

No admitido

API en vivo

No admitido

Fundamentación con la Búsqueda

Admitido

Salidas estructuradas

Admitido

Razonamiento

Admitido

Contexto de URL

Admitido

Versiones
Lee los patrones de versiones de modelos para obtener más detalles.
  • Vista previa: gemini-robotics-er-1.5-preview
Última actualización Septiembre de 2025
Fecha límite de conocimiento Enero de 2025