Gemini Robotics-ER 1.5

Gemini Robotics-ER 1.5 es un modelo de lenguaje de visión (VLM) que aporta las capacidades de agente de Gemini a la robótica. Está diseñado para el razonamiento avanzado en el mundo físico, lo que permite que los robots interpreten datos visuales complejos, realicen razonamientos espaciales y planifiquen acciones a partir de comandos en lenguaje natural.

Documentación

Visita la página de Robótica para obtener una cobertura completa de las funciones y capacidades.

gemini-robotics-er-1.5-preview

Propiedad Descripción
Código del modelo gemini-robotics-er-1.5-preview
Tipos de datos admitidos

Entradas

Texto, imágenes, video y audio

Resultado

Texto

Límites de tokens[*]

Límite de tokens de entrada

1,048,576

Límite de tokens de salida

65,536

Funciones

Generación de audio

No compatible

API de Batch

No compatible

Almacenamiento en caché

No compatible

Ejecución de código

Admitido

Llamada a función

Admitido

Fundamentación con Google Maps

No compatible

Generación de imágenes

No compatible

API de Live

No compatible

Fundamentación de la búsqueda

Admitido

Resultados estructurados

Admitido

Pensamiento

Admitido

Contexto de la URL

Admitido

Versiones
Lee los patrones de versiones de modelos para obtener más detalles.
  • Vista previa: gemini-robotics-er-1.5-preview
Última actualización Septiembre de 2025
Fecha límite de conocimiento Enero de 2025