Gemini Deep Research ya está disponible en versión preliminar con planificación colaborativa, visualización, compatibilidad con MCP y mucho más.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini Robotics-ER 1.5

Gemini Robotics-ER 1.5 es un modelo de lenguaje de visión (VLM) que lleva las capacidades de agente de Gemini a la robótica. Está diseñado para el razonamiento avanzado en el mundo físico, lo que permite que los robots interpreten datos visuales complejos, realicen razonamientos espaciales y planifiquen acciones a partir de comandos en lenguaje natural.

Probar en Google AI Studio

Documentación

Visita la página de robótica para obtener una cobertura completa de las funciones y capacidades.

gemini-robotics-er-1.5-preview

Propiedad	Descripción
Código del modelo	`gemini-robotics-er-1.5-preview`
Tipos de datos admitidos	Entradas Texto, imágenes, video y audio Resultado Texto
Límites de tokens^[*]	Límite de tokens de entrada 1,048,576 Límite de tokens de salida 65,536
Capacidades	Generación de audio No admitido API de lotes No admitido Almacenamiento en caché No admitido Ejecución de código Admitido Llamada a función Admitido Fundamentación con Google Maps No admitido Generación de imágenes No admitido API en vivo No admitido Fundamentación con la Búsqueda Admitido Salidas estructuradas Admitido Razonamiento Admitido Contexto de URL Admitido
Versiones	Lee los patrones de versiones de modelos para obtener más detalles. Vista previa: `gemini-robotics-er-1.5-preview`
Última actualización	Septiembre de 2025
Fecha límite de conocimiento	Enero de 2025