La API de Interactions ya está disponible de forma general. Te recomendamos que uses esta API para acceder a todos los modelos y funciones más recientes.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini Robotics-ER 1.6

Gemini Robotics-ER 1.6 es un modelo de lenguaje de visión (VLM) que aporta las capacidades de agente de Gemini a la robótica. Está diseñado para el razonamiento avanzado en el mundo físico, lo que permite a los robots interpretar datos visuales complejos, realizar razonamiento espacial y planificar acciones a partir de comandos en lenguaje natural.

Probar en Google AI Studio

Documentación

Visita la página de Robótica para obtener una cobertura completa de las funciones y capacidades.

gemini-robotics-er-1.6-preview

Propiedad	Descripción
Código del modelo	`gemini-robotics-er-1.6-preview`
Tipos de datos admitidos	Entradas Texto, imágenes, video y audio Resultado Texto
Límites de tokens^[*]	Límite de tokens de entrada 131,072 Límite de tokens de salida 65,536
Funciones	Generación de audio No compatible Almacenamiento en caché Admitido Ejecución de código Admitido Uso de la computadora Admitido Búsqueda de archivos Admitido Llamada a función Admitido Fundamentación con Google Maps Admitido Generación de imágenes No compatible API de Live No compatible Fundamentación con la Búsqueda Admitido Resultados estructurados Admitido Pensamiento Admitido Contexto de la URL Admitido
Opciones de consumo	API de Batch Admitido Inferencia flexible Admitido Inferencia de prioridad Admitido
Versiones	Lee los patrones de versiones del modelo para obtener más detalles. Vista previa: `gemini-robotics-er-1.6-preview`
Última actualización	Diciembre de 2025
Fecha límite de conocimiento	Enero de 2025