Gemini Robotics-ER 1.6

Gemini Robotics-ER 1.6 è un modello di visione-linguaggio (VLM) che porta le capacità agentiche di Gemini nella robotica. È progettato per il ragionamento avanzato nel mondo fisico, consentendo ai robot di interpretare dati visivi complessi, eseguire ragionamenti spaziali e pianificare azioni a partire da comandi in linguaggio naturale.

Documentazione

Visita la pagina Robotica per una copertura completa di funzionalità e capacità.

gemini-robotics-er-1.6-preview

Proprietà Descrizione
Codice modello gemini-robotics-er-1.6-preview
Tipi di dati supportati

Input

Testo, immagini, video, audio

Output

Testo

Limiti dei token[*]

Limite di token di input

1.048.576

Limite di token di output

65.536

Funzionalità

Generazione di audio

Non supportato

API batch

Supportato

Memorizzazione nella cache

Supportato

Esecuzione di codice

Supportato

Utilizzo del computer

Supportato

Ricerca file

Supportato

Inferenza flessibile

Supportato

Chiamata di funzione

Supportato

Grounding con Google Maps

Supportato

Generazione di immagini

Non supportato

API Live

Non supportato

Inferenza della priorità

Supportato

Fondatezza della Ricerca

Supportato

Output strutturati

Supportato

Ragionamento

Supportato

Contesto URL

Supportato

Versioni
Per ulteriori dettagli, leggi i pattern delle versioni del modello.
  • Anteprima: gemini-robotics-er-1.6-preview
Ultimo aggiornamento Dicembre 2025
Knowledge cutoff Gennaio 2025