L'API Interactions è ora disponibile a livello generale. Ti consigliamo di utilizzare questa API per accedere a tutti i modelli e a tutte le funzionalità più recenti.

Google utilizza la tecnologia AI per tradurre i contenuti nella tua lingua preferita. Le traduzioni generate dall'AI potrebbero contenere errori.

Gemini Robotics-ER 1.6

Gemini Robotics-ER 1.6 è un modello di visione-linguaggio (VLM) che porta le capacità agentiche di Gemini nella robotica. È progettato per il ragionamento avanzato nel mondo fisico, consentendo ai robot di interpretare dati visivi complessi, eseguire ragionamenti spaziali e pianificare azioni da comandi in linguaggio naturale.

Provalo in Google AI Studio

Documentazione

Visita la pagina Robotica per una copertura completa di funzionalità e capacità.

gemini-robotics-er-1.6-preview

Proprietà	Descrizione
Codice modello	`gemini-robotics-er-1.6-preview`
Tipi di dati supportati	Input Testo, immagini, video, audio Output Testo
Limiti di token^[*]	Limite di token di input 131.072 Limite di token di output 65.536
Funzionalità	Generazione di audio Non supportato Memorizzazione nella cache Supportato Esecuzione di codice Supportato Utilizzo del computer Supportato Ricerca di file Supportato Chiamata di funzione Supportato Grounding con Google Maps Supportato Generazione di immagini Non supportato API Live Non supportato Fondatezza della Ricerca Supportato Output strutturati Supportato In pensiero Supportato Contesto URL Supportato
Opzioni di consumo	API batch Supportato Inferenza flessibile Supportato Inferenza prioritaria Supportato
Versioni	Per maggiori dettagli, leggi i pattern delle versioni del modello. Anteprima: `gemini-robotics-er-1.6-preview`
Ultimo aggiornamento	Dicembre 2025
knowledge cutoff	Gennaio 2025