Prova il nuovo modello di anteprima TTS Gemini 3.1 Flash per la generazione di discorsi espressivi e multilingue.

Gemini Robotics-ER 1.5

Gemini Robotics-ER 1.5 è un modello di linguaggio visivo (VLM) che porta le capacità agentiche di Gemini nella robotica. È progettato per il ragionamento avanzato nel mondo fisico, consentendo ai robot di interpretare dati visivi complessi, eseguire ragionamenti spaziali e pianificare azioni da comandi in linguaggio naturale.

Prova in Google AI Studio

Documentazione

Visita la pagina Robotica per una copertura completa di funzionalità e capacità.

gemini-robotics-er-1.5-preview

Proprietà	Descrizione
Codice modello	`gemini-robotics-er-1.5-preview`
Tipi di dati supportati	Input Testo, immagini, video, audio Output Testo
Limiti di token^[*]	Limite di token di input 1.048.576 Limite di token di output 65.536
Funzionalità	Generazione audio Non supportato API batch Non supportato Memorizzazione nella cache Non supportato Esecuzione del codice Supportato Chiamata di funzione Supportato Grounding con Google Maps Non supportato Generazione di immagini Non supportato API live Non supportato Fondatezza della Ricerca Supportato Output strutturati Supportato Ragionamento Supportato Contesto URL Supportato
Versioni	Per ulteriori dettagli, leggi i pattern delle versioni del modello. Anteprima: `gemini-robotics-er-1.5-preview`
Ultimo aggiornamento	Settembre 2025
knowledge cutoff	Gennaio 2025