Gemini Robotics-ER 1.6 è un modello di visione-linguaggio (VLM) che porta le capacità agentiche di Gemini nella robotica. È progettato per il ragionamento avanzato nel mondo fisico, consentendo ai robot di interpretare dati visivi complessi, eseguire ragionamenti spaziali e pianificare azioni da comandi in linguaggio naturale.
Documentazione
Visita la pagina Robotica per una copertura completa di funzionalità e capacità.
gemini-robotics-er-1.6-preview
| Proprietà | Descrizione |
|---|---|
| Codice modello | gemini-robotics-er-1.6-preview |
| Tipi di dati supportati |
Input Testo, immagini, video, audio Output Testo |
| Limiti di token[*] |
Limite di token di input 1.048.576 Limite di token di output 65.536 |
| Funzionalità |
Generazione audio Non supportato API batch Supportato Memorizzazione nella cache Supportato Esecuzione del codice Supportato Utilizzo del computer Supportato Ricerca di file Supportato Inferenza flessibile Supportato Chiamata di funzione Supportato Grounding con Google Maps Supportato Generazione di immagini Non supportato API live Non supportato Inferenza prioritaria Supportato Fondatezza della Ricerca Supportato Output strutturati Supportato Ragionamento Supportato Contesto URL Supportato |
| Versioni |
|
| Ultimo aggiornamento | Dicembre 2025 |
| Data di interruzione della conoscenza | Gennaio 2025 |