Gemini Robotics-ER 1.5 è un modello di visione e linguaggio (VLM) che porta le funzionalità agenti di Gemini nella robotica. È progettato per il ragionamento avanzato nel mondo fisico, consentendo ai robot di interpretare dati visivi complessi, eseguire ragionamenti spaziali e pianificare azioni a partire da comandi in linguaggio naturale.
Documentazione
Visita la pagina Robotica per una copertura completa di funzionalità e capacità.
gemini-robotics-er-1.5-preview
| Proprietà | Descrizione |
|---|---|
| Codice modello | gemini-robotics-er-1.5-preview |
| Tipi di dati supportati |
Input Testo, immagini, video, audio Output Testo |
| Limiti dei token[*] |
Limite di token di input 1.048.576 Limite di token di output 65.536 |
| Funzionalità |
Generazione di audio Non supportato API batch Non supportato Memorizzazione nella cache Non supportato Esecuzione del codice Supportato Chiamata di funzione Supportato Grounding con Google Maps Non supportato Generazione di immagini Non supportato API Live Non supportato Fondatezza della Ricerca Supportato Output strutturati Supportato Pensando Supportato Contesto URL Supportato |
| Versioni |
|
| Ultimo aggiornamento | Settembre 2025 |
| Knowledge cutoff | Gennaio 2025 |