Gemini Robotics-ER 1.5

Gemini Robotics-ER 1.5 è un modello di visione e linguaggio (VLM) che porta le funzionalità agenti di Gemini nella robotica. È progettato per il ragionamento avanzato nel mondo fisico, consentendo ai robot di interpretare dati visivi complessi, eseguire ragionamenti spaziali e pianificare azioni a partire da comandi in linguaggio naturale.

Documentazione

Visita la pagina Robotica per una copertura completa di funzionalità e capacità.

gemini-robotics-er-1.5-preview

Proprietà Descrizione
Codice modello gemini-robotics-er-1.5-preview
Tipi di dati supportati

Input

Testo, immagini, video, audio

Output

Testo

Limiti dei token[*]

Limite di token di input

1.048.576

Limite di token di output

65.536

Funzionalità

Generazione di audio

Non supportato

API batch

Non supportato

Memorizzazione nella cache

Non supportato

Esecuzione del codice

Supportato

Chiamata di funzione

Supportato

Grounding con Google Maps

Non supportato

Generazione di immagini

Non supportato

API Live

Non supportato

Fondatezza della Ricerca

Supportato

Output strutturati

Supportato

Pensando

Supportato

Contesto URL

Supportato

Versioni
Per ulteriori dettagli, leggi i pattern delle versioni del modello.
  • Anteprima: gemini-robotics-er-1.5-preview
Ultimo aggiornamento Settembre 2025
Knowledge cutoff Gennaio 2025