Gemini Robotics-ER 1.5 është një model i gjuhës së vizionit (VLM) që sjell aftësitë agjentike të Gemini në robotikë. Është projektuar për arsyetim të avancuar në botën fizike, duke u lejuar robotëve të interpretojnë të dhëna komplekse vizuale, të kryejnë arsyetim hapësinor dhe të planifikojnë veprime nga komandat e gjuhës natyrore.
Dokumentacioni
Vizitoni faqen e Robotikës për një mbulim të plotë të veçorive dhe aftësive.
Gemini-robotics-er-1.5-pamje paraprake
| Pronë | Përshkrimi |
|---|---|
| Kodi i modelit të | gemini-robotics-er-1.5-preview |
| llojet e të dhënave të mbështetura | Të dhënat hyrëse Tekst, imazhe, video, audio Prodhimi Tekst |
| Limitet token-it [*] | Limiti i tokenit të hyrjes 1,048,576 Limiti i tokenit të daljes 65,536 |
| Aftësitë e | Gjenerimi i audios Nuk mbështetet API-ja e grupeve Nuk mbështetet Ruajtja në memorje Nuk mbështetet Ekzekutimi i kodit Mbështetur Thirrja e funksionit Mbështetur Tokëzimi me Google Maps Nuk mbështetet Gjenerimi i imazhit Nuk mbështetet API i drejtpërdrejtë Nuk mbështetet Kërkimi në tokë Mbështetur Rezultatet e strukturuara Mbështetur Të menduarit Mbështetur Konteksti i URL-së Mbështetur |
| Versione |
|
| Përditësimi më i fundit | Shtator 2025 |
| i njohurive | Janar 2025 |