Gemini Robotics-ER 1.5 adalah model bahasa-penglihatan (VLM) yang menghadirkan kemampuan agentik Gemini ke robotik. Gemini 1.5 Pro dirancang untuk penalaran tingkat lanjut di dunia fisik, sehingga memungkinkan robot menafsirkan data visual yang kompleks, melakukan penalaran spasial, dan merencanakan tindakan dari perintah bahasa alami.
Dokumentasi
Buka halaman Robotika untuk mengetahui cakupan lengkap fitur dan kemampuan.
gemini-robotics-er-1.5-preview
| Properti | Deskripsi |
|---|---|
| Kode model | gemini-robotics-er-1.5-preview |
| Jenis data yang didukung |
Input Teks, gambar, video, audio Output Teks |
| Batas token[*] |
Batas token input 1.048.576 Batas token output 65.536 |
| Kemampuan |
Pembuatan audio Tidak didukung Batch API Tidak didukung Menyimpan ke cache Tidak didukung Eksekusi kode Didukung Panggilan fungsi Didukung Melakukan grounding dengan Google Maps Tidak didukung Pembuatan gambar Tidak didukung Live API Tidak didukung Grounding penelusuran Didukung Output terstruktur Didukung Berpikir Didukung Konteks URL Didukung |
| Versi |
|
| Pembaruan terbaru | September 2025 |
| Batas informasi | Januari 2025 |