Gemini Robotics-ER 1.5, विज़न-लैंग्वेज मॉडल (वीएलएम) है. यह Gemini की एजेंटिक क्षमताओं को रोबोटिक्स में इस्तेमाल करने की सुविधा देता है. इसे असल दुनिया में बेहतर तरीके से सोचने-समझने के लिए डिज़ाइन किया गया है. इससे रोबोट, मुश्किल विज़ुअल डेटा को समझ पाते हैं, जगह के हिसाब से सोच-विचार कर पाते हैं, और नैचुरल लैंग्वेज में दिए गए निर्देशों के हिसाब से काम कर पाते हैं.
दस्तावेज़
सुविधाओं और क्षमताओं के बारे में पूरी जानकारी पाने के लिए, रोबोटिक्स पेज पर जाएं.
gemini-robotics-er-1.5-preview
| प्रॉपर्टी | ब्यौरा |
|---|---|
| मॉडल कोड | gemini-robotics-er-1.5-preview |
| इस्तेमाल किए जा सकने वाले डेटा टाइप |
इनपुट टेक्स्ट, इमेज, वीडियो, ऑडियो आउटपुट टेक्स्ट |
| टोकन की सीमाएं[*] |
इनपुट टोकन की सीमा 1,048,576 आउटपुट टोकन की सीमा 65,536 |
| मिलने वाली अनुमतियां |
ऑडियो जनरेट करने की सुविधा काम नहीं करता है Batch API काम नहीं करता है कैश मेमोरी में सेव होना काम नहीं करता है कोड को चलाने की सुविधा काम करता है फ़ंक्शन कॉलिंग काम करता है Google Maps की मदद से जवाब पाना काम नहीं करता है इमेज जनरेट करना काम नहीं करता है Live API काम नहीं करता है भरोसेमंद स्रोतों से जानकारी लेना काम करता है स्ट्रक्चर्ड आउटपुट काम करता है सोचना काम करता है यूआरएल का कॉन्टेक्स्ट काम करता है |
| वर्शन |
|
| नया अपडेट | सितंबर 2025 |
| जानकारी न मिलना | जनवरी 2025 |