Gemini Robotics-ER 1.5

Gemini Robotics-ER 1.5, विज़न-लैंग्वेज मॉडल (वीएलएम) है. यह Gemini की एजेंटिक क्षमताओं को रोबोटिक्स में इस्तेमाल करने की सुविधा देता है. इसे असल दुनिया में बेहतर तरीके से सोचने-समझने के लिए डिज़ाइन किया गया है. इससे रोबोट, मुश्किल विज़ुअल डेटा को समझ पाते हैं, जगह के हिसाब से सोच-विचार कर पाते हैं, और नैचुरल लैंग्वेज में दिए गए निर्देशों के हिसाब से काम कर पाते हैं.

दस्तावेज़

सुविधाओं और क्षमताओं के बारे में पूरी जानकारी पाने के लिए, रोबोटिक्स पेज पर जाएं.

gemini-robotics-er-1.5-preview

प्रॉपर्टी ब्यौरा
मॉडल कोड gemini-robotics-er-1.5-preview
इस्तेमाल किए जा सकने वाले डेटा टाइप

इनपुट

टेक्स्ट, इमेज, वीडियो, ऑडियो

आउटपुट

टेक्स्ट

टोकन की सीमाएं[*]

इनपुट टोकन की सीमा

1,048,576

आउटपुट टोकन की सीमा

65,536

मिलने वाली अनुमतियां

ऑडियो जनरेट करने की सुविधा

काम नहीं करता है

Batch API

काम नहीं करता है

कैश मेमोरी में सेव होना

काम नहीं करता है

कोड को चलाने की सुविधा

काम करता है

फ़ंक्शन कॉलिंग

काम करता है

Google Maps की मदद से जवाब पाना

काम नहीं करता है

इमेज जनरेट करना

काम नहीं करता है

Live API

काम नहीं करता है

भरोसेमंद स्रोतों से जानकारी लेना

काम करता है

स्ट्रक्चर्ड आउटपुट

काम करता है

सोचना

काम करता है

यूआरएल का कॉन्टेक्स्ट

काम करता है

वर्शन
ज़्यादा जानकारी के लिए, मॉडल वर्शन के पैटर्न पढ़ें.
  • झलक देखें: gemini-robotics-er-1.5-preview
नया अपडेट सितंबर 2025
जानकारी न मिलना जनवरी 2025