Gemini Robotics-ER 1.5 הוא מודל ראייה ושפה (VLM) שמביא את יכולות של AI אקטיבי של Gemini לרובוטיקה. הוא מיועד לחשיבה רציונלית משופרת בעולם הפיזי, ומאפשר לרובוטים לפרש נתונים חזותיים מורכבים, לבצע חשיבה רציונלית מרחבית ולתכנן פעולות מפקודות בשפה טבעית.
מאמרי עזרה
בדף בנושא רובוטיקה אפשר לקרוא על כל התכונות והיכולות.
gemini-robotics-er-1.5-preview
| נכס | תיאור |
|---|---|
| קוד הדגם | gemini-robotics-er-1.5-preview |
| סוגי נתונים נתמכים |
קלטים טקסט, תמונות, סרטונים, אודיו פלט טקסט |
| מגבלות על טוקנים[*] |
מגבלת טוקנים של קלט 1,048,576 מגבלת אסימונים בפלט 65,536 |
| יכולות |
יצירת אודיו לא נתמך Batch API לא נתמך שמירת נתונים במטמון לא נתמך ביצוע קוד נתמך בקשה להפעלת פונקציה נתמך עיגון בעזרת מפות Google לא נתמך יצירת תמונות לא נתמך Live API לא נתמך חיפוש עם עיגון בנתונים נתמך פלטים מובְנים נתמך תהליך החשיבה נתמך הקשר של כתובת ה-URL נתמך |
| גרסאות |
|
| העדכון האחרון | ספטמבר 2025 |
| תאריך סף הידע | ינואר 2025 |