סוכנים הם מערכות שמסתמכות על מודלים של Gemini, על קבוצה של כלים ועל יכולות חשיבה רציונלית כדי לבצע משימות מורכבות שכוללות כמה שלבים, ולהשיג יעדים ספציפיים. בניגוד לקריאה למודל יחיד, סוכן יכול לתכנן ולבצע סדרה של פעולות, ליצור אינטראקציה עם מערכות חיצוניות ולסנתז מידע כדי למלא בקשה של משתמש.
עם Gemini API, אתם יכולים לבנות סוכנים חזקים באמצעות תכונות כמו:
- מודלים של Gemini: ליבת האינטליגנציה, שמספקת יכולות של הסקת מסקנות והבנת שפה.
- כלים: יכולות שמקשרות את המודל למידע ולפעולות בעולם האמיתי. אלה יכולים להיות כלים מובנים (כמו חיפוש Google, מפות Google, הפעלת קוד) או כלים בהתאמה אישית.
- בקשות להפעלת פונקציות: המנגנון להגדרת כלים וממשקי API מותאמים אישית וקישור שלהם למודל Gemini.
- מעמיק: תכונות שמשפרות את היכולת של המודל לחשוב בצורה רציונלית ולתכנן משימות מורכבות.
- הקשר ארוך: מאפשר לסוכנים לשמור על מצב ומידע לאורך אינטראקציות ממושכות.
נציגי תמיכה זמינים
- Deep Research Agent: סוכן אוטונומי שתכנן, מבצע ומסכם משימות מחקר רב-שלביות לתרחישי שימוש כמו ניתוח שוק, בדיקת נאותות וסקירות ספרות.
יצירת סוכנים
סוכנים משתמשים במודלים ובכלים כדי להשלים משימות רב-שלביות. Gemini מספק את יכולות ההסקה (ה'מוח') ואת הכלים החיוניים (ה'ידיים'), אבל לעיתים קרובות צריך מסגרת תזמור כדי לנהל את הזיכרון של הסוכן, לתכנן לולאות ולבצע שרשור מורכב של כלים.
כדי למקסם את המהימנות בתהליכי עבודה מרובי-שלבים, כדאי ליצור הוראות ששולטות באופן מפורש בדרך שבה המודל מסיק מסקנות ומתכנן. למרות ש-Gemini מספק חשיבה רציונלית כללית חזקה, סוכנים מורכבים נהנים מהנחיות שמכתיבות התנהגויות ספציפיות כמו התמדה כשנתקלים בבעיות, הערכת סיכונים ותכנון פרואקטיבי.
במאמר תהליכי עבודה מבוססי-סוכן מוסבר איך לנסח את ההנחיות האלה. הנה דוגמה להוראה למערכת ששיפרה את הביצועים בכמה מדדים של סוכנים בכ-5%.
מסגרות של סוכנים
Gemini משולב עם מסגרות סוכנים מובילות בקוד פתוח, כמו:
- LangChain / LangGraph: בניית זרימות מורכבות של אפליקציות עם שמירת מצב ומערכות מרובות סוכנים באמצעות מבני גרפים.
- LlamaIndex: חיבור סוכני Gemini לנתונים פרטיים כדי לשפר את תהליכי העבודה באמצעות RAG.
- CrewAI: ארגון של סוכני AI אוטונומיים שמשתפים פעולה ומגלמים תפקידים.
- Vercel AI SDK: פיתוח ממשקי משתמש וסוכנים מבוססי-AI ב-JavaScript/TypeScript.
- Google ADK: מסגרת קוד פתוח ליצירה ולתיאום של סוכני AI שניתן להפעיל אותם יחד.