שיתוף

30 באוקטובר 2024

הצגת סוכני AI בסביבת הייצור באמצעות Gemini API

וישאל דהרמהדיקארי (Vishal Dharmadhikari)

מהנדס פתרונות למוצרים

פייג' ביילי

מהנדס חוויית מפתחים ב-AI

אדם סילברמן

מנהל/ת תפעול ראשי/ת, Agency AI

תמונה ראשית (Hero) של AgentOps

פיתוח ופריסה של סוכני AI הם תחום מרגש, אבל כדי לנהל את המערכות המורכבות האלה בסביבת ייצור נדרשת ניראות (observability) חזקה. AgentOps הוא ערכת SDK ל-Python למעקב אחר סוכנים, למעקב אחר עלויות של LLM, לבדיקת ביצועים ועוד. הכלי הזה מאפשר למפתחים להעביר את הסוכנים שלהם מתכנון ראשוני לייצור, במיוחד בשילוב עם העוצמה והיעילות של Gemini API.

ממשק המשתמש של פלטפורמת AgentOps שבו מוצג Gemini בפעולה

היתרון של Gemini

אדם סילברמן (Adam Silverman), מנהל התפעול הראשי של Agency AI, הצוות שמאחורי AgentOps, מסביר שהעלות היא גורם קריטי לארגונים שמפרסים סוכני AI בקנה מידה נרחב. "ראינו ארגונים שמוציאים 80,000 $בחודש על קריאות LLM. ב-Gemini 1.5, עלות הפלט הזה הייתה עומדת על כמה אלפי דולרים".

היעילות הזו, בשילוב עם יכולות היצירה וההבנה החזקות של השפה של Gemini, הופכות אותו לאפשרות האידיאלית למפתחים שמפתחים סוכני AI מתוחכמים. "Gemini 1.5 Flash מספק לנו איכות דומה למודלים גדולים יותר, בחלק קטן מהעלות, והוא מהיר מאוד", אומר סילברמן. כך המפתחים יכולים להתמקד ביצירת תהליכי עבודה מורכבים של סוכני תמיכה עם כמה שלבים, בלי לדאוג לגבי עלויות גבוהות מדי.

"ראינו שהפעלה בודדת של סוכן אצל ספקי LLM אחרים עולה יותר מ-500 $להפעלה. אותה הפעלה עם Gemini (1.5 Flash-8B) עולה פחות מ-50$".

– אדם סילברמן (Adam Silverman), מנהל תפעול ראשי, Agency AI

הדמיה של לוח הבקרה של AgentOps עם ניתוח נתונים ונתונים סטטיסטיים

הפעלת סוכני AI

AgentOps מתעד נתונים לגבי כל אינטראקציה של סוכן, ולא רק קריאות ל-LLM, ומספק תצוגה מקיפה של אופן הפעולה של מערכות עם סוכנים מרובים. רמת הפירוט הזו חיונית לצוותים של מהנדסים ותאימות, ומספקת תובנות חיוניות לניפוי באגים, לאופטימיזציה ולנתיבי ביקורת.

שילוב של מודלים של Gemini עם AgentOps הוא פשוט להפליא, ובדרך כלל נמשך רק כמה דקות באמצעות LiteLLM. המפתחים יכולים לקבל במהירות תובנות לגבי הקריאות שלהם ל-Gemini API, לעקוב אחרי העלויות בזמן אמת ולהבטיח את האמינות של הסוכנים שלהם בסביבת הייצור.

במבט קדימה

צוות AgentOps מחוייב לתמוך במפתחי נציגים בזמן שהם מרחיבים את הפרויקטים שלהם. בעזרת Agency AI, ארגונים יכולים להתמודד עם המורכבות של פיתוח סוכני תמיכה נוחים ומותאמים לעומס, וכך לחזק את היתרונות של השילוב בין AgentOps ל-Gemini API. כפי שסיימון מדגיש, "הדבר מעודד מפתחים שמתחשבים במחירים ליצור סוכנים".

למפתחים ששוקלים להשתמש ב-Gemini, העצה של Silverman ברורה: "תנסו, ותתרשמו".