30 באוקטובר 2024
Bringing AI Agents to production with Gemini API

פיתוח ופריסה של סוכני AI הם תחום חדש ומלהיב, אבל ניהול המערכות המורכבות האלה בסביבת ייצור דורש יכולת ניראות (observability) חזקה. AgentOps הוא Python SDK למעקב אחרי סוכנים, למעקב אחרי עלויות של LLM, להשוואה בין ביצועים ועוד. הוא מאפשר למפתחים להעביר את הסוכנים שלהם משלב האב-טיפוס לשלב הייצור, במיוחד בשילוב עם היכולות והיעילות של Gemini API.

היתרון של Gemini
אדם סילברמן (Adam Silverman), סמנכ"ל התפעול של Agency AI, הצוות שפיתח את AgentOps, מסביר שהעלות היא גורם קריטי לארגונים שמטמיעים סוכני AI בהיקף נרחב. "ראינו ארגונים שמוציאים 80,000 $בחודש על קריאות ל-LLM. עם Gemini 1.5, הפלט הזה היה עולה כמה אלפי דולרים".
השילוב של העלות הנמוכה עם היכולות המתקדמות של Gemini בהבנת שפה וביצירת תוכן הופך אותו לבחירה אידיאלית למפתחים שיוצרים סוכני AI מתוחכמים. "Gemini 1.5 Flash מספק לנו איכות דומה למודלים גדולים יותר, בעלות נמוכה בהרבה ובמהירות גבוהה מאוד", אומר סילברמן. כך מפתחים יכולים להתמקד ביצירת תהליכי עבודה מורכבים של סוכנים עם כמה שלבים, בלי לדאוג לעלויות גבוהות מדי.
"ראינו הפעלות של סוכנים בודדים אצל ספקי מודלים אחרים של LLM שעולות יותר מ-500 $להפעלה. אותן הרצות עם Gemini (1.5 Flash-8B) עולות פחות מ-50$'.

הפעלת סוכני AI
AgentOps מתעד נתונים על כל אינטראקציה עם סוכן, לא רק על קריאות ל-LLM, ומספק תצוגה מקיפה של אופן הפעולה של מערכות מרובות סוכנים. רמת הפירוט הזו חיונית לצוותי ההנדסה והתאימות, ומספקת תובנות חשובות לניפוי באגים, לאופטימיזציה ולנתיבי ביקורת.
שילוב המודלים של Gemini עם AgentOps הוא פשוט מאוד, ולרוב לוקח רק כמה דקות באמצעות LiteLLM. מפתחים יכולים לקבל במהירות תובנות לגבי הקריאות ל-Gemini API, לעקוב אחרי העלויות בזמן אמת ולוודא שהסוכנים שלהם אמינים בסביבת הייצור.
במבט קדימה
צוות AgentOps מחויב לתמוך במפתחי נציגים כשהם מרחיבים את הפרויקטים שלהם. ה-AI של הסוכנות עוזר לארגונים להתמודד עם המורכבות של בניית סוכנים במחיר סביר שניתנים להרחבה, ובכך מחזק את הצעת הערך של שילוב AgentOps עם Gemini API. כפי שמדגיש סילברמן, "היא מאפשרת ליותר מפתחים שרגישים למחיר ליצור סוכנים".
למפתחים ששוקלים להשתמש ב-Gemini, העצה של סילברמן ברורה: "כדאי לנסות, ותתרשמו".