عاملها سیستمهایی هستند که از مدلهای Gemini، مجموعهای از ابزارها و قابلیتهای استدلال برای انجام وظایف پیچیده و چند مرحلهای و دستیابی به اهداف خاص بهره میبرند. برخلاف یک فراخوانی مدل واحد، یک عامل میتواند برنامهریزی کند، مجموعهای از اقدامات را اجرا کند، با سیستمهای خارجی تعامل داشته باشد و اطلاعات را برای انجام درخواست کاربر ترکیب کند.
با استفاده از API Gemini، میتوانید با استفاده از ویژگیهایی مانند موارد زیر، عاملهای قدرتمندی بسازید:
- مدلهای جمینی : هوش هستهای، که استدلال و درک زبان را فراهم میکند.
- ابزارها : قابلیتهایی که مدل را به اطلاعات و اقدامات دنیای واقعی متصل میکنند. این ابزارها میتوانند ابزارهای داخلی (مانند جستجوی گوگل، نقشهها، اجرای کد) یا ابزارهای سفارشی باشند.
- فراخوانی تابع : مکانیزمی برای تعریف و اتصال ابزارها و APIهای سفارشی خودتان به مدل Gemini.
- تفکر : ویژگیهایی که توانایی مدل را برای استدلال و برنامهریزی برای وظایف پیچیده افزایش میدهد.
- زمینه طولانی : فعال کردن عاملها برای حفظ وضعیت و اطلاعات در تعاملات طولانی.
نمایندگان موجود
- عامل تحقیقات عمیق : یک عامل مستقل که وظایف تحقیقاتی چند مرحلهای را برای موارد استفاده مانند تحلیل بازار، بررسیهای لازم و بررسی متون، برنامهریزی، اجرا و ترکیب میکند.
عوامل ساختمانی
عاملها از مدلها و ابزارها برای انجام وظایف چند مرحلهای استفاده میکنند. در حالی که Gemini قابلیتهای استدلال ("مغز") و ابزارهای ضروری ("دستها") را فراهم میکند، شما اغلب به یک چارچوب ارکستراسیون برای مدیریت حافظه عامل، حلقههای برنامهریزی و انجام زنجیرهسازی ابزارهای پیچیده نیاز دارید.
برای به حداکثر رساندن قابلیت اطمینان در گردشهای کاری چند مرحلهای، باید دستورالعملهایی تهیه کنید که صریحاً نحوه استدلال و برنامهریزی مدل را کنترل کنند. در حالی که Gemini استدلال عمومی قوی ارائه میدهد، عاملهای پیچیده از دستورالعملهایی که رفتارهای خاصی مانند پشتکار در مواجهه با مسائل، ارزیابی ریسک و برنامهریزی پیشگیرانه را تقویت میکنند، بهره میبرند.
برای استراتژیهای طراحی این دستورالعملها، به گردشهای کاری Agentic مراجعه کنید. در اینجا مثالی از یک دستورالعمل سیستمی آورده شده است که عملکرد را در چندین معیار agentic حدود ۵٪ بهبود بخشیده است.
چارچوبهای عامل
Gemini با چارچوبهای عامل متنباز پیشرو مانند موارد زیر ادغام میشود:
- LangChain / LangGraph : ساخت جریانهای کاربردی پیچیده و دارای وضعیت و سیستمهای چندعامله با استفاده از ساختارهای گراف.
- LlamaIndex : برای گردش کارهای بهبود یافته با RAG، عوامل Gemini را به دادههای خصوصی خود متصل کنید.
- CrewAI : هماهنگسازی عوامل هوش مصنوعی مستقل مشارکتی و نقشآفرین.
- کیت توسعه نرمافزاری Vercel AI : ساخت رابطهای کاربری و عاملهای مبتنی بر هوش مصنوعی در جاوااسکریپت/تایپاسکریپت.
- Google ADK : یک چارچوب متنباز برای ساخت و هماهنگسازی عاملهای هوش مصنوعی سازگار.