نمای کلی نمایندگان

عامل‌ها سیستم‌هایی هستند که از مدل‌های Gemini، مجموعه‌ای از ابزارها و قابلیت‌های استدلال برای انجام وظایف پیچیده و چند مرحله‌ای و دستیابی به اهداف خاص بهره می‌برند. برخلاف یک فراخوانی مدل واحد، یک عامل می‌تواند برنامه‌ریزی کند، مجموعه‌ای از اقدامات را اجرا کند، با سیستم‌های خارجی تعامل داشته باشد و اطلاعات را برای انجام درخواست کاربر ترکیب کند.

با استفاده از API Gemini، می‌توانید با استفاده از ویژگی‌هایی مانند موارد زیر، عامل‌های قدرتمندی بسازید:

  • مدل‌های جمینی : هوش هسته‌ای، که استدلال و درک زبان را فراهم می‌کند.
  • ابزارها : قابلیت‌هایی که مدل را به اطلاعات و اقدامات دنیای واقعی متصل می‌کنند. این ابزارها می‌توانند ابزارهای داخلی (مانند جستجوی گوگل، نقشه‌ها، اجرای کد) یا ابزارهای سفارشی باشند.
  • فراخوانی تابع : مکانیزمی برای تعریف و اتصال ابزارها و APIهای سفارشی خودتان به مدل Gemini.
  • تفکر : ویژگی‌هایی که توانایی مدل را برای استدلال و برنامه‌ریزی برای وظایف پیچیده افزایش می‌دهد.
  • زمینه طولانی : فعال کردن عامل‌ها برای حفظ وضعیت و اطلاعات در تعاملات طولانی.

نمایندگان موجود

  • عامل تحقیقات عمیق : یک عامل مستقل که وظایف تحقیقاتی چند مرحله‌ای را برای موارد استفاده مانند تحلیل بازار، بررسی‌های لازم و بررسی متون، برنامه‌ریزی، اجرا و ترکیب می‌کند.

عوامل ساختمانی

عامل‌ها از مدل‌ها و ابزارها برای انجام وظایف چند مرحله‌ای استفاده می‌کنند. در حالی که Gemini قابلیت‌های استدلال ("مغز") و ابزارهای ضروری ("دست‌ها") را فراهم می‌کند، شما اغلب به یک چارچوب ارکستراسیون برای مدیریت حافظه عامل، حلقه‌های برنامه‌ریزی و انجام زنجیره‌سازی ابزارهای پیچیده نیاز دارید.

برای به حداکثر رساندن قابلیت اطمینان در گردش‌های کاری چند مرحله‌ای، باید دستورالعمل‌هایی تهیه کنید که صریحاً نحوه استدلال و برنامه‌ریزی مدل را کنترل کنند. در حالی که Gemini استدلال عمومی قوی ارائه می‌دهد، عامل‌های پیچیده از دستورالعمل‌هایی که رفتارهای خاصی مانند پشتکار در مواجهه با مسائل، ارزیابی ریسک و برنامه‌ریزی پیشگیرانه را تقویت می‌کنند، بهره می‌برند.

برای استراتژی‌های طراحی این دستورالعمل‌ها، به گردش‌های کاری Agentic مراجعه کنید. در اینجا مثالی از یک دستورالعمل سیستمی آورده شده است که عملکرد را در چندین معیار agentic حدود ۵٪ بهبود بخشیده است.

چارچوب‌های عامل

Gemini با چارچوب‌های عامل متن‌باز پیشرو مانند موارد زیر ادغام می‌شود:

  • LangChain / LangGraph : ساخت جریان‌های کاربردی پیچیده و دارای وضعیت و سیستم‌های چندعامله با استفاده از ساختارهای گراف.
  • LlamaIndex : برای گردش کارهای بهبود یافته با RAG، عوامل Gemini را به داده‌های خصوصی خود متصل کنید.
  • CrewAI : هماهنگ‌سازی عوامل هوش مصنوعی مستقل مشارکتی و نقش‌آفرین.
  • کیت توسعه نرم‌افزاری Vercel AI : ساخت رابط‌های کاربری و عامل‌های مبتنی بر هوش مصنوعی در جاوااسکریپت/تایپ‌اسکریپت.
  • Google ADK : یک چارچوب متن‌باز برای ساخت و هماهنگ‌سازی عامل‌های هوش مصنوعی سازگار.