টুলস এবং এজেন্ট জেমিনি মডেলগুলোর সক্ষমতা বৃদ্ধি করে, যার ফলে তারা বাস্তব জগতে পদক্ষেপ নিতে, রিয়েল-টাইম তথ্য অ্যাক্সেস করতে এবং জটিল গণনামূলক কাজ সম্পাদন করতে পারে। মডেলগুলো সাধারণ অনুরোধ-প্রতিক্রিয়া মিথস্ক্রিয়া এবং লাইভ এপিআই (Live API ) ব্যবহার করে রিয়েল-টাইম স্ট্রিমিং সেশন—উভয় ক্ষেত্রেই টুলস ব্যবহার করতে পারে।
- টুল হলো নির্দিষ্ট কিছু সক্ষমতা (যেমন গুগল সার্চ বা কোড এক্সিকিউশন) যা একটি মডেল কোয়েরির উত্তর দেওয়ার জন্য ব্যবহার করতে পারে।
- এজেন্ট হলো এমন সিস্টেম যা ব্যবহারকারীর লক্ষ্য অর্জনের জন্য বহু-ধাপের কাজ পরিকল্পনা, সম্পাদন এবং সংশ্লেষণ করতে পারে।
জেমিনি এপিআই জেমিনি মডেলের জন্য অপ্টিমাইজ করা সম্পূর্ণভাবে পরিচালিত, বিল্ট-ইন টুল এবং এজেন্টের একটি স্যুট প্রদান করে। আপনি ফাংশন কলিং ব্যবহার করে কাস্টম টুলও সংজ্ঞায়িত করতে পারেন।
উপলব্ধ অন্তর্নির্মিত সরঞ্জাম
| সরঞ্জাম | বর্ণনা | ব্যবহারের ক্ষেত্র |
|---|---|---|
| গুগল অনুসন্ধান | বিভ্রম কমাতে সাম্প্রতিক ঘটনা এবং ওয়েব থেকে প্রাপ্ত তথ্যের উপর ভিত্তি করে প্রতিক্রিয়া জানান। | সাম্প্রতিক ঘটনা সম্পর্কে প্রশ্নের উত্তর দেওয়া বিভিন্ন উৎস থেকে তথ্য যাচাই করা |
| গুগল ম্যাপস | অবস্থান-সচেতন এমন সহকারী তৈরি করুন যা জায়গা খুঁজে বের করতে, দিকনির্দেশনা পেতে এবং স্থানীয় প্রেক্ষাপট সম্পর্কে বিস্তারিত তথ্য প্রদান করতে পারে। | একাধিক বিরতি সহ ভ্রমণসূচী পরিকল্পনা করা ব্যবহারকারীর মানদণ্ডের ভিত্তিতে স্থানীয় ব্যবসা খুঁজে বের করা |
| কোড এক্সিকিউশন | মডেলটিকে গাণিতিক সমস্যা সমাধান করতে বা নির্ভুলভাবে ডেটা প্রক্রিয়াকরণ করতে পাইথন কোড লিখতে ও চালাতে অনুমতি দিন। | জটিল গাণিতিক সমীকরণ সমাধান করা পাঠ্য ডেটা নির্ভুলভাবে প্রক্রিয়াকরণ এবং বিশ্লেষণ করা |
| ইউআরএল প্রসঙ্গ | মডেলটিকে নির্দিষ্ট ওয়েব পেজ বা ডকুমেন্ট থেকে বিষয়বস্তু পড়তে ও বিশ্লেষণ করতে নির্দেশ দিন। | নির্দিষ্ট ইউআরএল বা ডকুমেন্টের উপর ভিত্তি করে প্রশ্নের উত্তর দেওয়া বিভিন্ন ওয়েব পৃষ্ঠা থেকে তথ্য পুনরুদ্ধার করা |
| কম্পিউটার ব্যবহার (পূর্বরূপ) | স্ক্রিন দেখতে এবং ওয়েব ব্রাউজার UI-এর সাথে ইন্টারঅ্যাক্ট করার জন্য অ্যাকশন তৈরি করতে জেমিনিকে সক্ষম করুন (ক্লায়েন্ট-সাইড এক্সিকিউশন)। | পুনরাবৃত্তিমূলক ওয়েব-ভিত্তিক ওয়ার্কফ্লো স্বয়ংক্রিয় করা ওয়েব অ্যাপ্লিকেশন ইউজার ইন্টারফেস পরীক্ষা করা |
| ফাইল অনুসন্ধান | রিট্রিভাল অগমেন্টেড জেনারেশন (RAG) সক্ষম করতে আপনার নিজের নথিগুলি সূচীবদ্ধ ও অনুসন্ধান করুন। | প্রযুক্তিগত ম্যানুয়াল অনুসন্ধান করা মালিকানাধীন ডেটা নিয়ে প্রশ্নের উত্তর দেওয়া |
নির্দিষ্ট টুলগুলোর সাথে সম্পর্কিত খরচের বিস্তারিত জানতে মূল্য নির্ধারণ পৃষ্ঠাটি দেখুন।
উপলব্ধ এজেন্ট
| এজেন্ট | বর্ণনা | ব্যবহারের ক্ষেত্র |
|---|---|---|
| গভীর গবেষণা | স্বায়ত্তশাসিতভাবে বহু-ধাপের গবেষণা কার্যক্রমের পরিকল্পনা, সম্পাদন এবং সংশ্লেষণ করে। | বাজার বিশ্লেষণ যথাযথ সতর্কতা অবলম্বন সাহিত্য পর্যালোচনা |
টুলস এক্সিকিউশন কীভাবে কাজ করে
টুলগুলো মডেলকে কথোপকথন চলাকালীন বিভিন্ন কাজের অনুরোধ করার সুযোগ দেয়। টুলটি বিল্ট-ইন (গুগল দ্বারা পরিচালিত) নাকি কাস্টম (আপনার দ্বারা পরিচালিত), তার উপর নির্ভর করে কার্যপ্রক্রিয়াটি ভিন্ন হয়।
অন্তর্নির্মিত টুল প্রবাহ
বিল্ট-ইন টুলগুলোর (গুগল সার্চ, গুগল ম্যাপস, ইউআরএল কনটেক্সট, ফাইল সার্চ, কোড এক্সিকিউশন) ক্ষেত্রে, সম্পূর্ণ প্রক্রিয়াটি একটিমাত্র এপিআই কলের মাধ্যমেই সম্পন্ন হয়:
- আপনি একটি অনুরোধ পাঠান: "GOOG-এর সর্বশেষ শেয়ার মূল্যের বর্গমূল কত?"
- জেমিনি সিদ্ধান্ত নেয় যে তার কিছু টুলের প্রয়োজন এবং সেগুলো গুগলের সার্ভারে চালায় (যেমন, শেয়ারের দাম খোঁজে, তারপর তার বর্গমূল বের করার জন্য পাইথন কোড চালায়)।
- জেমিনি টুলের ফলাফলের উপর ভিত্তি করে চূড়ান্ত উত্তরটি ফেরত পাঠায়।
কাস্টম টুল ফ্লো (ফাংশন কলিং)
কাস্টম টুল এবং কম্পিউটার ব্যবহারের ক্ষেত্রে, আপনার অ্যাপ্লিকেশনটিই কার্য সম্পাদন করে:
- আপনি ফাংশন (টুল) ঘোষণার সাথে একটি প্রম্পট পাঠান।
- জেমিনি একটি নির্দিষ্ট ফাংশন কল করার জন্য স্ট্রাকচার্ড JSON ফেরত পাঠাতে পারে (উদাহরণস্বরূপ,
{"name": "get_order_status", "args": {"order_id": "123"}}), যেখানে সর্বদা একটি অনন্যidথাকবে। - আপনি আপনার অ্যাপ্লিকেশন বা পরিবেশে ফাংশনটি কার্যকর করেন।
- আপনি ফাংশন কলের
idব্যবহার করে ফাংশনের ফলাফলগুলো জেমিনিতে ফেরত পাঠান। - জেমিনি ফলাফলগুলো ব্যবহার করে একটি চূড়ান্ত প্রতিক্রিয়া বা অন্য কোনো টুল কল তৈরি করে।
ফাংশন কলিং গাইডে আরও জানুন।
অন্তর্নির্মিত এবং কাস্টম টুলের প্রবাহ একত্রিত করা
যেসব অনুরোধের ক্ষেত্রে বিল্ট-ইন টুল এবং কাস্টম টুল (ফাংশন কল) একত্রিত থাকে, সেগুলোর সম্পাদন সমন্বয় করার জন্য মডেলটি টুল কনটেক্সট সার্কুলেশন ব্যবহার করে:
- আপনি একটি প্রম্পট পাঠিয়ে আপনার পছন্দের বিল্ট-ইন টুল এবং কাস্টম ফাংশনগুলো ঘোষণা করেন এবং কম্বিনেশন সাপোর্ট চালু করার জন্য একটি ফ্ল্যাগ সেট করেন।
- যদি কোনো ক্লায়েন্ট-সাইড ফাংশন কল তৈরি হয়, তবে জেমিনি বিল্ট-ইন টুলগুলো কার্যকর করে এবং ব্যবহারকারীকে সিদ্ধান্ত নেওয়ার সুযোগ দেয় (কোনটি প্রথমে কার্যকর হবে তা প্রম্পট এবং মডেলের সিদ্ধান্তের উপর নির্ভর করে)। এটি নিম্নলিখিত তথ্যসহ একটি প্রতিক্রিয়া ফেরত পাঠায়:
- টুল কলের নিশ্চিতকরণ
- টুলের প্রতিক্রিয়ার ফলাফল (মডেলটি দুটি সমান্তরাল ফাংশন কল তৈরি করলে এটি JSON-এর পরে আসতে পারে)
- আপনার ফাংশন কল করার জন্য স্ট্রাকচার্ড JSON
- প্রসঙ্গ সংরক্ষণের জন্য এনক্রিপ্ট করা চিন্তার স্বাক্ষর
- আপনি আপনার অ্যাপ্লিকেশন বা পরিবেশে ফাংশনটি কার্যকর করেন।
- আপনি জেমিনির প্রতিক্রিয়ার সমস্ত অংশ, সেইসাথে আপনার ফাংশন কলের ফলাফলও ফেরত দেন।
- জেমিনি সমস্ত সম্মিলিত প্রেক্ষাপট ব্যবহার করে চূড়ান্ত প্রতিক্রিয়া তৈরি করে।
বিল্ট-ইন ও কাস্টম টুলের সমন্বয়ের জন্য সাপোর্ট কীভাবে চালু করতে হয় এবং কনটেক্সট সার্কুলেশনের উদাহরণ জানতে টুল কম্বিনেশন গাইডটি পড়ুন।
কাঠামোগত আউটপুট বনাম ফাংশন কলিং
জেমিনি স্ট্রাকচার্ড আউটপুট তৈরি করার জন্য দুটি পদ্ধতি প্রদান করে। যখন মডেলকে আপনার নিজস্ব টুল বা ডেটা সিস্টেমের সাথে সংযোগ স্থাপনের মাধ্যমে কোনো মধ্যবর্তী ধাপ সম্পাদন করতে হয়, তখন ফাংশন কলিং ব্যবহার করুন। যখন মডেলের চূড়ান্ত প্রতিক্রিয়াকে কঠোরভাবে একটি নির্দিষ্ট স্কিমা মেনে চলতে হয়, যেমন একটি কাস্টম UI রেন্ডার করার ক্ষেত্রে, তখন স্ট্রাকচার্ড আউটপুট ব্যবহার করুন।
সরঞ্জাম সহ কাঠামোগত আউটপুট
আপনি স্ট্রাকচার্ড আউটপুটকে বিল্ট-ইন টুলের সাথে একত্রিত করতে পারেন, যাতে বাহ্যিক ডেটা বা গণনার উপর ভিত্তি করে তৈরি মডেলের প্রতিক্রিয়াগুলো একটি কঠোর স্কিমা মেনে চলে।
কোডের উদাহরণের জন্য টুলসহ কাঠামোগত আউটপুট দেখুন।
বিল্ডিং এজেন্ট
এজেন্ট হলো এমন সিস্টেম যা একাধিক ধাপের কাজ সম্পন্ন করতে মডেল এবং টুল ব্যবহার করে। যদিও জেমিনি যুক্তিবোধের ক্ষমতা ("মস্তিষ্ক") এবং প্রয়োজনীয় টুল ("হাত") সরবরাহ করে, এজেন্টের মেমরি পরিচালনা, লুপের পরিকল্পনা এবং জটিল টুল চেইনিং সম্পাদনের জন্য প্রায়শই একটি অর্কেস্ট্রেশন ফ্রেমওয়ার্কের প্রয়োজন হয়।
বহু-ধাপের ওয়ার্কফ্লোতে নির্ভরযোগ্যতা সর্বোচ্চ করতে, আপনার এমন নির্দেশাবলী তৈরি করা উচিত যা মডেলটি কীভাবে যুক্তি দেয় এবং পরিকল্পনা করে তা স্পষ্টভাবে নিয়ন্ত্রণ করে। যদিও জেমিনি শক্তিশালী সাধারণ যুক্তি প্রদান করে, জটিল এজেন্টরা এমন প্রম্পট থেকে উপকৃত হয় যা নির্দিষ্ট আচরণকে বাধ্যতামূলক করে, যেমন সমস্যার মুখে অবিচল থাকা, ঝুঁকি মূল্যায়ন এবং সক্রিয় পরিকল্পনা।
এই প্রম্পটগুলো ডিজাইন করার কৌশল জানতে এজেন্টিক ওয়ার্কফ্লো দেখুন। এখানে একটি সিস্টেম নির্দেশনার উদাহরণ দেওয়া হলো, যা বেশ কয়েকটি এজেন্টিক বেঞ্চমার্কে পারফরম্যান্স প্রায় ৫% উন্নত করেছে।
এজেন্ট ফ্রেমওয়ার্ক
জেমিনি নিম্নলিখিত শীর্ষস্থানীয় ওপেন-সোর্স এজেন্ট ফ্রেমওয়ার্কগুলির সাথে সমন্বিত হয়:
- LangChain / LangGraph : গ্রাফ কাঠামো ব্যবহার করে স্টেটফুল, জটিল অ্যাপ্লিকেশন ফ্লো এবং মাল্টি-এজেন্ট সিস্টেম তৈরি করুন।
- LlamaIndex : RAG-বর্ধিত ওয়ার্কফ্লোর জন্য Gemini এজেন্টদের আপনার ব্যক্তিগত ডেটার সাথে সংযুক্ত করুন।
- CrewAI : সহযোগিতামূলক, ভূমিকা-পালনকারী স্বায়ত্তশাসিত এআই এজেন্টদের পরিচালনা করুন।
- ভার্সেল এআই এসডিকে : জাভাস্ক্রিপ্ট/টাইপস্ক্রিপ্টে এআই-চালিত ইউজার ইন্টারফেস এবং এজেন্ট তৈরি করুন।
- গুগল এডিকে : আন্তঃকার্যকরী এআই এজেন্ট তৈরি এবং সমন্বয় করার জন্য একটি ওপেন-সোর্স ফ্রেমওয়ার্ক।