জেমিনি এপিআই-এর সাথে টুলস ব্যবহার করা

টুলগুলো জেমিনি মডেলগুলোর সক্ষমতা বৃদ্ধি করে, যার ফলে তারা বাস্তব জগতে পদক্ষেপ নিতে, রিয়েল-টাইম তথ্য অ্যাক্সেস করতে এবং জটিল গণনামূলক কাজ সম্পাদন করতে পারে। মডেলগুলো সাধারণ অনুরোধ-প্রতিক্রিয়া মিথস্ক্রিয়া এবং লাইভ এপিআই (Live API ) ব্যবহার করে রিয়েল-টাইম স্ট্রিমিং সেশন—উভয় ক্ষেত্রেই টুলগুলো ব্যবহার করতে পারে।

টুল হলো নির্দিষ্ট কিছু সক্ষমতা (যেমন গুগল সার্চ বা কোড এক্সিকিউশন) যা একটি মডেল কোয়েরির উত্তর দেওয়ার জন্য ব্যবহার করতে পারে। জেমিনি এপিআই সম্পূর্ণরূপে পরিচালিত ও বিল্ট-ইন টুলের একটি স্যুট প্রদান করে, অথবা আপনি ফাংশন কলিং ব্যবহার করে কাস্টম টুল তৈরি করতে পারেন।

বহু-ধাপের ও লক্ষ্য-ভিত্তিক সিস্টেম তৈরি করতে, এজেন্ট ওভারভিউ দেখুন।

উপলব্ধ অন্তর্নির্মিত সরঞ্জাম

সরঞ্জাম বর্ণনা ব্যবহারের ক্ষেত্র
গুগল অনুসন্ধান বিভ্রম কমাতে সাম্প্রতিক ঘটনা এবং ওয়েব থেকে প্রাপ্ত তথ্যের উপর ভিত্তি করে প্রতিক্রিয়া জানান। - সাম্প্রতিক ঘটনা সম্পর্কে প্রশ্নের উত্তর দেওয়া
বিভিন্ন উৎস থেকে তথ্য যাচাই করা
গুগল ম্যাপস অবস্থান-সচেতন এমন সহকারী তৈরি করুন যা জায়গা খুঁজে বের করতে, দিকনির্দেশনা পেতে এবং স্থানীয় প্রেক্ষাপট সম্পর্কে বিস্তারিত তথ্য প্রদান করতে পারে। একাধিক বিরতি সহ ভ্রমণসূচী পরিকল্পনা করা
ব্যবহারকারীর মানদণ্ডের ভিত্তিতে স্থানীয় ব্যবসা খুঁজে বের করা
কোড এক্সিকিউশন মডেলটিকে গাণিতিক সমস্যা সমাধান করতে বা নির্ভুলভাবে ডেটা প্রক্রিয়াকরণ করতে পাইথন কোড লিখতে ও চালাতে অনুমতি দিন। জটিল গাণিতিক সমীকরণ সমাধান করা
পাঠ্য ডেটা নির্ভুলভাবে প্রক্রিয়াকরণ এবং বিশ্লেষণ করা
ইউআরএল প্রসঙ্গ মডেলটিকে নির্দিষ্ট ওয়েব পেজ বা ডকুমেন্ট থেকে বিষয়বস্তু পড়তে ও বিশ্লেষণ করতে নির্দেশ দিন। নির্দিষ্ট ইউআরএল বা ডকুমেন্টের উপর ভিত্তি করে প্রশ্নের উত্তর দেওয়া
বিভিন্ন ওয়েব পৃষ্ঠা থেকে তথ্য পুনরুদ্ধার করা
কম্পিউটার ব্যবহার (পূর্বরূপ) স্ক্রিন দেখতে এবং ওয়েব ব্রাউজার UI-এর সাথে ইন্টারঅ্যাক্ট করার জন্য অ্যাকশন তৈরি করতে জেমিনিকে সক্ষম করুন (ক্লায়েন্ট-সাইড এক্সিকিউশন)। পুনরাবৃত্তিমূলক ওয়েব-ভিত্তিক ওয়ার্কফ্লো স্বয়ংক্রিয় করা
ওয়েব অ্যাপ্লিকেশন ইউজার ইন্টারফেস পরীক্ষা করা
ফাইল অনুসন্ধান রিট্রিভাল অগমেন্টেড জেনারেশন (RAG) সক্ষম করতে আপনার নিজের নথিগুলি সূচীবদ্ধ ও অনুসন্ধান করুন। প্রযুক্তিগত ম্যানুয়াল অনুসন্ধান করা
মালিকানাধীন ডেটা নিয়ে প্রশ্নের উত্তর দেওয়া

নির্দিষ্ট টুলগুলোর সাথে সম্পর্কিত খরচের বিস্তারিত জানতে মূল্য নির্ধারণ পৃষ্ঠাটি দেখুন।

টুলস এক্সিকিউশন কীভাবে কাজ করে

টুলগুলো মডেলকে কথোপকথন চলাকালীন বিভিন্ন কাজের অনুরোধ করার সুযোগ দেয়। টুলটি বিল্ট-ইন (গুগল দ্বারা পরিচালিত) নাকি কাস্টম (আপনার দ্বারা পরিচালিত), তার উপর নির্ভর করে কার্যপ্রক্রিয়াটি ভিন্ন হয়।

অন্তর্নির্মিত টুল প্রবাহ

বিল্ট-ইন টুলগুলোর (গুগল সার্চ, গুগল ম্যাপস, ইউআরএল কনটেক্সট, ফাইল সার্চ, কোড এক্সিকিউশন) ক্ষেত্রে, সম্পূর্ণ প্রক্রিয়াটি একটিমাত্র এপিআই কলের মাধ্যমেই সম্পন্ন হয়:

  1. আপনি একটি অনুরোধ পাঠান: "GOOG-এর সর্বশেষ শেয়ার মূল্যের বর্গমূল কত?"
  2. জেমিনি সিদ্ধান্ত নেয় যে তার কিছু টুলের প্রয়োজন এবং সেগুলো গুগলের সার্ভারে চালায় (যেমন, শেয়ারের দাম খোঁজে, তারপর তার বর্গমূল বের করার জন্য পাইথন কোড চালায়)।
  3. জেমিনি টুলের ফলাফলের উপর ভিত্তি করে চূড়ান্ত উত্তরটি ফেরত পাঠায়।

কাস্টম টুল ফ্লো (ফাংশন কলিং)

কাস্টম টুল এবং কম্পিউটার ব্যবহারের ক্ষেত্রে, আপনার অ্যাপ্লিকেশনটিই কার্য সম্পাদন করে:

  1. আপনি ফাংশন (টুল) ঘোষণার সাথে একটি প্রম্পট পাঠান।
  2. জেমিনি একটি নির্দিষ্ট ফাংশন কল করার জন্য স্ট্রাকচার্ড JSON ফেরত পাঠাতে পারে (উদাহরণস্বরূপ, {"name": "get_order_status", "args": {"order_id": "123"}} ), যেখানে সর্বদা একটি অনন্য id থাকবে।
  3. আপনি আপনার অ্যাপ্লিকেশন বা পরিবেশে ফাংশনটি কার্যকর করেন।
  4. আপনি ফাংশন কলের id ব্যবহার করে ফাংশনের ফলাফলগুলো জেমিনিতে ফেরত পাঠান।
  5. জেমিনি ফলাফলগুলো ব্যবহার করে একটি চূড়ান্ত প্রতিক্রিয়া বা অন্য কোনো টুল কল তৈরি করে।

ফাংশন কলিং গাইডে আরও জানুন।

অন্তর্নির্মিত এবং কাস্টম টুলের প্রবাহ একত্রিত করা

যেসব অনুরোধের ক্ষেত্রে বিল্ট-ইন টুল এবং কাস্টম টুল (ফাংশন কল) একত্রিত থাকে, সেগুলোর সম্পাদন সমন্বয় করার জন্য মডেলটি টুল কনটেক্সট সার্কুলেশন ব্যবহার করে:

  1. আপনি একটি প্রম্পট পাঠিয়ে আপনার পছন্দের বিল্ট-ইন টুল এবং কাস্টম ফাংশনগুলো ঘোষণা করেন এবং কম্বিনেশন সাপোর্ট চালু করার জন্য একটি ফ্ল্যাগ সেট করেন।
  2. যদি কোনো ক্লায়েন্ট-সাইড ফাংশন কল তৈরি হয়, তবে জেমিনি বিল্ট-ইন টুলগুলো কার্যকর করে এবং ব্যবহারকারীকে সিদ্ধান্ত নেওয়ার সুযোগ দেয় (কোনটি প্রথমে কার্যকর হবে তা প্রম্পট এবং মডেলের সিদ্ধান্তের উপর নির্ভর করে)। এটি নিম্নলিখিত তথ্যসহ একটি প্রতিক্রিয়া ফেরত পাঠায়:
    • টুল কলের নিশ্চিতকরণ
    • টুলের প্রতিক্রিয়ার ফলাফল (মডেলটি দুটি সমান্তরাল ফাংশন কল তৈরি করলে এটি JSON-এর পরে আসতে পারে)
    • আপনার ফাংশন কল করার জন্য স্ট্রাকচার্ড JSON
    • প্রসঙ্গ সংরক্ষণের জন্য এনক্রিপ্ট করা চিন্তার স্বাক্ষর
  3. আপনি আপনার অ্যাপ্লিকেশন বা পরিবেশে ফাংশনটি কার্যকর করেন।
  4. আপনি জেমিনির প্রতিক্রিয়ার সমস্ত অংশ, সেইসাথে আপনার ফাংশন কলের ফলাফলও ফেরত দেন।
  5. জেমিনি সমস্ত সম্মিলিত প্রেক্ষাপট ব্যবহার করে চূড়ান্ত প্রতিক্রিয়া তৈরি করে।

বিল্ট-ইন ও কাস্টম টুলের সমন্বয়ের জন্য সাপোর্ট কীভাবে চালু করতে হয় এবং কনটেক্সট সার্কুলেশনের উদাহরণ জানতে টুল কম্বিনেশন গাইডটি পড়ুন।

কাঠামোগত আউটপুট বনাম ফাংশন কলিং

জেমিনি স্ট্রাকচার্ড আউটপুট তৈরি করার জন্য দুটি পদ্ধতি প্রদান করে। যখন মডেলকে আপনার নিজস্ব টুল বা ডেটা সিস্টেমের সাথে সংযোগ স্থাপনের মাধ্যমে কোনো মধ্যবর্তী ধাপ সম্পাদন করতে হয়, তখন ফাংশন কলিং ব্যবহার করুন। যখন মডেলের চূড়ান্ত প্রতিক্রিয়াকে কঠোরভাবে একটি নির্দিষ্ট স্কিমা মেনে চলতে হয়, যেমন একটি কাস্টম UI রেন্ডার করার ক্ষেত্রে, তখন স্ট্রাকচার্ড আউটপুট ব্যবহার করুন।

সরঞ্জাম সহ কাঠামোগত আউটপুট

আপনি স্ট্রাকচার্ড আউটপুটকে বিল্ট-ইন টুলের সাথে একত্রিত করতে পারেন, যাতে বাহ্যিক ডেটা বা গণনার উপর ভিত্তি করে তৈরি মডেলের প্রতিক্রিয়াগুলো একটি কঠোর স্কিমা মেনে চলে।

কোডের উদাহরণের জন্য টুলসহ কাঠামোগত আউটপুট দেখুন।