জেমিনি ইন্টারঅ্যাকশনস এপিআই হলো একটি পরীক্ষামূলক এপিআই যা ডেভেলপারদের জেমিনি মডেল ব্যবহার করে জেনারেটিভ এআই অ্যাপ্লিকেশন তৈরি করতে সাহায্য করে। জেমিনি আমাদের সবচেয়ে সক্ষম মডেল, যা একেবারে গোড়া থেকে মাল্টিমোডাল হওয়ার জন্য তৈরি করা হয়েছে। এটি ভাষা, ছবি, অডিও, ভিডিও এবং কোড সহ বিভিন্ন ধরণের তথ্যকে সাধারণীকরণ করতে, নির্বিঘ্নে বুঝতে, সেগুলোর মধ্যে কাজ করতে এবং একত্রিত করতে পারে। আপনি টেক্সট এবং ছবির মধ্যে যুক্তি স্থাপন, কন্টেন্ট তৈরি, ডায়ালগ এজেন্ট, সারসংক্ষেপ এবং শ্রেণিবিন্যাস সিস্টেম এবং আরও অনেক কিছুর মতো ক্ষেত্রে জেমিনি এপিআই ব্যবহার করতে পারেন।
একটি মিথস্ক্রিয়া তৈরি করা
একটি নতুন মিথস্ক্রিয়া তৈরি করে।
অনুরোধের মূল অংশ
অনুরোধের মূল অংশে নিম্নলিখিত কাঠামো সহ ডেটা রয়েছে:
মডেল মডেলঅপশন (ঐচ্ছিক)
ইন্টারঅ্যাকশনটি তৈরি করতে ব্যবহৃত `মডেল`-এর নাম।
`agent` প্রদান করা না হলে এটি আবশ্যক।
সম্ভাব্য মানসমূহ:
-
gemini-2.5-flashআমাদের প্রথম হাইব্রিড রিজনিং মডেল যা ১ মিলিয়ন টোকেন কনটেক্সট উইন্ডো এবং থিংকিং বাজেট সমর্থন করে।
-
gemini-2.5-flash-imageআমাদের নিজস্ব ইমেজ জেনারেশন মডেলটি গতি, নমনীয়তা এবং প্রাসঙ্গিকতা বোঝার জন্য অপ্টিমাইজ করা হয়েছে। টেক্সট ইনপুট এবং আউটপুটের মূল্য ২.৫ ফ্ল্যাশের সমান।
-
gemini-2.5-flash-liteআমাদের সবচেয়ে ছোট এবং সবচেয়ে সাশ্রয়ী মডেল, যা ব্যাপক ব্যবহারের জন্য নির্মিত।
-
gemini-2.5-flash-lite-preview-09-2025জেমিনি ২.৫ ফ্ল্যাশ লাইট-এর উপর ভিত্তি করে তৈরি সর্বাধুনিক মডেলটি ব্যয়-সাশ্রয়, উচ্চ কার্যক্ষমতা এবং উচ্চ মানের জন্য বিশেষভাবে অপ্টিমাইজ করা হয়েছে।
-
gemini-2.5-flash-native-audio-preview-12-2025আমাদের নেটিভ অডিও মডেলগুলো উন্নত গতি, কণ্ঠস্বরের স্বাভাবিকতা, বিশদ বিবরণ এবং মেজাজ সহ উচ্চতর মানের অডিও আউটপুটের জন্য অপ্টিমাইজ করা হয়েছে।
-
gemini-2.5-flash-preview-09-2025২.৫ ফ্ল্যাশ মডেলের উপর ভিত্তি করে তৈরি সর্বশেষ মডেল। ২.৫ ফ্ল্যাশ প্রিভিউ বৃহৎ পরিসরের প্রসেসিং, স্বল্প-লেটেন্সি, চিন্তাভাবনার প্রয়োজন এমন বিপুল পরিমাণ কাজ এবং এজেন্টিক ব্যবহারের ক্ষেত্রে সর্বোত্তম।
-
gemini-2.5-flash-preview-ttsআমাদের ২.৫ ফ্ল্যাশ টেক্সট-টু-স্পিচ মডেলটি শক্তিশালী, স্বল্প-বিলম্বের এবং নিয়ন্ত্রণযোগ্য বাক্ তৈরির জন্য অপ্টিমাইজ করা হয়েছে।
-
gemini-2.5-proআমাদের সর্বাধুনিক বহুমুখী মডেল, যা কোডিং এবং জটিল যুক্তিনির্ভর কাজে অত্যন্ত পারদর্শী।
-
gemini-2.5-pro-preview-ttsআমাদের ২.৫ প্রো টেক্সট-টু-স্পিচ অডিও মডেলটি শক্তিশালী ও স্বল্প-বিলম্বের বক্তৃতা তৈরির জন্য অপ্টিমাইজ করা হয়েছে, যা আরও স্বাভাবিক আউটপুট এবং সহজে পরিচালনাযোগ্য প্রম্পট প্রদান করে।
-
gemini-3-flash-previewগতির জন্য নির্মিত আমাদের সবচেয়ে বুদ্ধিমান মডেল, যা অত্যাধুনিক বুদ্ধিমত্তার সাথে উন্নত অনুসন্ধান এবং ভূমিতে স্থিতিশীলতার সমন্বয় ঘটায়।
-
gemini-3-pro-image-previewসর্বাধুনিক চিত্র তৈরি ও সম্পাদনা মডেল।
-
gemini-3-pro-previewআমাদের সবচেয়ে বুদ্ধিমান মডেল, যার রয়েছে অত্যাধুনিক যুক্তিবোধ ও বহুবিধ উপলব্ধির ক্ষমতা এবং শক্তিশালী সক্রিয় ও ভাব সংকেতায়নের সক্ষমতা।
-
gemini-3.1-pro-previewআমাদের সর্বাধুনিক অত্যাধুনিক রিজনিং মডেল, যা অভূতপূর্ব গভীরতা ও সূক্ষ্মতা এবং শক্তিশালী মাল্টিমোডাল আন্ডারস্ট্যান্ডিং ও কোডিং সক্ষমতাসম্পন্ন।
-
gemini-3.1-flash-image-previewফ্ল্যাশের গতির দক্ষতা এবং বাস্তবতার উপর ভিত্তি করে তৈরির ক্ষমতাসহ পেশাদার স্তরের ভিজ্যুয়াল ইন্টেলিজেন্স।
এজেন্ট এজেন্টঅপশন (ঐচ্ছিক)
ইন্টারঅ্যাকশনটি তৈরি করতে ব্যবহৃত 'এজেন্ট'-এর নাম।
`model` প্রদান করা না হলে এটি আবশ্যক।
সম্ভাব্য মানসমূহ:
-
deep-research-pro-preview-12-2025জেমিনি ডিপ রিসার্চ এজেন্ট
মিথস্ক্রিয়ার জন্য প্রয়োজনীয় উপাদানসমূহ (যা মডেল এবং এজেন্ট উভয়ের জন্যই প্রযোজ্য)।
মিথস্ক্রিয়ার জন্য সিস্টেম নির্দেশাবলী।
ইন্টারঅ্যাকশনের সময় মডেলটি যেসব টুল ডিক্লারেশন কল করতে পারে, তার একটি তালিকা।
এটি নিশ্চিত করে যে তৈরি হওয়া প্রতিক্রিয়াটি একটি JSON অবজেক্ট হবে যা এই ফিল্ডে নির্দিষ্ট করা JSON স্কিমা মেনে চলে।
রেসপন্সের MIME টাইপ। response_format সেট করা থাকলে এটি আবশ্যক।
শুধুমাত্র ইনপুট। কথোপকথনটি স্ট্রিম করা হবে কিনা।
শুধুমাত্র ইনপুট। প্রতিক্রিয়া এবং অনুরোধটি পরবর্তীতে পুনরুদ্ধারের জন্য সংরক্ষণ করা হবে কিনা।
শুধুমাত্র ইনপুট। মডেল ইন্টারঅ্যাকশনটি ব্যাকগ্রাউন্ডে চালানো হবে কিনা।
generation_config GenerationConfig (ঐচ্ছিক)
মডেল কনফিগারেশন
মডেলের সাথে মিথস্ক্রিয়ার জন্য কনফিগারেশন প্যারামিটারসমূহ।
`agent_config`-এর বিকল্প। শুধুমাত্র তখনই প্রযোজ্য যখন `model` সেট করা থাকে।
ক্ষেত্র
আউটপুটের এলোমেলোভাব নিয়ন্ত্রণ করে।
স্যাম্পলিং করার সময় বিবেচনা করার জন্য টোকেনগুলোর সর্বোচ্চ ক্রমবর্ধমান সম্ভাবনা।
পুনরুৎপাদনযোগ্যতার জন্য ডিকোডিং-এ ব্যবহৃত বীজ।
অক্ষর অনুক্রমের একটি তালিকা যা আউটপুট ইন্টারঅ্যাকশন বন্ধ করে দেবে।
চিন্তার স্তর ( ঐচ্ছিক)
মডেলটি যে পরিমাণ চিন্তার টোকেন তৈরি করবে।
সম্ভাব্য মানসমূহ:
-
minimal -
low -
medium -
high
চিন্তার সারসংক্ষেপ (ঐচ্ছিক)
উত্তরে চিন্তার সারাংশ অন্তর্ভুক্ত করা হবে কিনা।
সম্ভাব্য মানসমূহ:
-
auto -
none
প্রতিক্রিয়ায় অন্তর্ভুক্ত করার জন্য টোকেনের সর্বোচ্চ সংখ্যা।
speech_config SpeechConfig (ঐচ্ছিক)
মৌখিক যোগাযোগের জন্য কনফিগারেশন।
ক্ষেত্র
বক্তার কণ্ঠস্বর।
বক্তৃতার ভাষা।
বক্তার নাম অবশ্যই প্রম্পটে দেওয়া বক্তার নামের সাথে মিলতে হবে।
ইমেজ_কনফিগ ইমেজকনফিগ (ঐচ্ছিক)
ছবির সাথে মিথস্ক্রিয়ার জন্য কনফিগারেশন।
ক্ষেত্র
কোনো বিবরণ দেওয়া হয়নি।
সম্ভাব্য মানসমূহ:
-
1:1 -
2:3 -
3:2 -
3:4 -
4:3 -
4:5 -
5:4 -
9:16 -
16:9 -
21:9 -
1:8 -
8:1 -
1:4 -
4:1
কোনো বিবরণ দেওয়া হয়নি।
সম্ভাব্য মানসমূহ:
-
1K -
2K -
4K -
512
মিথস্ক্রিয়ার জন্য সরঞ্জাম নির্বাচন।
agent_config অবজেক্ট (ঐচ্ছিক)
এজেন্ট কনফিগারেশন
এজেন্টের জন্য কনফিগারেশন।
`generation_config`-এর বিকল্প। শুধুমাত্র তখনই প্রযোজ্য যখন `agent` সেট করা থাকে।
সম্ভাব্য প্রকার
পলিমরফিক ডিসক্রিমিনেটর: type
ডাইনামিকএজেন্টকনফিগ
ডাইনামিক এজেন্টদের জন্য কনফিগারেশন।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "dynamic" এ সেট করা থাকে।
DeepResearchAgentConfig
ডিপ রিসার্চ এজেন্টের কনফিগারেশন।
চিন্তার সারসংক্ষেপ (ঐচ্ছিক)
উত্তরে চিন্তার সারাংশ অন্তর্ভুক্ত করা হবে কিনা।
সম্ভাব্য মানসমূহ:
-
auto -
none
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "deep-research" তে সেট করা থাকে।
পূর্ববর্তী যোগাযোগের আইডি, যদি থাকে।
প্রতিক্রিয়া পদ্ধতি (ঐচ্ছিক)
প্রতিক্রিয়ার অনুরোধকৃত মাধ্যমগুলো (টেক্সট, ছবি, অডিও)।
সম্ভাব্য মানসমূহ:
-
text -
image -
audio
প্রতিক্রিয়া
একটি ইন্টারঅ্যাকশন রিসোর্স ফেরত দেয়।
সাধারণ অনুরোধ
উদাহরণ প্রতিক্রিয়া
{ "created": "2025-11-26T12:25:15Z", "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "object": "interaction", "outputs": [ { "text": "Hello! I'm functioning perfectly and ready to assist you.\n\nHow are you doing today?", "type": "text" } ], "role": "model", "status": "completed", "updated": "2025-11-26T12:25:15Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 7 } ], "total_cached_tokens": 0, "total_input_tokens": 7, "total_output_tokens": 20, "total_thought_tokens": 22, "total_tokens": 49, "total_tool_use_tokens": 0 } }
মাল্টি-টার্ন
উদাহরণ প্রতিক্রিয়া
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "role": "model", "outputs": [ { "type": "text", "text": "The capital of France is Paris." } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 50 } ], "total_cached_tokens": 0, "total_input_tokens": 50, "total_output_tokens": 10, "total_thought_tokens": 0, "total_tokens": 60, "total_tool_use_tokens": 0 } }
ইমেজ ইনপুট
উদাহরণ প্রতিক্রিয়া
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "role": "model", "outputs": [ { "type": "text", "text": "A white humanoid robot with glowing blue eyes stands holding a red skateboard." } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 10 }, { "modality": "image", "tokens": 258 } ], "total_cached_tokens": 0, "total_input_tokens": 268, "total_output_tokens": 20, "total_thought_tokens": 0, "total_tokens": 288, "total_tool_use_tokens": 0 } }
ফাংশন কলিং
উদাহরণ প্রতিক্রিয়া
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "requires_action", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "role": "model", "outputs": [ { "type": "function_call", "id": "gth23981", "name": "get_weather", "arguments": { "location": "Boston, MA" } } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 100 } ], "total_cached_tokens": 0, "total_input_tokens": 100, "total_output_tokens": 25, "total_thought_tokens": 0, "total_tokens": 125, "total_tool_use_tokens": 50 } }
গভীর গবেষণা
উদাহরণ প্রতিক্রিয়া
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "agent": "deep-research-pro-preview-12-2025", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "role": "agent", "outputs": [ { "type": "text", "text": "Here is a comprehensive research report on the current state of cancer research..." } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 20 } ], "total_cached_tokens": 0, "total_input_tokens": 20, "total_output_tokens": 1000, "total_thought_tokens": 500, "total_tokens": 1520, "total_tool_use_tokens": 0 } }
একটি মিথস্ক্রিয়া পুনরুদ্ধার করা
`Interaction.id`-এর উপর ভিত্তি করে একটিমাত্র ইন্টারঅ্যাকশনের সম্পূর্ণ বিবরণ পুনরুদ্ধার করে।
পাথ / কোয়েরি প্যারামিটার
পুনরুদ্ধার করার জন্য ইন্টারঅ্যাকশনটির অনন্য শনাক্তকারী।
true-তে সেট করা হলে, তৈরি হওয়া কন্টেন্ট পর্যায়ক্রমে স্ট্রিম করা হবে।
ডিফল্ট মান: False
ঐচ্ছিক। সেট করা থাকলে, ইভেন্ট আইডি দ্বারা চিহ্নিত ইভেন্টের পরের চাঙ্ক থেকে ইন্টারঅ্যাকশন স্ট্রিম পুনরায় শুরু হয়। এটি শুধুমাত্র তখনই ব্যবহার করা যাবে যখন `stream` সত্য হবে।
true সেট করা হলে, ইনপুটটি রেসপন্সে অন্তর্ভুক্ত করা হয়।
ডিফল্ট মান: False
এপিআই-এর কোন সংস্করণটি ব্যবহার করতে হবে।
প্রতিক্রিয়া
একটি ইন্টারঅ্যাকশন রিসোর্স ফেরত দেয়।
মিথস্ক্রিয়া করুন
উদাহরণ প্রতিক্রিয়া
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:25:15Z", "updated": "2025-11-26T12:25:15Z", "role": "model", "outputs": [ { "type": "text", "text": "I'm doing great, thank you for asking! How can I help you today?" } ] }
একটি ইন্টারঅ্যাকশন মুছে ফেলা
আইডি দ্বারা ইন্টারঅ্যাকশনটি মুছে দেয়।
পাথ / কোয়েরি প্যারামিটার
মুছে ফেলার জন্য ইন্টারঅ্যাকশনটির অনন্য শনাক্তকারী।
এপিআই-এর কোন সংস্করণটি ব্যবহার করতে হবে।
প্রতিক্রিয়া
সফল হলে, প্রতিক্রিয়াটি খালি থাকে।
মিথস্ক্রিয়া মুছুন
একটি ইন্টারঅ্যাকশন বাতিল করা
আইডি দ্বারা একটি ইন্টারঅ্যাকশন বাতিল করে। এটি শুধুমাত্র চলমান ব্যাকগ্রাউন্ড ইন্টারঅ্যাকশনগুলোর ক্ষেত্রে প্রযোজ্য।
পাথ / কোয়েরি প্যারামিটার
বাতিল করার জন্য ইন্টারঅ্যাকশনটির অনন্য শনাক্তকারী।
এপিআই-এর কোন সংস্করণটি ব্যবহার করতে হবে।
প্রতিক্রিয়া
একটি ইন্টারঅ্যাকশন রিসোর্স ফেরত দেয়।
মিথস্ক্রিয়া বাতিল করুন
উদাহরণ প্রতিক্রিয়া
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "agent": "deep-research-pro-preview-12-2025", "status": "cancelled", "object": "interaction", "created": "2025-11-26T12:25:15Z", "updated": "2025-11-26T12:25:15Z", "role": "agent" }
সম্পদ
মিথস্ক্রিয়া
মিথস্ক্রিয়া সম্পদ।
ক্ষেত্র
মডেল মডেলঅপশন (ঐচ্ছিক)
ইন্টারঅ্যাকশনটি তৈরি করতে ব্যবহৃত `মডেল`-এর নাম।
সম্ভাব্য মানসমূহ:
-
gemini-2.5-flashআমাদের প্রথম হাইব্রিড রিজনিং মডেল যা ১ মিলিয়ন টোকেন কনটেক্সট উইন্ডো এবং থিংকিং বাজেট সমর্থন করে।
-
gemini-2.5-flash-imageআমাদের নিজস্ব ইমেজ জেনারেশন মডেলটি গতি, নমনীয়তা এবং প্রাসঙ্গিকতা বোঝার জন্য অপ্টিমাইজ করা হয়েছে। টেক্সট ইনপুট এবং আউটপুটের মূল্য ২.৫ ফ্ল্যাশের সমান।
-
gemini-2.5-flash-liteআমাদের সবচেয়ে ছোট এবং সবচেয়ে সাশ্রয়ী মডেল, যা ব্যাপক ব্যবহারের জন্য নির্মিত।
-
gemini-2.5-flash-lite-preview-09-2025জেমিনি ২.৫ ফ্ল্যাশ লাইট-এর উপর ভিত্তি করে তৈরি সর্বাধুনিক মডেলটি ব্যয়-সাশ্রয়, উচ্চ কার্যক্ষমতা এবং উচ্চ মানের জন্য বিশেষভাবে অপ্টিমাইজ করা হয়েছে।
-
gemini-2.5-flash-native-audio-preview-12-2025আমাদের নেটিভ অডিও মডেলগুলো উন্নত গতি, কণ্ঠস্বরের স্বাভাবিকতা, বিশদ বিবরণ এবং মেজাজ সহ উচ্চতর মানের অডিও আউটপুটের জন্য অপ্টিমাইজ করা হয়েছে।
-
gemini-2.5-flash-preview-09-2025২.৫ ফ্ল্যাশ মডেলের উপর ভিত্তি করে তৈরি সর্বশেষ মডেল। ২.৫ ফ্ল্যাশ প্রিভিউ বৃহৎ পরিসরের প্রসেসিং, স্বল্প-লেটেন্সি, চিন্তাভাবনার প্রয়োজন এমন বিপুল পরিমাণ কাজ এবং এজেন্টিক ব্যবহারের ক্ষেত্রে সর্বোত্তম।
-
gemini-2.5-flash-preview-ttsআমাদের ২.৫ ফ্ল্যাশ টেক্সট-টু-স্পিচ মডেলটি শক্তিশালী, স্বল্প-বিলম্বের এবং নিয়ন্ত্রণযোগ্য বাক্ তৈরির জন্য অপ্টিমাইজ করা হয়েছে।
-
gemini-2.5-proআমাদের সর্বাধুনিক বহুমুখী মডেল, যা কোডিং এবং জটিল যুক্তিনির্ভর কাজে অত্যন্ত পারদর্শী।
-
gemini-2.5-pro-preview-ttsআমাদের ২.৫ প্রো টেক্সট-টু-স্পিচ অডিও মডেলটি শক্তিশালী ও স্বল্প-বিলম্বের বক্তৃতা তৈরির জন্য অপ্টিমাইজ করা হয়েছে, যা আরও স্বাভাবিক আউটপুট এবং সহজে পরিচালনাযোগ্য প্রম্পট প্রদান করে।
-
gemini-3-flash-previewগতির জন্য নির্মিত আমাদের সবচেয়ে বুদ্ধিমান মডেল, যা অত্যাধুনিক বুদ্ধিমত্তার সাথে উন্নত অনুসন্ধান এবং ভূমিতে স্থিতিশীলতার সমন্বয় ঘটায়।
-
gemini-3-pro-image-previewসর্বাধুনিক চিত্র তৈরি ও সম্পাদনা মডেল।
-
gemini-3-pro-previewআমাদের সবচেয়ে বুদ্ধিমান মডেল, যার রয়েছে অত্যাধুনিক যুক্তিবোধ ও বহুবিধ উপলব্ধির ক্ষমতা এবং শক্তিশালী সক্রিয় ও ভাব সংকেতায়নের সক্ষমতা।
-
gemini-3.1-pro-previewআমাদের সর্বাধুনিক অত্যাধুনিক রিজনিং মডেল, যা অভূতপূর্ব গভীরতা ও সূক্ষ্মতা এবং শক্তিশালী মাল্টিমোডাল আন্ডারস্ট্যান্ডিং ও কোডিং সক্ষমতাসম্পন্ন।
-
gemini-3.1-flash-image-previewফ্ল্যাশের গতির দক্ষতা এবং বাস্তবতার উপর ভিত্তি করে তৈরির ক্ষমতাসহ পেশাদার স্তরের ভিজ্যুয়াল ইন্টেলিজেন্স।
এজেন্ট এজেন্টঅপশন (ঐচ্ছিক)
ইন্টারঅ্যাকশনটি তৈরি করতে ব্যবহৃত 'এজেন্ট'-এর নাম।
সম্ভাব্য মানসমূহ:
-
deep-research-pro-preview-12-2025জেমিনি ডিপ রিসার্চ এজেন্ট
শুধুমাত্র আউটপুট। মিথস্ক্রিয়া সম্পন্ন হওয়ার জন্য একটি অনন্য শনাক্তকারী।
শুধুমাত্র আউটপুট। মিথস্ক্রিয়ার অবস্থা।
সম্ভাব্য মানসমূহ:
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
শুধুমাত্র আউটপুট। যে সময়ে প্রতিক্রিয়াটি তৈরি করা হয়েছিল, সেই সময়টি ISO 8601 ফরম্যাটে (YYYY-MM-DDThh:mm:ssZ) উল্লেখ করতে হবে।
শুধুমাত্র আউটপুট। যে সময়ে প্রতিক্রিয়াটি সর্বশেষ আপডেট করা হয়েছিল, সেই সময়টি ISO 8601 ফরম্যাটে (YYYY-MM-DDThh:mm:ssZ)।
শুধুমাত্র আউটপুট। মিথস্ক্রিয়ার ভূমিকা।
শুধুমাত্র আউটপুট। মডেল থেকে প্রাপ্ত প্রতিক্রিয়া।
মিথস্ক্রিয়ার জন্য সিস্টেম নির্দেশাবলী।
ইন্টারঅ্যাকশনের সময় মডেলটি যেসব টুল ডিক্লারেশন কল করতে পারে, তার একটি তালিকা।
ব্যবহার (ঐচ্ছিক )
শুধুমাত্র আউটপুট। ইন্টারঅ্যাকশন অনুরোধের টোকেন ব্যবহারের পরিসংখ্যান।
ক্ষেত্র
প্রম্পটে (প্রসঙ্গ) টোকেনের সংখ্যা।
পদ্ধতি অনুসারে ইনপুট টোকেন ModalityTokens (ঐচ্ছিক)
পদ্ধতি অনুসারে ইনপুট টোকেন ব্যবহারের বিশদ বিবরণ।
ক্ষেত্র
পদ্ধতি প্রতিক্রিয়া পদ্ধতি (ঐচ্ছিক)
টোকেন সংখ্যার সাথে সংশ্লিষ্ট পদ্ধতি।
সম্ভাব্য মানসমূহ:
-
text -
image -
audio
মোডালিটির জন্য টোকেনের সংখ্যা।
প্রম্পটের ক্যাশ করা অংশে থাকা টোকেনের সংখ্যা (ক্যাশ করা বিষয়বস্তু)।
পদ্ধতি অনুসারে ক্যাশ করা টোকেন ModalityTokens (ঐচ্ছিক)
পদ্ধতি অনুসারে ক্যাশড টোকেন ব্যবহারের বিশদ বিবরণ।
ক্ষেত্র
পদ্ধতি প্রতিক্রিয়া পদ্ধতি (ঐচ্ছিক)
টোকেন সংখ্যার সাথে সংশ্লিষ্ট পদ্ধতি।
সম্ভাব্য মানসমূহ:
-
text -
image -
audio
মোডালিটির জন্য টোকেনের সংখ্যা।
তৈরি হওয়া সমস্ত প্রতিক্রিয়া জুড়ে টোকেনের মোট সংখ্যা।
মোডালিটি টোকেন (ঐচ্ছিক)
পদ্ধতি অনুসারে আউটপুট টোকেন ব্যবহারের বিশদ বিবরণ।
ক্ষেত্র
পদ্ধতি প্রতিক্রিয়া পদ্ধতি (ঐচ্ছিক)
টোকেন সংখ্যার সাথে সংশ্লিষ্ট পদ্ধতি।
সম্ভাব্য মানসমূহ:
-
text -
image -
audio
মোডালিটির জন্য টোকেনের সংখ্যা।
টুল ব্যবহারের নির্দেশনায় উপস্থিত টোকেনের সংখ্যা।
tool_use_tokens_by_modality ModalityTokens (ঐচ্ছিক)
পদ্ধতি অনুসারে টুল-ব্যবহার টোকেন ব্যবহারের একটি বিশদ বিবরণ।
ক্ষেত্র
পদ্ধতি প্রতিক্রিয়া পদ্ধতি (ঐচ্ছিক)
টোকেন সংখ্যার সাথে সংশ্লিষ্ট পদ্ধতি।
সম্ভাব্য মানসমূহ:
-
text -
image -
audio
মোডালিটির জন্য টোকেনের সংখ্যা।
চিন্তন মডেলগুলোর জন্য চিন্তার টোকেনের সংখ্যা।
ইন্টারঅ্যাকশন অনুরোধের জন্য মোট টোকেন সংখ্যা (প্রম্পট + প্রতিক্রিয়া + অন্যান্য অভ্যন্তরীণ টোকেন)।
প্রতিক্রিয়া পদ্ধতি (ঐচ্ছিক)
প্রতিক্রিয়ার অনুরোধকৃত মাধ্যমগুলো (টেক্সট, ছবি, অডিও)।
সম্ভাব্য মানসমূহ:
-
text -
image -
audio
এটি নিশ্চিত করে যে তৈরি হওয়া প্রতিক্রিয়াটি একটি JSON অবজেক্ট হবে যা এই ফিল্ডে নির্দিষ্ট করা JSON স্কিমা মেনে চলে।
রেসপন্সের MIME টাইপ। response_format সেট করা থাকলে এটি আবশ্যক।
পূর্ববর্তী যোগাযোগের আইডি, যদি থাকে।
মিথস্ক্রিয়ার জন্য প্রয়োজনীয় উপাদানসমূহ (যা মডেল এবং এজেন্ট উভয়ের জন্যই প্রযোজ্য)।
agent_config অবজেক্ট (ঐচ্ছিক)
এজেন্ট ইন্টারঅ্যাকশনের জন্য কনফিগারেশন প্যারামিটারসমূহ।
সম্ভাব্য প্রকার
পলিমরফিক ডিসক্রিমিনেটর: type
ডাইনামিকএজেন্টকনফিগ
ডাইনামিক এজেন্টদের জন্য কনফিগারেশন।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "dynamic" এ সেট করা থাকে।
DeepResearchAgentConfig
ডিপ রিসার্চ এজেন্টের কনফিগারেশন।
চিন্তার সারসংক্ষেপ (ঐচ্ছিক)
উত্তরে চিন্তার সারাংশ অন্তর্ভুক্ত করা হবে কিনা।
সম্ভাব্য মানসমূহ:
-
auto -
none
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "deep-research" তে সেট করা থাকে।
উদাহরণ
উদাহরণ
{ "created": "2025-12-04T15:01:45Z", "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg", "model": "gemini-3-flash-preview", "object": "interaction", "outputs": [ { "text": "Hello! I'm doing well, functioning as expected. Thank you for asking! How are you doing today?", "type": "text" } ], "role": "model", "status": "completed", "updated": "2025-12-04T15:01:45Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 7 } ], "total_cached_tokens": 0, "total_input_tokens": 7, "total_output_tokens": 23, "total_thought_tokens": 49, "total_tokens": 79, "total_tool_use_tokens": 0 } }
ডেটা মডেল
বিষয়বস্তু
প্রতিক্রিয়ার বিষয়বস্তু।
সম্ভাব্য প্রকার
পলিমরফিক ডিসক্রিমিনেটর: type
টেক্সট কন্টেন্ট
একটি টেক্সট কন্টেন্ট ব্লক।
পাঠ্য বিষয়বস্তু।
টীকা (ঐচ্ছিক )
মডেল-সৃষ্ট কন্টেন্টের জন্য উদ্ধৃতি তথ্য।
সম্ভাব্য প্রকার
পলিমরফিক ডিসক্রিমিনেটর: type
ইউআরএল উদ্ধৃতি
ইউআরএল উদ্ধৃতি টীকা।
ইউআরএল।
ইউআরএল-এর শিরোনাম।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "url_citation" এ সেট করা থাকে।
প্রতিক্রিয়ার যে অংশটি এই উৎসের বলে গণ্য করা হয়েছে, তার শুরু।
আরোপিত অংশের সমাপ্তি, স্বতন্ত্র।
ফাইল উদ্ধৃতি
ফাইল উদ্ধৃতি টীকা।
ফাইলটির URI।
ফাইলটির নাম।
পাঠ্যের একটি অংশের উৎস উল্লেখ করা হয়েছে।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "file_citation" এ সেট করা থাকে।
প্রতিক্রিয়ার যে অংশটি এই উৎসের বলে গণ্য করা হয়েছে, তার শুরু।
আরোপিত অংশের সমাপ্তি, স্বতন্ত্র।
স্থান উদ্ধৃতি
স্থান উদ্ধৃতি টীকা।
স্থানটির আইডি, `places/{place_id}` ফরম্যাটে।
স্থানটির নাম।
স্থানটির URI রেফারেন্স।
পর্যালোচনা_স্নিপেট পর্যালোচনাস্নিপেট (ঐচ্ছিক)
গুগল ম্যাপসে কোনো নির্দিষ্ট স্থানের বৈশিষ্ট্য সম্পর্কে উত্তর তৈরি করতে ব্যবহৃত পর্যালোচনার অংশবিশেষ।
ক্ষেত্র
পর্যালোচনার শিরোনাম।
গুগল ম্যাপস-এ ব্যবহারকারীর পর্যালোচনার সাথে সম্পর্কিত একটি লিঙ্ক।
রিভিউ স্নিপেটটির আইডি।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "place_citation" এ সেট করা থাকে।
প্রতিক্রিয়ার যে অংশটি এই উৎসের বলে গণ্য করা হয়েছে, তার শুরু।
আরোপিত অংশের সমাপ্তি, স্বতন্ত্র।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "text" হিসেবে সেট করা থাকে।
ছবির বিষয়বস্তু
একটি চিত্র বিষয়বস্তু ব্লক।
ছবির বিষয়বস্তু।
ছবিটির URI।
ছবিটির মাইম টাইপ।
সম্ভাব্য মানসমূহ:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif
রেজোলিউশন মিডিয়ারেজোলিউশন (ঐচ্ছিক)
গণমাধ্যমের সংকল্প।
সম্ভাব্য মানসমূহ:
-
low -
medium -
high -
ultra_high
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "image" হিসেবে সেট করা থাকে।
অডিও কন্টেন্ট
একটি অডিও কন্টেন্ট ব্লক।
অডিও বিষয়বস্তু।
অডিওটির URI।
অডিওটির মাইম টাইপ।
সম্ভাব্য মানসমূহ:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "audio" তে সেট করা থাকে।
ডকুমেন্টের বিষয়বস্তু
একটি ডকুমেন্ট কন্টেন্ট ব্লক।
নথির বিষয়বস্তু।
ডকুমেন্টটির URI।
ডকুমেন্টটির মাইম টাইপ।
সম্ভাব্য মানসমূহ:
-
application/pdf
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "document" এ সেট করা থাকে।
ভিডিও কন্টেন্ট
একটি ভিডিও কন্টেন্ট ব্লক।
ভিডিওটির বিষয়বস্তু।
ভিডিওটির ইউআরআই।
ভিডিওটির মূকাভিনয়ের ধরণ।
সম্ভাব্য মানসমূহ:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
রেজোলিউশন মিডিয়ারেজোলিউশন (ঐচ্ছিক)
গণমাধ্যমের সংকল্প।
সম্ভাব্য মানসমূহ:
-
low -
medium -
high -
ultra_high
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "video" -তে সেট করা থাকে।
চিন্তার বিষয়বস্তু
চিন্তায় প্রতিবন্ধকতা।
জেনারেশনের অংশ হতে হলে সিগনেচারটি ব্যাকএন্ড সোর্সের সাথে মিলতে হবে।
সারাংশ, চিন্তার সারসংক্ষেপ, বিষয়বস্তু (ঐচ্ছিক)
চিন্তাভাবনার সারসংক্ষেপ।
সম্ভাব্য প্রকার
পলিমরফিক ডিসক্রিমিনেটর: type
টেক্সট কন্টেন্ট
একটি টেক্সট কন্টেন্ট ব্লক।
পাঠ্য বিষয়বস্তু।
টীকা (ঐচ্ছিক )
মডেল-সৃষ্ট কন্টেন্টের জন্য উদ্ধৃতি তথ্য।
সম্ভাব্য প্রকার
পলিমরফিক ডিসক্রিমিনেটর: type
ইউআরএল উদ্ধৃতি
ইউআরএল উদ্ধৃতি টীকা।
ইউআরএল।
ইউআরএল-এর শিরোনাম।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "url_citation" এ সেট করা থাকে।
প্রতিক্রিয়ার যে অংশটি এই উৎসের বলে গণ্য করা হয়েছে, তার শুরু।
আরোপিত অংশের সমাপ্তি, স্বতন্ত্র।
ফাইল উদ্ধৃতি
ফাইল উদ্ধৃতি টীকা।
ফাইলটির URI।
ফাইলটির নাম।
পাঠ্যের একটি অংশের উৎস উল্লেখ করা হয়েছে।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "file_citation" এ সেট করা থাকে।
প্রতিক্রিয়ার যে অংশটি এই উৎসের বলে গণ্য করা হয়েছে, তার শুরু।
আরোপিত অংশের সমাপ্তি, স্বতন্ত্র।
স্থান উদ্ধৃতি
স্থান উদ্ধৃতি টীকা।
স্থানটির আইডি, `places/{place_id}` ফরম্যাটে।
স্থানটির নাম।
স্থানটির URI রেফারেন্স।
পর্যালোচনা_স্নিপেট পর্যালোচনাস্নিপেট (ঐচ্ছিক)
গুগল ম্যাপসে কোনো নির্দিষ্ট স্থানের বৈশিষ্ট্য সম্পর্কে উত্তর তৈরি করতে ব্যবহৃত পর্যালোচনার অংশবিশেষ।
ক্ষেত্র
পর্যালোচনার শিরোনাম।
গুগল ম্যাপস-এ ব্যবহারকারীর পর্যালোচনার সাথে সম্পর্কিত একটি লিঙ্ক।
রিভিউ স্নিপেটটির আইডি।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "place_citation" এ সেট করা থাকে।
প্রতিক্রিয়ার যে অংশটি এই উৎসের বলে গণ্য করা হয়েছে, তার শুরু।
আরোপিত অংশের সমাপ্তি, স্বতন্ত্র।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "text" হিসেবে সেট করা থাকে।
ছবির বিষয়বস্তু
একটি চিত্র বিষয়বস্তু ব্লক।
ছবির বিষয়বস্তু।
ছবিটির URI।
ছবিটির মাইম টাইপ।
সম্ভাব্য মানসমূহ:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif
রেজোলিউশন মিডিয়ারেজোলিউশন (ঐচ্ছিক)
গণমাধ্যমের সংকল্প।
সম্ভাব্য মানসমূহ:
-
low -
medium -
high -
ultra_high
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "image" হিসেবে সেট করা থাকে।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "thought" অবস্থায় সেট করা থাকে।
ফাংশনকলকন্টেন্ট
একটি ফাংশন টুল কল কন্টেন্ট ব্লক।
যে টুলটিকে কল করতে হবে তার নাম।
ফাংশনে পাস করার জন্য আর্গুমেন্টগুলো।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "function_call" এ সেট করা থাকে।
এই নির্দিষ্ট টুল কলটির জন্য একটি অনন্য আইডি।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
ফাংশনফলাফলকন্টেন্ট
একটি ফাংশন টুলের ফলাফল কন্টেন্ট ব্লক।
যে যন্ত্রটিকে ডাকা হয়েছিল তার নাম।
টুল কলটির ফলে কোনো ত্রুটি ঘটেছে কিনা।
টুল কলের ফলাফল।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "function_result" -এ সেট করা থাকে।
ফাংশন কল ব্লকের আইডির সাথে মেলাতে হবে।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
কোডএক্সিকিউশনকলকন্টেন্ট
কোড নির্বাহের বিষয়বস্তু।
আর্গুমেন্টস CodeExecutionCallArguments (প্রয়োজনীয়)
কোড নির্বাহের জন্য আর্গুমেন্টগুলো প্রেরণ করতে হবে।
ক্ষেত্র
`কোড`-এর প্রোগ্রামিং ভাষা।
সম্ভাব্য মানসমূহ:
-
python
যে কোডটি কার্যকর করা হবে।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "code_execution_call" এ সেট করা থাকে।
এই নির্দিষ্ট টুল কলটির জন্য একটি অনন্য আইডি।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
কোডএক্সিকিউশনরেজাল্টকন্টেন্ট
কোড নির্বাহের ফলাফলের বিষয়বস্তু।
কোড নির্বাহের ফলাফল।
কোড নির্বাহের ফলে কোনো ত্রুটি ঘটেছে কিনা।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "code_execution_result" এ সেট করা থাকে।
কোড এক্সিকিউশন কল ব্লকের আইডির সাথে মেলাতে হবে।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
UrlContextCallContent
URL প্রাসঙ্গিক বিষয়বস্তু।
আর্গুমেন্টস UrlContextCallArguments (প্রয়োজনীয়)
URL কনটেক্সটে পাস করার জন্য আর্গুমেন্টগুলো।
ক্ষেত্র
যে ইউআরএলগুলো আনতে হবে।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "url_context_call" এ সেট করা থাকে।
এই নির্দিষ্ট টুল কলটির জন্য একটি অনন্য আইডি।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
UrlContextResultContent
URL প্রসঙ্গের ফলাফলের বিষয়বস্তু।
ফলাফল UrlContextResult (প্রয়োজনীয়)
ইউআরএল কনটেক্সটের ফলাফল।
ক্ষেত্র
যে ইউআরএলটি আনা হয়েছিল।
ইউআরএল পুনরুদ্ধারের অবস্থা।
সম্ভাব্য মানসমূহ:
-
success -
error -
paywall -
unsafe
ইউআরএল প্রেক্ষাপটে কোনো ত্রুটি ঘটেছে কিনা।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "url_context_result" এ সেট করা থাকে।
ইউআরএল কনটেক্সট কল ব্লক থেকে প্রাপ্ত আইডির সাথে মিলতে হবে।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
GoogleSearchCallContent
গুগল সার্চের বিষয়বস্তু।
আর্গুমেন্টস GoogleSearchCallArguments (প্রয়োজনীয়)
গুগল সার্চে পাঠানোর জন্য আর্গুমেন্টগুলো।
ক্ষেত্র
পরবর্তী ওয়েব অনুসন্ধানের জন্য ওয়েব অনুসন্ধান প্রশ্নাবলী।
অনুসন্ধানের ধরণটি সক্রিয় করা হয়েছে।
সম্ভাব্য মানসমূহ:
-
web_search -
image_search
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "google_search_call" এ সেট করা থাকে।
এই নির্দিষ্ট টুল কলটির জন্য একটি অনন্য আইডি।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
GoogleSearchResultContent
গুগল অনুসন্ধানের ফলাফলের বিষয়বস্তু।
ফলাফল GoogleSearchResult (আবশ্যক)
গুগল অনুসন্ধানের ফলাফল।
ক্ষেত্র
ওয়েব কন্টেন্ট স্নিপেট যা একটি ওয়েব পেজ বা অ্যাপ ওয়েবভিউতে এমবেড করা যায়।
গুগল অনুসন্ধানে কোনো ত্রুটি হয়েছে কিনা।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "google_search_result" এ সেট করা থাকে।
গুগল সার্চ কল ব্লক থেকে প্রাপ্ত আইডির সাথে মেলানোর জন্য আইডি।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
McpServerToolCallContent
MCPServer টুল কলের বিষয়বস্তু।
যে যন্ত্রটিকে ডাকা হয়েছিল তার নাম।
ব্যবহৃত এমসিপি সার্ভারটির নাম।
ফাংশনটির আর্গুমেন্টগুলোর JSON অবজেক্ট।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "mcp_server_tool_call" এ সেট করা থাকে।
এই নির্দিষ্ট টুল কলটির জন্য একটি অনন্য আইডি।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
McpServerToolResultContent
MCPServer টুলের ফলাফলের বিষয়বস্তু।
এই নির্দিষ্ট টুল কলটির জন্য যে টুলটিকে ডাকা হয়, তার নাম।
ব্যবহৃত এমসিপি সার্ভারটির নাম।
MCP সার্ভার কল থেকে প্রাপ্ত আউটপুট। এটি সাধারণ টেক্সট বা তথ্যসমৃদ্ধ কন্টেন্ট হতে পারে।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "mcp_server_tool_result" -এ সেট করা থাকে।
এমসিপি সার্ভার টুল কল ব্লক থেকে প্রাপ্ত আইডির সাথে মেলাতে হবে।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
ফাইলসার্চকলকন্টেন্ট
ফাইল অনুসন্ধানের বিষয়বস্তু।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "file_search_call" এ সেট করা থাকে।
এই নির্দিষ্ট টুল কলটির জন্য একটি অনন্য আইডি।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
ফাইলসার্চরেজাল্টকন্টেন্ট
ফাইল অনুসন্ধানের ফলাফলের বিষয়বস্তু।
ফলাফল ফাইলসার্চরেজাল্ট (ঐচ্ছিক)
ফাইল অনুসন্ধানের ফলাফল।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "file_search_result" এ সেট করা থাকে।
ফাইল সার্চ কল ব্লক থেকে প্রাপ্ত আইডির সাথে মেলাতে হবে।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
GoogleMapsCallContent
গুগল ম্যাপস-এর বিষয়বস্তু।
আর্গুমেন্টস GoogleMapsCallArguments (ঐচ্ছিক)
গুগল ম্যাপস টুলে যে আর্গুমেন্টগুলো পাস করতে হবে।
ক্ষেত্র
যে কোয়েরিগুলো সম্পাদন করতে হবে।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "google_maps_call" এ সেট করা থাকে।
এই নির্দিষ্ট টুল কলটির জন্য একটি অনন্য আইডি।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
GoogleMapsResultContent
গুগল ম্যাপসের ফলাফলের বিষয়বস্তু।
ফলাফল GoogleMapsResult (প্রয়োজনীয়)
গুগল ম্যাপসের ফলাফল।
ক্ষেত্র
স্থানসমূহ ( ঐচ্ছিক)
যে স্থানগুলো খুঁজে পাওয়া গিয়েছিল।
ক্ষেত্র
স্থানটির আইডি, `places/{place_id}` ফরম্যাটে।
স্থানটির নাম।
স্থানটির URI রেফারেন্স।
পর্যালোচনা_স্নিপেট পর্যালোচনাস্নিপেট (ঐচ্ছিক)
গুগল ম্যাপসে কোনো নির্দিষ্ট স্থানের বৈশিষ্ট্য সম্পর্কে উত্তর তৈরি করতে ব্যবহৃত পর্যালোচনার অংশবিশেষ।
ক্ষেত্র
পর্যালোচনার শিরোনাম।
গুগল ম্যাপস-এ ব্যবহারকারীর পর্যালোচনার সাথে সম্পর্কিত একটি লিঙ্ক।
রিভিউ স্নিপেটটির আইডি।
গুগল ম্যাপস উইজেট কনটেক্সট টোকেনের রিসোর্স নাম।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "google_maps_result" এ সেট করা থাকে।
গুগল ম্যাপস কল ব্লকের আইডির সাথে মেলাতে হবে।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
উদাহরণ
পাঠ্য
{ "type": "text", "text": "Hello, how are you?" }
ছবি
{ "type": "image", "data": "BASE64_ENCODED_IMAGE", "mime_type": "image/png" }
অডিও
{ "type": "audio", "data": "BASE64_ENCODED_AUDIO", "mime_type": "audio/wav" }
নথি
{ "type": "document", "data": "BASE64_ENCODED_DOCUMENT", "mime_type": "application/pdf" }
ভিডিও
{ "type": "video", "uri": "https://www.youtube.com/watch?v=9hE5-98ZeCg" }
চিন্তা
{ "type": "thought", "summary": [ { "type": "text", "text": "The user is asking about the weather. I should use the get_weather tool." } ], "signature": "CoMDAXLI2nynRYojJIy6B1Jh9os2crpWLfB0+19xcLsGG46bd8wjkF/6RNlRUdvHrXyjsHkG0BZFcuO/bPOyA6Xh5jANNgx82wPHjGExN8A4ZQn56FlMwyZoqFVQz0QyY1lfibFJ2zU3J87uw26OewzcuVX0KEcs+GIsZa3EA6WwqhbsOd3wtZB3Ua2Qf98VAWZTS5y/tWpql7jnU3/CU7pouxQr/Bwft3hwnJNesQ9/dDJTuaQ8Zprh9VRWf1aFFjpIueOjBRrlT3oW6/y/eRl/Gt9BQXCYTqg/38vHFUU4Wo/d9dUpvfCe/a3o97t2Jgxp34oFKcsVb4S5WJrykIkw+14DzVnTpCpbQNFckqvFLuqnJCkL0EQFtunBXI03FJpPu3T1XU6id8S7ojoJQZSauGUCgmaLqUGdMrd08oo81ecoJSLs51Re9N/lISGmjWFPGpqJLoGq6uo4FHz58hmeyXCgHG742BHz2P3MiH1CXHUT2J8mF6zLhf3SR9Qb3lkrobAh" }
ফাংশন কল
{ "type": "function_call", "name": "get_weather", "id": "gth23981", "arguments": { "location": "Boston, MA" } }
ফাংশন ফলাফল
{ "type": "function_result", "name": "get_weather", "call_id": "gth23981", "result": [ { "type": "text", "text": "{\"weather\":\"sunny\"}" } ] }
কোড এক্সিকিউশন কল
{ "type": "code_execution_call", "id": "call_123456", "arguments": { "language": "python", "code": "print('hello world')" } }
কোড নির্বাহের ফলাফল
{ "type": "code_execution_result", "call_id": "call_123456", "result": "hello world" }
ইউআরএল কনটেক্সট কল
{ "type": "url_context_call", "id": "call_123456", "arguments": { "urls": [ "https://www.example.com" ] } }
ইউআরএল প্রসঙ্গ ফলাফল
{ "type": "url_context_result", "call_id": "call_123456", "result": [ { "url": "https://www.example.com", "status": "SUCCESS" } ] }
গুগল সার্চ কল
{ "type": "google_search_call", "id": "call_123456", "arguments": { "queries": [ "weather in Boston" ] } }
গুগল অনুসন্ধানের ফলাফল
{ "type": "google_search_result", "call_id": "call_123456", "result": [ { "url": "https://www.google.com/search?q=weather+in+Boston", "title": "Weather in Boston" } ] }
এমসিপি সার্ভার টুল কল
{ "type": "mcp_server_tool_call", "id": "call_123456", "name": "get_forecast", "server_name": "weather_server", "arguments": { "city": "London" } }
এমসিপি সার্ভার টুলের ফলাফল
{ "type": "mcp_server_tool_result", "name": "get_forecast", "server_name": "weather_server", "call_id": "call_123456", "result": "sunny" }
ফাইল অনুসন্ধান কল
{ "type": "file_search_call", "id": "call_123456" }
ফাইল অনুসন্ধানের ফলাফল
{ "type": "file_search_result", "call_id": "call_123456", "result": [ { "text": "search result chunk", "file_search_store": "file_search_store" } ] }
গুগল ম্যাপস কল
{ "type": "google_maps_call", "id": "call_123456", "arguments": { "query": "best food near me" } }
গুগল ম্যাপস ফলাফল
{ "type": "google_maps_result", "call_id": "call_123456", "result": [ { "places": [ { "url": "https://www.google.com/maps/search/best+food+near+me", "name": "Tasty Restaurant" } ] } ] }
টুল
সম্ভাব্য প্রকার
পলিমরফিক ডিসক্রিমিনেটর: type
ফাংশন
একটি সরঞ্জাম যা মডেল ব্যবহার করতে পারে।
ফাংশনটির নাম।
ফাংশনটির বর্ণনা।
ফাংশনের প্যারামিটারগুলোর জন্য JSON স্কিমা।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "function" এ সেট করা থাকে।
গুগল অনুসন্ধান
একটি টুল যা মডেল গুগলে অনুসন্ধান করার জন্য ব্যবহার করতে পারে।
সক্ষম করার জন্য অনুসন্ধানের ভিত্তি স্থাপনের প্রকারভেদ।
সম্ভাব্য মানসমূহ:
-
web_search -
image_search
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "google_search" এ সেট করা থাকে।
কোডএক্সিকিউশন
এমন একটি টুল যা মডেল কোড কার্যকর করার জন্য ব্যবহার করতে পারে।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "code_execution" এ সেট করা থাকে।
ইউআরএলপ্রসঙ্গ
একটি টুল যা মডেল ইউআরএল কনটেক্সট সংগ্রহ করতে ব্যবহার করতে পারে।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "url_context" এ সেট করা থাকে।
কম্পিউটার ব্যবহার
এমন একটি সরঞ্জাম যা মডেলটি কম্পিউটারের সাথে যোগাযোগ করার জন্য ব্যবহার করতে পারে।
যে পরিবেশটি পরিচালিত হচ্ছে।
সম্ভাব্য মানসমূহ:
-
browser
পূর্বনির্ধারিত ফাংশনগুলোর তালিকা, যেগুলো মডেল কল থেকে বাদ দেওয়া হয়েছে।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "computer_use" এ সেট করা থাকে।
McpServer
MCPServer হলো এমন একটি সার্ভার যাকে মডেল বিভিন্ন কাজ সম্পাদনের জন্য আহ্বান করতে পারে।
MCPServer-টির নাম।
MCPServer এন্ডপয়েন্টের সম্পূর্ণ URL। উদাহরণ: "https://api.example.com/mcp"
ঐচ্ছিক: প্রয়োজন হলে অথেনটিকেশন হেডার, টাইমআউট ইত্যাদির জন্য ফিল্ড।
অনুমোদিত_সরঞ্জাম অনুমোদিত সরঞ্জাম (ঐচ্ছিক)
অনুমোদিত সরঞ্জামগুলো।
ক্ষেত্র
মোড টুলচয়েসটাইপ (ঐচ্ছিক)
সরঞ্জাম নির্বাচনের ধরণ।
সম্ভাব্য মানসমূহ:
-
auto -
any -
none -
validated
অনুমোদিত সরঞ্জামগুলোর নাম।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "mcp_server" -এ সেট করা থাকে।
ফাইলসার্চ
একটি টুল যা মডেল ফাইল অনুসন্ধানের জন্য ব্যবহার করতে পারে।
ফাইল সার্চ স্টোরটি অনুসন্ধানের জন্য নামগুলো সংরক্ষণ করে।
পুনরুদ্ধার করার জন্য শব্দার্থিক পুনরুদ্ধার খণ্ডের সংখ্যা।
সিমান্টিক রিট্রিভাল ডকুমেন্ট এবং চাঙ্কগুলিতে প্রয়োগ করার জন্য মেটাডেটা ফিল্টার।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "file_search" এ সেট করা থাকে।
গুগলম্যাপস
একটি টুল যা মডেলটি গুগল ম্যাপস চালু করার জন্য ব্যবহার করতে পারে।
রেসপন্সের টুল কল রেজাল্টে উইজেট কনটেক্সট টোকেন ফেরত দেওয়া হবে কিনা।
ব্যবহারকারীর অবস্থানের অক্ষাংশ।
ব্যবহারকারীর অবস্থানের দ্রাঘিমাংশ।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "google_maps" এ সেট করা থাকে।
উদাহরণ
ফাংশন
গুগল অনুসন্ধান
কোডএক্সিকিউশন
ইউআরএলপ্রসঙ্গ
কম্পিউটার ব্যবহার
McpServer
ফাইলসার্চ
গুগলম্যাপস
পালা
ক্ষেত্র
এই চালের প্রবর্তক। ইনপুটের জন্য অবশ্যই ব্যবহারকারী অথবা মডেল আউটপুটের জন্য মডেল হতে হবে।
মোড়ের বিষয়বস্তু।
উদাহরণ
ব্যবহারকারীর পালা
{ "role": "user", "content": [ { "type": "text", "text": "user turn" } ] }
মডেল টার্ন
{ "role": "model", "content": [ { "type": "text", "text": "model turn" } ] }
ইন্টারঅ্যাকশনএসএসইইভেন্ট
সম্ভাব্য প্রকার
পলিমরফিক ডিসক্রিমিনেটর: event_type
ইন্টারঅ্যাকশনস্টার্টইভেন্ট
কোনো বিবরণ দেওয়া হয়নি।
কোনো বিবরণ দেওয়া হয়নি।
সম্ভাব্য মানসমূহ:
-
interaction.start
এই ইভেন্ট থেকে ইন্টারঅ্যাকশন স্ট্রিম পুনরায় শুরু করার জন্য ব্যবহৃত ইভেন্ট_আইডি টোকেন।
ইন্টারঅ্যাকশনকমপ্লিটইভেন্ট
পেলোড সাইজ কমানোর জন্য খালি আউটপুট সহ ইন্টারঅ্যাকশন সম্পন্ন করা হয়েছে। প্রকৃত আউটপুটের জন্য পূর্ববর্তী ContentDelta ইভেন্টগুলো ব্যবহার করুন।
কোনো বিবরণ দেওয়া হয়নি।
সম্ভাব্য মানসমূহ:
-
interaction.complete
এই ইভেন্ট থেকে ইন্টারঅ্যাকশন স্ট্রিম পুনরায় শুরু করার জন্য ব্যবহৃত ইভেন্ট_আইডি টোকেন।
ইন্টারঅ্যাকশন স্ট্যাটাস আপডেট
কোনো বিবরণ দেওয়া হয়নি।
কোনো বিবরণ দেওয়া হয়নি।
সম্ভাব্য মানসমূহ:
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "interaction.status_update" এ সেট করা থাকে।
The event_id token to be used to resume the interaction stream, from this event.
ContentStart
No description provided.
No description provided.
No description provided.
Always set to "content.start" .
The event_id token to be used to resume the interaction stream, from this event.
ContentDelta
No description provided.
delta object (required)
No description provided.
Possible Types
Polymorphic discriminator: type
TextDelta
No description provided.
annotations Annotation (optional)
Citation information for model-generated content.
Possible Types
Polymorphic discriminator: type
UrlCitation
A URL citation annotation.
The URL.
The title of the URL.
No description provided.
Always set to "url_citation" .
Start of segment of the response that is attributed to this source.
End of the attributed segment, exclusive.
FileCitation
A file citation annotation.
The URI of the file.
The name of the file.
Source attributed for a portion of the text.
No description provided.
Always set to "file_citation" .
Start of segment of the response that is attributed to this source.
End of the attributed segment, exclusive.
PlaceCitation
A place citation annotation.
The ID of the place, in `places/{place_id}` format.
Title of the place.
URI reference of the place.
review_snippets ReviewSnippet (optional)
Snippets of reviews that are used to generate answers about the features of a given place in Google Maps.
ক্ষেত্র
Title of the review.
A link that corresponds to the user review on Google Maps.
The ID of the review snippet.
No description provided.
Always set to "place_citation" .
Start of segment of the response that is attributed to this source.
End of the attributed segment, exclusive.
No description provided.
Always set to "text" .
ImageDelta
No description provided.
No description provided.
No description provided.
Possible values:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif
resolution MediaResolution (optional)
The resolution of the media.
Possible values:
-
low -
medium -
high -
ultra_high
No description provided.
Always set to "image" .
AudioDelta
No description provided.
No description provided.
No description provided.
Possible values:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac
No description provided.
Always set to "audio" .
DocumentDelta
No description provided.
No description provided.
No description provided.
Possible values:
-
application/pdf
No description provided.
Always set to "document" .
VideoDelta
No description provided.
No description provided.
No description provided.
Possible values:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
resolution MediaResolution (optional)
The resolution of the media.
Possible values:
-
low -
medium -
high -
ultra_high
No description provided.
Always set to "video" .
ThoughtSummaryDelta
content ThoughtSummaryContent (optional)
A new summary item to be added to the thought.
Possible Types
Polymorphic discriminator: type
TextContent
A text content block.
The text content.
annotations Annotation (optional)
Citation information for model-generated content.
Possible Types
Polymorphic discriminator: type
UrlCitation
A URL citation annotation.
The URL.
The title of the URL.
No description provided.
Always set to "url_citation" .
Start of segment of the response that is attributed to this source.
End of the attributed segment, exclusive.
FileCitation
A file citation annotation.
The URI of the file.
The name of the file.
Source attributed for a portion of the text.
No description provided.
Always set to "file_citation" .
Start of segment of the response that is attributed to this source.
End of the attributed segment, exclusive.
PlaceCitation
A place citation annotation.
The ID of the place, in `places/{place_id}` format.
Title of the place.
URI reference of the place.
review_snippets ReviewSnippet (optional)
Snippets of reviews that are used to generate answers about the features of a given place in Google Maps.
ক্ষেত্র
Title of the review.
A link that corresponds to the user review on Google Maps.
The ID of the review snippet.
No description provided.
Always set to "place_citation" .
Start of segment of the response that is attributed to this source.
End of the attributed segment, exclusive.
No description provided.
Always set to "text" .
ImageContent
An image content block.
The image content.
The URI of the image.
The mime type of the image.
Possible values:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif
resolution MediaResolution (optional)
The resolution of the media.
Possible values:
-
low -
medium -
high -
ultra_high
No description provided.
Always set to "image" .
No description provided.
Always set to "thought_summary" .
ThoughtSignatureDelta
Signature to match the backend source to be part of the generation.
No description provided.
Always set to "thought_signature" .
FunctionCallDelta
No description provided.
No description provided.
No description provided.
Always set to "function_call" .
A unique ID for this specific tool call.
A signature hash for backend validation.
FunctionResultDelta
No description provided.
No description provided.
Tool call result delta.
No description provided.
Always set to "function_result" .
ID to match the ID from the function call block.
A signature hash for backend validation.
CodeExecutionCallDelta
arguments CodeExecutionCallArguments (required)
No description provided.
ক্ষেত্র
Programming language of the `code`.
Possible values:
-
python
The code to be executed.
No description provided.
Always set to "code_execution_call" .
A unique ID for this specific tool call.
A signature hash for backend validation.
CodeExecutionResultDelta
No description provided.
No description provided.
No description provided.
Always set to "code_execution_result" .
ID to match the ID from the function call block.
A signature hash for backend validation.
UrlContextCallDelta
arguments UrlContextCallArguments (required)
No description provided.
ক্ষেত্র
The URLs to fetch.
No description provided.
Always set to "url_context_call" .
A unique ID for this specific tool call.
A signature hash for backend validation.
UrlContextResultDelta
result UrlContextResult (required)
No description provided.
ক্ষেত্র
The URL that was fetched.
The status of the URL retrieval.
Possible values:
-
success -
error -
paywall -
unsafe
No description provided.
No description provided.
Always set to "url_context_result" .
ID to match the ID from the function call block.
A signature hash for backend validation.
GoogleSearchCallDelta
arguments GoogleSearchCallArguments (required)
No description provided.
ক্ষেত্র
Web search queries for the following-up web search.
No description provided.
Always set to "google_search_call" .
A unique ID for this specific tool call.
A signature hash for backend validation.
GoogleSearchResultDelta
result GoogleSearchResult (required)
No description provided.
ক্ষেত্র
Web content snippet that can be embedded in a web page or an app webview.
No description provided.
No description provided.
Always set to "google_search_result" .
ID to match the ID from the function call block.
A signature hash for backend validation.
McpServerToolCallDelta
No description provided.
No description provided.
No description provided.
No description provided.
Always set to "mcp_server_tool_call" .
A unique ID for this specific tool call.
A signature hash for backend validation.
McpServerToolResultDelta
No description provided.
No description provided.
Tool call result delta.
No description provided.
Always set to "mcp_server_tool_result" .
ID to match the ID from the function call block.
A signature hash for backend validation.
FileSearchCallDelta
No description provided.
Always set to "file_search_call" .
A unique ID for this specific tool call.
A signature hash for backend validation.
FileSearchResultDelta
result FileSearchResult (optional)
No description provided.
No description provided.
Always set to "file_search_result" .
ID to match the ID from the function call block.
A signature hash for backend validation.
GoogleMapsCallDelta
arguments GoogleMapsCallArguments (optional)
The arguments to pass to the Google Maps tool.
ক্ষেত্র
The queries to be executed.
No description provided.
Always set to "google_maps_call" .
A unique ID for this specific tool call.
A signature hash for backend validation.
GoogleMapsResultDelta
result GoogleMapsResult (required)
The results of the Google Maps.
ক্ষেত্র
places Places (optional)
The places that were found.
ক্ষেত্র
The ID of the place, in `places/{place_id}` format.
Title of the place.
URI reference of the place.
review_snippets ReviewSnippet (optional)
Snippets of reviews that are used to generate answers about the features of a given place in Google Maps.
ক্ষেত্র
Title of the review.
A link that corresponds to the user review on Google Maps.
The ID of the review snippet.
Resource name of the Google Maps widget context token.
No description provided.
Always set to "google_maps_result" .
ID to match the ID from the function call block.
A signature hash for backend validation.
No description provided.
Always set to "content.delta" .
The event_id token to be used to resume the interaction stream, from this event.
ContentStop
No description provided.
No description provided.
Always set to "content.stop" .
The event_id token to be used to resume the interaction stream, from this event.
ErrorEvent
error Error (optional)
No description provided.
ক্ষেত্র
A URI that identifies the error type.
A human-readable error message.
No description provided.
Always set to "error" .
The event_id token to be used to resume the interaction stream, from this event.
উদাহরণ
Interaction Start
{ "event_type": "interaction.start", "interaction": { "id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM", "model": "gemini-3-flash-preview", "object": "interaction", "status": "in_progress" } }
Interaction Complete
{ "event_type": "interaction.complete", "interaction": { "created": "2025-12-09T18:45:40Z", "id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM", "model": "gemini-3-flash-preview", "object": "interaction", "role": "model", "status": "completed", "updated": "2025-12-09T18:45:40Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 11 } ], "total_cached_tokens": 0, "total_input_tokens": 11, "total_output_tokens": 364, "total_thought_tokens": 1120, "total_tokens": 1495, "total_tool_use_tokens": 0 } } }
Interaction Status Update
{ "event_type": "interaction.status_update", "interaction_id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM", "status": "in_progress" }
Content Start
{ "event_type": "content.start", "content": { "type": "text" }, "index": 1 }
Content Delta
{ "event_type": "content.delta", "delta": { "type": "text", "text": "Elara\u2019s life was a symphony of quiet moments. A librarian, she found solace in the hushed aisles, the scent of aged paper, and the predictable rhythm of her days. Her small apartment, meticulously ordered, reflected this internal calm, save" }, "index": 1 }
Content Stop
{ "event_type": "content.stop", "index": 1 }
Error Event
{ "event_type": "error", "error": { "message": "Failed to get completed interaction: Result not found.", "code": "not_found" } }
অন্য কিছু উল্লেখ না করা থাকলে, এই পৃষ্ঠার কন্টেন্ট Creative Commons Attribution 4.0 License-এর অধীনে এবং কোডের নমুনাগুলি Apache 2.0 License-এর অধীনে লাইসেন্স প্রাপ্ত। আরও জানতে, Google Developers সাইট নীতি দেখুন। Java হল Oracle এবং/অথবা তার অ্যাফিলিয়েট সংস্থার রেজিস্টার্ড ট্রেডমার্ক।
2026-03-18 UTC-তে শেষবার আপডেট করা হয়েছে।