জেমিনি ইন্টারঅ্যাকশনস এপিআই হলো একটি পরীক্ষামূলক এপিআই যা ডেভেলপারদের জেমিনি মডেল ব্যবহার করে জেনারেটিভ এআই অ্যাপ্লিকেশন তৈরি করতে সাহায্য করে। জেমিনি আমাদের সবচেয়ে সক্ষম মডেল, যা একেবারে গোড়া থেকে মাল্টিমোডাল হওয়ার জন্য তৈরি করা হয়েছে। এটি ভাষা, ছবি, অডিও, ভিডিও এবং কোড সহ বিভিন্ন ধরণের তথ্যকে সাধারণীকরণ করতে, নির্বিঘ্নে বুঝতে, সেগুলোর মধ্যে কাজ করতে এবং একত্রিত করতে পারে। আপনি টেক্সট এবং ছবির মধ্যে যুক্তি স্থাপন, কন্টেন্ট তৈরি, ডায়ালগ এজেন্ট, সারসংক্ষেপ এবং শ্রেণিবিন্যাস সিস্টেম এবং আরও অনেক কিছুর মতো ক্ষেত্রে জেমিনি এপিআই ব্যবহার করতে পারেন।
একটি মিথস্ক্রিয়া তৈরি করা
একটি নতুন মিথস্ক্রিয়া তৈরি করে।
অনুরোধকারী শরীর
অনুরোধের মূল অংশে নিম্নলিখিত কাঠামোসহ ডেটা থাকে:
মডেল মডেলঅপশন (ঐচ্ছিক)
ইন্টারঅ্যাকশনটি তৈরি করতে ব্যবহৃত `মডেল`-এর নাম।
`agent` প্রদান করা না হলে এটি আবশ্যক।
সম্ভাব্য মানসমূহ:
-
gemini-2.5-computer-use-preview-10-2025সরাসরি ইন্টারফেস ইন্টারঅ্যাকশনের জন্য ডিজাইন করা একটি সক্রিয় সক্ষমতা মডেল, যা জেমিনিকে ডিজিটাল পরিবেশ উপলব্ধি করতে এবং তাতে চলাচল করতে সক্ষম করে।
-
gemini-2.5-flashআমাদের প্রথম হাইব্রিড রিজনিং মডেল যা ১ মিলিয়ন টোকেন কনটেক্সট উইন্ডো এবং থিংকিং বাজেট সমর্থন করে।
-
gemini-2.5-flash-imageআমাদের নিজস্ব ইমেজ জেনারেশন মডেলটি গতি, নমনীয়তা এবং প্রাসঙ্গিকতা বোঝার জন্য অপ্টিমাইজ করা হয়েছে। টেক্সট ইনপুট এবং আউটপুটের মূল্য ২.৫ ফ্ল্যাশের সমান।
-
gemini-2.5-flash-liteআমাদের সবচেয়ে ছোট এবং সবচেয়ে সাশ্রয়ী মডেল, যা ব্যাপক ব্যবহারের জন্য নির্মিত।
-
gemini-2.5-flash-lite-preview-09-2025জেমিনি ২.৫ ফ্ল্যাশ লাইট-এর উপর ভিত্তি করে তৈরি সর্বাধুনিক মডেলটি ব্যয়-সাশ্রয়, উচ্চ কার্যক্ষমতা এবং উচ্চ মানের জন্য বিশেষভাবে অপ্টিমাইজ করা হয়েছে।
-
gemini-2.5-flash-native-audio-preview-12-2025আমাদের নেটিভ অডিও মডেলগুলো উন্নত গতি, কণ্ঠস্বরের স্বাভাবিকতা, বিশদ বিবরণ এবং মেজাজ সহ উচ্চতর মানের অডিও আউটপুটের জন্য অপ্টিমাইজ করা হয়েছে।
-
gemini-2.5-flash-preview-09-2025২.৫ ফ্ল্যাশ মডেলের উপর ভিত্তি করে তৈরি সর্বশেষ মডেল। ২.৫ ফ্ল্যাশ প্রিভিউ বৃহৎ পরিসরের প্রসেসিং, স্বল্প-লেটেন্সি, চিন্তাভাবনার প্রয়োজন এমন বিপুল পরিমাণ কাজ এবং এজেন্টিক ব্যবহারের ক্ষেত্রে সর্বোত্তম।
-
gemini-2.5-flash-preview-ttsআমাদের ২.৫ ফ্ল্যাশ টেক্সট-টু-স্পিচ মডেলটি শক্তিশালী, স্বল্প-বিলম্বের এবং নিয়ন্ত্রণযোগ্য বাক্ তৈরির জন্য অপ্টিমাইজ করা হয়েছে।
-
gemini-2.5-proআমাদের সর্বাধুনিক বহুমুখী মডেল, যা কোডিং এবং জটিল যুক্তিনির্ভর কাজে অত্যন্ত পারদর্শী।
-
gemini-2.5-pro-preview-ttsআমাদের ২.৫ প্রো টেক্সট-টু-স্পিচ অডিও মডেলটি শক্তিশালী ও স্বল্প-বিলম্বের বক্তৃতা তৈরির জন্য অপ্টিমাইজ করা হয়েছে, যা আরও স্বাভাবিক আউটপুট এবং সহজে পরিচালনাযোগ্য প্রম্পট প্রদান করে।
-
gemini-3-flash-previewগতির জন্য নির্মিত আমাদের সবচেয়ে বুদ্ধিমান মডেল, যা অত্যাধুনিক বুদ্ধিমত্তার সাথে উন্নত অনুসন্ধান এবং ভূমিতে স্থিতিশীলতার সমন্বয় ঘটায়।
-
gemini-3-pro-image-previewসর্বাধুনিক চিত্র তৈরি ও সম্পাদনা মডেল।
-
gemini-3-pro-previewআমাদের সবচেয়ে বুদ্ধিমান মডেল, যার রয়েছে অত্যাধুনিক যুক্তিবোধ ও বহুবিধ উপলব্ধির ক্ষমতা এবং শক্তিশালী সক্রিয় ও ভাব সংকেতায়নের সক্ষমতা।
-
gemini-3.1-pro-previewআমাদের সর্বাধুনিক অত্যাধুনিক রিজনিং মডেল, যা অভূতপূর্ব গভীরতা ও সূক্ষ্মতা এবং শক্তিশালী মাল্টিমোডাল আন্ডারস্ট্যান্ডিং ও কোডিং সক্ষমতাসম্পন্ন।
-
gemini-3.1-flash-image-previewফ্ল্যাশের গতির দক্ষতা এবং বাস্তবতার উপর ভিত্তি করে তৈরির ক্ষমতাসহ পেশাদার স্তরের ভিজ্যুয়াল ইন্টেলিজেন্স।
-
gemini-3.1-flash-lite-previewআমাদের সবচেয়ে সাশ্রয়ী মডেল, যা বিপুল পরিমাণ এজেন্টিক কাজ, অনুবাদ এবং সাধারণ ডেটা প্রক্রিয়াকরণের জন্য অপ্টিমাইজ করা হয়েছে।
-
gemini-3.1-flash-tts-previewজেমিনি ৩.১ ফ্ল্যাশ টিটিএস: শক্তিশালী, স্বল্প-বিলম্বের বক্তৃতা তৈরি। স্বাভাবিক আউটপুট, নিয়ন্ত্রণযোগ্য প্রম্পট এবং নির্ভুল বর্ণনা নিয়ন্ত্রণের জন্য নতুন অভিব্যক্তিপূর্ণ অডিও ট্যাগ উপভোগ করুন।
-
lyria-3-clip-previewআমাদের স্বল্প-বিলম্বের সঙ্গীত তৈরির মডেলটি উচ্চ-মানের অডিও ক্লিপ এবং সুনির্দিষ্ট ছন্দ নিয়ন্ত্রণের জন্য অপ্টিমাইজ করা হয়েছে।
-
lyria-3-pro-previewগভীর সুরসৃষ্টিগত বোধসম্পন্ন আমাদের উন্নত, পূর্ণাঙ্গ গান তৈরির জেনারেটিভ মডেলটি, বিভিন্ন সঙ্গীত শৈলীতে সুনির্দিষ্ট কাঠামোগত নিয়ন্ত্রণ এবং জটিল রূপান্তরের জন্য সর্বোত্তমভাবে প্রস্তুত করা হয়েছে।
এজেন্ট এজেন্টঅপশন (ঐচ্ছিক)
ইন্টারঅ্যাকশনটি তৈরি করতে ব্যবহৃত 'এজেন্ট'-এর নাম।
`model` প্রদান করা না হলে এটি আবশ্যক।
সম্ভাব্য মানসমূহ:
-
deep-research-pro-preview-12-2025জেমিনি ডিপ রিসার্চ এজেন্ট
-
deep-research-preview-04-2026জেমিনি ডিপ রিসার্চ এজেন্ট
-
deep-research-max-preview-04-2026জেমিনি ডিপ রিসার্চ ম্যাক্স এজেন্ট
মিথস্ক্রিয়ার জন্য প্রয়োজনীয় উপাদানসমূহ (যা মডেল এবং এজেন্ট উভয়ের জন্যই প্রযোজ্য)।
মিথস্ক্রিয়ার জন্য সিস্টেম নির্দেশাবলী।
ইন্টারঅ্যাকশনের সময় মডেলটি যেসব টুল ডিক্লারেশন কল করতে পারে, তার একটি তালিকা।
এটি নিশ্চিত করে যে তৈরি হওয়া প্রতিক্রিয়াটি একটি JSON অবজেক্ট হবে যা এই ফিল্ডে নির্দিষ্ট করা JSON স্কিমা মেনে চলে।
রেসপন্সের MIME টাইপ। response_format সেট করা থাকলে এটি আবশ্যক।
শুধুমাত্র ইনপুট। কথোপকথনটি স্ট্রিম করা হবে কিনা।
শুধুমাত্র ইনপুট। প্রতিক্রিয়া এবং অনুরোধটি পরবর্তীতে পুনরুদ্ধারের জন্য সংরক্ষণ করা হবে কিনা।
শুধুমাত্র ইনপুট। মডেল ইন্টারঅ্যাকশনটি ব্যাকগ্রাউন্ডে চালানো হবে কিনা।
generation_config GenerationConfig (ঐচ্ছিক)
মডেল কনফিগারেশন
মডেলের সাথে মিথস্ক্রিয়ার জন্য কনফিগারেশন প্যারামিটারসমূহ।
`agent_config`-এর বিকল্প। শুধুমাত্র তখনই প্রযোজ্য যখন `model` সেট করা থাকে।
ক্ষেত্র
আউটপুটের এলোমেলোভাব নিয়ন্ত্রণ করে।
স্যাম্পলিং করার সময় বিবেচনা করার জন্য টোকেনগুলোর সর্বোচ্চ ক্রমবর্ধমান সম্ভাবনা।
পুনরুৎপাদনযোগ্যতার জন্য ডিকোডিং-এ ব্যবহৃত বীজ।
অক্ষর অনুক্রমের একটি তালিকা যা আউটপুট ইন্টারঅ্যাকশন বন্ধ করে দেবে।
চিন্তার স্তর ( ঐচ্ছিক)
মডেলটি যে পরিমাণ চিন্তার টোকেন তৈরি করবে।
সম্ভাব্য মানসমূহ:
-
minimal -
low -
medium -
high
চিন্তার সারসংক্ষেপ (ঐচ্ছিক)
উত্তরে চিন্তার সারাংশ অন্তর্ভুক্ত করা হবে কিনা।
সম্ভাব্য মানসমূহ:
-
auto -
none
প্রতিক্রিয়ায় অন্তর্ভুক্ত করার জন্য টোকেনের সর্বোচ্চ সংখ্যা।
speech_config SpeechConfig (ঐচ্ছিক)
মৌখিক যোগাযোগের জন্য কনফিগারেশন।
ক্ষেত্র
বক্তার কণ্ঠস্বর।
বক্তৃতার ভাষা।
বক্তার নাম অবশ্যই প্রম্পটে দেওয়া বক্তার নামের সাথে মিলতে হবে।
ইমেজ_কনফিগ ইমেজকনফিগ (ঐচ্ছিক)
ছবির সাথে মিথস্ক্রিয়ার জন্য কনফিগারেশন।
ক্ষেত্র
কোনো বিবরণ দেওয়া হয়নি।
সম্ভাব্য মানসমূহ:
-
1:1 -
2:3 -
3:2 -
3:4 -
4:3 -
4:5 -
5:4 -
9:16 -
16:9 -
21:9 -
1:8 -
8:1 -
1:4 -
4:1
কোনো বিবরণ দেওয়া হয়নি।
সম্ভাব্য মানসমূহ:
-
1K -
2K -
4K -
512
টুল পছন্দের কনফিগারেশন।
agent_config অবজেক্ট (ঐচ্ছিক)
এজেন্ট কনফিগারেশন
এজেন্টের জন্য কনফিগারেশন।
`generation_config`-এর বিকল্প। শুধুমাত্র তখনই প্রযোজ্য যখন `agent` সেট করা থাকে।
সম্ভাব্য প্রকার
পলিমরফিক ডিসক্রিমিনেটর: type
ডাইনামিকএজেন্টকনফিগ
ডাইনামিক এজেন্টদের জন্য কনফিগারেশন।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "dynamic" এ সেট করা থাকে।
DeepResearchAgentConfig
ডিপ রিসার্চ এজেন্টের কনফিগারেশন।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "deep-research" তে সেট করা থাকে।
চিন্তার সারসংক্ষেপ (ঐচ্ছিক)
উত্তরে চিন্তার সারাংশ অন্তর্ভুক্ত করা হবে কিনা।
সম্ভাব্য মানসমূহ:
-
auto -
none
উত্তরে ভিজ্যুয়ালাইজেশন অন্তর্ভুক্ত করা হবে কিনা।
সম্ভাব্য মানসমূহ:
-
off -
auto
ডিপ রিসার্চ এজেন্টের জন্য মানব-সম্পৃক্ত পরিকল্পনা সক্ষম করে। যদি এটি 'true' সেট করা হয়, তাহলে ডিপ রিসার্চ এজেন্ট তার প্রতিক্রিয়ায় একটি গবেষণা পরিকল্পনা প্রদান করবে। এরপর এজেন্টটি কেবল তখনই অগ্রসর হবে, যদি ব্যবহারকারী পরবর্তী টার্নে পরিকল্পনাটি নিশ্চিত করে।
পূর্ববর্তী যোগাযোগের আইডি, যদি থাকে।
প্রতিক্রিয়া পদ্ধতি (ঐচ্ছিক)
প্রতিক্রিয়ার অনুরোধকৃত মাধ্যমগুলো (টেক্সট, ছবি, অডিও)।
সম্ভাব্য মানসমূহ:
-
text -
image -
audio -
video -
document
সার্ভিস_টিয়ার সার্ভিসটিয়ার (ঐচ্ছিক)
মিথস্ক্রিয়ার জন্য পরিষেবা স্তর।
সম্ভাব্য মানসমূহ:
-
flex -
standard -
priority
webhook_config WebhookConfig (ঐচ্ছিক)
ঐচ্ছিক। ইন্টারঅ্যাকশন সম্পন্ন হলে নোটিফিকেশন পাওয়ার জন্য ওয়েবহুক কনফিগারেশন।
ক্ষেত্র
ঐচ্ছিক। সেট করা হলে, নিবন্ধিত ওয়েবহুকগুলোর পরিবর্তে এই ওয়েবহুক ইউআরআইগুলো ওয়েবহুক ইভেন্টের জন্য ব্যবহৃত হবে।
ঐচ্ছিক। ব্যবহারকারীর মেটাডেটা যা ওয়েবহুকগুলিতে প্রতিটি ইভেন্ট প্রেরণের সময় ফেরত দেওয়া হবে।
প্রতিক্রিয়া
একটি ইন্টারঅ্যাকশন রিসোর্স ফেরত দেয়।
সাধারণ অনুরোধ
উদাহরণ প্রতিক্রিয়া
{ "created": "2025-11-26T12:25:15Z", "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "object": "interaction", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "Hello! I'm functioning perfectly and ready to assist you.\n\nHow are you doing today?" } ] } ], "status": "completed", "updated": "2025-11-26T12:25:15Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 7 } ], "total_cached_tokens": 0, "total_input_tokens": 7, "total_output_tokens": 20, "total_thought_tokens": 22, "total_tokens": 49, "total_tool_use_tokens": 0 } }
মাল্টি-টার্ন
উদাহরণ প্রতিক্রিয়া
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "The capital of France is Paris." } ] } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 50 } ], "total_cached_tokens": 0, "total_input_tokens": 50, "total_output_tokens": 10, "total_thought_tokens": 0, "total_tokens": 60, "total_tool_use_tokens": 0 } }
ইমেজ ইনপুট
উদাহরণ প্রতিক্রিয়া
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "A white humanoid robot with glowing blue eyes stands holding a red skateboard." } ] } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 10 }, { "modality": "image", "tokens": 258 } ], "total_cached_tokens": 0, "total_input_tokens": 268, "total_output_tokens": 20, "total_thought_tokens": 0, "total_tokens": 288, "total_tool_use_tokens": 0 } }
ফাংশন কলিং
উদাহরণ প্রতিক্রিয়া
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "requires_action", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "steps": [ { "type": "function_call", "id": "gth23981", "name": "get_weather", "arguments": { "location": "Boston, MA" } } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 100 } ], "total_cached_tokens": 0, "total_input_tokens": 100, "total_output_tokens": 25, "total_thought_tokens": 0, "total_tokens": 125, "total_tool_use_tokens": 50 } }
গভীর গবেষণা
উদাহরণ প্রতিক্রিয়া
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "agent": "deep-research-pro-preview-12-2025", "status": "completed", "object": "interaction", "created": "2025-11-26T12:22:47Z", "updated": "2025-11-26T12:22:47Z", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "Here is a comprehensive research report on the current state of cancer research..." } ] } ], "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 20 } ], "total_cached_tokens": 0, "total_input_tokens": 20, "total_output_tokens": 1000, "total_thought_tokens": 500, "total_tokens": 1520, "total_tool_use_tokens": 0 } }
একটি মিথস্ক্রিয়া পুনরুদ্ধার করা
`Interaction.id`-এর উপর ভিত্তি করে একটিমাত্র ইন্টারঅ্যাকশনের সম্পূর্ণ বিবরণ পুনরুদ্ধার করে।
পাথ / কোয়েরি প্যারামিটার
পুনরুদ্ধার করার জন্য ইন্টারঅ্যাকশনটির অনন্য শনাক্তকারী।
true-তে সেট করা হলে, তৈরি হওয়া কন্টেন্ট পর্যায়ক্রমে স্ট্রিম করা হবে।
ডিফল্ট মান: False
ঐচ্ছিক। সেট করা থাকলে, ইভেন্ট আইডি দ্বারা চিহ্নিত ইভেন্টের পরের চাঙ্ক থেকে ইন্টারঅ্যাকশন স্ট্রিম পুনরায় শুরু হয়। এটি শুধুমাত্র তখনই ব্যবহার করা যাবে যখন `stream` সত্য হবে।
true সেট করা হলে, ইনপুটটি রেসপন্সে অন্তর্ভুক্ত করা হয়।
ডিফল্ট মান: False
এপিআই-এর কোন সংস্করণটি ব্যবহার করতে হবে।
প্রতিক্রিয়া
একটি ইন্টারঅ্যাকশন রিসোর্স ফেরত দেয়।
মিথস্ক্রিয়া করুন
উদাহরণ প্রতিক্রিয়া
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "model": "gemini-3-flash-preview", "status": "completed", "object": "interaction", "created": "2025-11-26T12:25:15Z", "updated": "2025-11-26T12:25:15Z", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "I'm doing great, thank you for asking! How can I help you today?" } ] } ] }
একটি ইন্টারঅ্যাকশন মুছে ফেলা
আইডি দ্বারা ইন্টারঅ্যাকশনটি মুছে দেয়।
পাথ / কোয়েরি প্যারামিটার
মুছে ফেলার জন্য ইন্টারঅ্যাকশনটির অনন্য শনাক্তকারী।
এপিআই-এর কোন সংস্করণটি ব্যবহার করতে হবে।
প্রতিক্রিয়া
সফল হলে, প্রতিক্রিয়াটি খালি থাকে।
মিথস্ক্রিয়া মুছুন
একটি ইন্টারঅ্যাকশন বাতিল করা
আইডি দ্বারা একটি ইন্টারঅ্যাকশন বাতিল করে। এটি শুধুমাত্র চলমান ব্যাকগ্রাউন্ড ইন্টারঅ্যাকশনগুলোর ক্ষেত্রে প্রযোজ্য।
পাথ / কোয়েরি প্যারামিটার
বাতিল করার জন্য ইন্টারঅ্যাকশনটির অনন্য শনাক্তকারী।
এপিআই-এর কোন সংস্করণটি ব্যবহার করতে হবে।
প্রতিক্রিয়া
একটি ইন্টারঅ্যাকশন রিসোর্স ফেরত দেয়।
মিথস্ক্রিয়া বাতিল করুন
উদাহরণ প্রতিক্রিয়া
{ "id": "v1_ChdPU0F4YWFtNkFwS2kxZThQZ05lbXdROBIXT1NBeGFhbTZBcEtpMWU4UGdOZW13UTg", "agent": "deep-research-pro-preview-12-2025", "status": "cancelled", "object": "interaction", "created": "2025-11-26T12:25:15Z", "updated": "2025-11-26T12:25:15Z" }
সম্পদ
মিথস্ক্রিয়া
মিথস্ক্রিয়া সম্পদ।
ক্ষেত্র
মডেল মডেলঅপশন (ঐচ্ছিক)
ইন্টারঅ্যাকশনটি তৈরি করতে ব্যবহৃত `মডেল`-এর নাম।
সম্ভাব্য মানসমূহ:
-
gemini-2.5-computer-use-preview-10-2025সরাসরি ইন্টারফেস ইন্টারঅ্যাকশনের জন্য ডিজাইন করা একটি সক্রিয় সক্ষমতা মডেল, যা জেমিনিকে ডিজিটাল পরিবেশ উপলব্ধি করতে এবং তাতে চলাচল করতে সক্ষম করে।
-
gemini-2.5-flashআমাদের প্রথম হাইব্রিড রিজনিং মডেল যা ১ মিলিয়ন টোকেন কনটেক্সট উইন্ডো এবং থিংকিং বাজেট সমর্থন করে।
-
gemini-2.5-flash-imageআমাদের নিজস্ব ইমেজ জেনারেশন মডেলটি গতি, নমনীয়তা এবং প্রাসঙ্গিকতা বোঝার জন্য অপ্টিমাইজ করা হয়েছে। টেক্সট ইনপুট এবং আউটপুটের মূল্য ২.৫ ফ্ল্যাশের সমান।
-
gemini-2.5-flash-liteআমাদের সবচেয়ে ছোট এবং সবচেয়ে সাশ্রয়ী মডেল, যা ব্যাপক ব্যবহারের জন্য নির্মিত।
-
gemini-2.5-flash-lite-preview-09-2025জেমিনি ২.৫ ফ্ল্যাশ লাইট-এর উপর ভিত্তি করে তৈরি সর্বাধুনিক মডেলটি ব্যয়-সাশ্রয়, উচ্চ কার্যক্ষমতা এবং উচ্চ মানের জন্য বিশেষভাবে অপ্টিমাইজ করা হয়েছে।
-
gemini-2.5-flash-native-audio-preview-12-2025আমাদের নেটিভ অডিও মডেলগুলো উন্নত গতি, কণ্ঠস্বরের স্বাভাবিকতা, বিশদ বিবরণ এবং মেজাজ সহ উচ্চতর মানের অডিও আউটপুটের জন্য অপ্টিমাইজ করা হয়েছে।
-
gemini-2.5-flash-preview-09-2025২.৫ ফ্ল্যাশ মডেলের উপর ভিত্তি করে তৈরি সর্বশেষ মডেল। ২.৫ ফ্ল্যাশ প্রিভিউ বৃহৎ পরিসরের প্রসেসিং, স্বল্প-লেটেন্সি, চিন্তাভাবনার প্রয়োজন এমন বিপুল পরিমাণ কাজ এবং এজেন্টিক ব্যবহারের ক্ষেত্রে সর্বোত্তম।
-
gemini-2.5-flash-preview-ttsআমাদের ২.৫ ফ্ল্যাশ টেক্সট-টু-স্পিচ মডেলটি শক্তিশালী, স্বল্প-বিলম্বের এবং নিয়ন্ত্রণযোগ্য বাক্ তৈরির জন্য অপ্টিমাইজ করা হয়েছে।
-
gemini-2.5-proআমাদের সর্বাধুনিক বহুমুখী মডেল, যা কোডিং এবং জটিল যুক্তিনির্ভর কাজে অত্যন্ত পারদর্শী।
-
gemini-2.5-pro-preview-ttsআমাদের ২.৫ প্রো টেক্সট-টু-স্পিচ অডিও মডেলটি শক্তিশালী ও স্বল্প-বিলম্বের বক্তৃতা তৈরির জন্য অপ্টিমাইজ করা হয়েছে, যা আরও স্বাভাবিক আউটপুট এবং সহজে পরিচালনাযোগ্য প্রম্পট প্রদান করে।
-
gemini-3-flash-previewগতির জন্য নির্মিত আমাদের সবচেয়ে বুদ্ধিমান মডেল, যা অত্যাধুনিক বুদ্ধিমত্তার সাথে উন্নত অনুসন্ধান এবং ভূমিতে স্থিতিশীলতার সমন্বয় ঘটায়।
-
gemini-3-pro-image-previewসর্বাধুনিক চিত্র তৈরি ও সম্পাদনা মডেল।
-
gemini-3-pro-previewআমাদের সবচেয়ে বুদ্ধিমান মডেল, যার রয়েছে অত্যাধুনিক যুক্তিবোধ ও বহুবিধ উপলব্ধির ক্ষমতা এবং শক্তিশালী সক্রিয় ও ভাব সংকেতায়নের সক্ষমতা।
-
gemini-3.1-pro-previewআমাদের সর্বাধুনিক অত্যাধুনিক রিজনিং মডেল, যা অভূতপূর্ব গভীরতা ও সূক্ষ্মতা এবং শক্তিশালী মাল্টিমোডাল আন্ডারস্ট্যান্ডিং ও কোডিং সক্ষমতাসম্পন্ন।
-
gemini-3.1-flash-image-previewফ্ল্যাশের গতির দক্ষতা এবং বাস্তবতার উপর ভিত্তি করে তৈরির ক্ষমতাসহ পেশাদার স্তরের ভিজ্যুয়াল ইন্টেলিজেন্স।
-
gemini-3.1-flash-lite-previewআমাদের সবচেয়ে সাশ্রয়ী মডেল, যা বিপুল পরিমাণ এজেন্টিক কাজ, অনুবাদ এবং সাধারণ ডেটা প্রক্রিয়াকরণের জন্য অপ্টিমাইজ করা হয়েছে।
-
gemini-3.1-flash-tts-previewজেমিনি ৩.১ ফ্ল্যাশ টিটিএস: শক্তিশালী, স্বল্প-বিলম্বের বক্তৃতা তৈরি। স্বাভাবিক আউটপুট, নিয়ন্ত্রণযোগ্য প্রম্পট এবং নির্ভুল বর্ণনা নিয়ন্ত্রণের জন্য নতুন অভিব্যক্তিপূর্ণ অডিও ট্যাগ উপভোগ করুন।
-
lyria-3-clip-previewআমাদের স্বল্প-বিলম্বের সঙ্গীত তৈরির মডেলটি উচ্চ-মানের অডিও ক্লিপ এবং সুনির্দিষ্ট ছন্দ নিয়ন্ত্রণের জন্য অপ্টিমাইজ করা হয়েছে।
-
lyria-3-pro-previewগভীর সুরসৃষ্টিগত বোধসম্পন্ন আমাদের উন্নত, পূর্ণাঙ্গ গান তৈরির জেনারেটিভ মডেলটি, বিভিন্ন সঙ্গীত শৈলীতে সুনির্দিষ্ট কাঠামোগত নিয়ন্ত্রণ এবং জটিল রূপান্তরের জন্য সর্বোত্তমভাবে প্রস্তুত করা হয়েছে।
এজেন্ট এজেন্টঅপশন (ঐচ্ছিক)
ইন্টারঅ্যাকশনটি তৈরি করতে ব্যবহৃত 'এজেন্ট'-এর নাম।
সম্ভাব্য মানসমূহ:
-
deep-research-pro-preview-12-2025জেমিনি ডিপ রিসার্চ এজেন্ট
-
deep-research-preview-04-2026জেমিনি ডিপ রিসার্চ এজেন্ট
-
deep-research-max-preview-04-2026জেমিনি ডিপ রিসার্চ ম্যাক্স এজেন্ট
আবশ্যক। শুধুমাত্র আউটপুট। মিথস্ক্রিয়া সম্পন্ন করার জন্য একটি অনন্য শনাক্তকারী।
আবশ্যক। শুধুমাত্র আউটপুট। মিথস্ক্রিয়ার অবস্থা।
সম্ভাব্য মানসমূহ:
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
আবশ্যক। শুধুমাত্র আউটপুট। যে সময়ে প্রতিক্রিয়াটি তৈরি করা হয়েছিল, সেই সময়টি ISO 8601 ফরম্যাটে (YYYY-MM-DDThh:mm:ssZ) উল্লেখ করতে হবে।
আবশ্যক। শুধুমাত্র আউটপুট। যে সময়ে প্রতিক্রিয়াটি সর্বশেষ আপডেট করা হয়েছিল, সেই সময়টি ISO 8601 ফরম্যাটে (YYYY-MM-DDThh:mm:ssZ) প্রকাশ করতে হবে।
শুধুমাত্র আউটপুট। মিথস্ক্রিয়ার ভূমিকা।
মিথস্ক্রিয়ার জন্য সিস্টেম নির্দেশাবলী।
ইন্টারঅ্যাকশনের সময় মডেলটি যেসব টুল ডিক্লারেশন কল করতে পারে, তার একটি তালিকা।
ব্যবহার (ঐচ্ছিক )
শুধুমাত্র আউটপুট। ইন্টারঅ্যাকশন অনুরোধের টোকেন ব্যবহারের পরিসংখ্যান।
ক্ষেত্র
প্রম্পটে (প্রসঙ্গ) টোকেনের সংখ্যা।
পদ্ধতি অনুসারে ইনপুট টোকেন ModalityTokens (ঐচ্ছিক)
পদ্ধতি অনুসারে ইনপুট টোকেন ব্যবহারের বিশদ বিবরণ।
ক্ষেত্র
পদ্ধতি প্রতিক্রিয়া পদ্ধতি (ঐচ্ছিক)
টোকেন সংখ্যার সাথে সংশ্লিষ্ট পদ্ধতি।
সম্ভাব্য মানসমূহ:
-
text -
image -
audio -
video -
document
মোডালিটির জন্য টোকেনের সংখ্যা।
প্রম্পটের ক্যাশ করা অংশে থাকা টোকেনের সংখ্যা (ক্যাশ করা বিষয়বস্তু)।
পদ্ধতি অনুসারে ক্যাশ করা টোকেন ModalityTokens (ঐচ্ছিক)
পদ্ধতি অনুসারে ক্যাশড টোকেন ব্যবহারের বিশদ বিবরণ।
ক্ষেত্র
পদ্ধতি প্রতিক্রিয়া পদ্ধতি (ঐচ্ছিক)
টোকেন সংখ্যার সাথে সংশ্লিষ্ট পদ্ধতি।
সম্ভাব্য মানসমূহ:
-
text -
image -
audio -
video -
document
মোডালিটির জন্য টোকেনের সংখ্যা।
তৈরি হওয়া সমস্ত প্রতিক্রিয়া জুড়ে টোকেনের মোট সংখ্যা।
মোডালিটি টোকেন (ঐচ্ছিক)
পদ্ধতি অনুসারে আউটপুট টোকেন ব্যবহারের বিশদ বিবরণ।
ক্ষেত্র
পদ্ধতি প্রতিক্রিয়া পদ্ধতি (ঐচ্ছিক)
টোকেন সংখ্যার সাথে সংশ্লিষ্ট পদ্ধতি।
সম্ভাব্য মানসমূহ:
-
text -
image -
audio -
video -
document
মোডালিটির জন্য টোকেনের সংখ্যা।
টুল ব্যবহারের নির্দেশনায় উপস্থিত টোকেনের সংখ্যা।
tool_use_tokens_by_modality ModalityTokens (ঐচ্ছিক)
পদ্ধতি অনুসারে টুল-ব্যবহার টোকেন ব্যবহারের একটি বিশদ বিবরণ।
ক্ষেত্র
পদ্ধতি প্রতিক্রিয়া পদ্ধতি (ঐচ্ছিক)
টোকেন সংখ্যার সাথে সংশ্লিষ্ট পদ্ধতি।
সম্ভাব্য মানসমূহ:
-
text -
image -
audio -
video -
document
মোডালিটির জন্য টোকেনের সংখ্যা।
চিন্তন মডেলগুলোর জন্য চিন্তার টোকেনের সংখ্যা।
ইন্টারঅ্যাকশন অনুরোধের জন্য মোট টোকেন সংখ্যা (প্রম্পট + প্রতিক্রিয়া + অন্যান্য অভ্যন্তরীণ টোকেন)।
গ্রাউন্ডিং_টুল_কাউন্ট (ঐচ্ছিক )
গ্রাউন্ডিং টুলের সংখ্যা।
ক্ষেত্র
গণনার সাথে সংশ্লিষ্ট গ্রাউন্ডিং টুলের ধরণ।
সম্ভাব্য মানসমূহ:
-
google_search -
google_maps -
retrieval
গ্রাউন্ডিং টুলের সংখ্যা গুরুত্বপূর্ণ।
প্রতিক্রিয়া পদ্ধতি (ঐচ্ছিক)
প্রতিক্রিয়ার অনুরোধকৃত মাধ্যমগুলো (টেক্সট, ছবি, অডিও)।
সম্ভাব্য মানসমূহ:
-
text -
image -
audio -
video -
document
রেসপন্সের MIME টাইপ। response_format সেট করা থাকলে এটি আবশ্যক।
পূর্ববর্তী যোগাযোগের আইডি, যদি থাকে।
সার্ভিস_টিয়ার সার্ভিসটিয়ার (ঐচ্ছিক)
মিথস্ক্রিয়ার জন্য পরিষেবা স্তর।
সম্ভাব্য মানসমূহ:
-
flex -
standard -
priority
webhook_config WebhookConfig (ঐচ্ছিক)
ঐচ্ছিক। ইন্টারঅ্যাকশন সম্পন্ন হলে নোটিফিকেশন পাওয়ার জন্য ওয়েবহুক কনফিগারেশন।
ক্ষেত্র
ঐচ্ছিক। সেট করা হলে, নিবন্ধিত ওয়েবহুকগুলোর পরিবর্তে এই ওয়েবহুক ইউআরআইগুলো ওয়েবহুক ইভেন্টের জন্য ব্যবহৃত হবে।
ঐচ্ছিক। ব্যবহারকারীর মেটাডেটা যা ওয়েবহুকগুলিতে প্রতিটি ইভেন্ট প্রেরণের সময় ফেরত দেওয়া হবে।
ধাপসমূহ ( ঐচ্ছিক )
শুধুমাত্র আউটপুট। যে ধাপগুলো নিয়ে মিথস্ক্রিয়াটি সম্পন্ন হয়।
সম্ভাব্য প্রকার
পলিমরফিক ডিসক্রিমিনেটর: type
ব্যবহারকারীর ইনপুট ধাপ
ব্যবহারকারী কর্তৃক প্রদত্ত ইনপুট।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "user_input" এ সেট করা থাকে।
কোনো বিবরণ দেওয়া হয়নি।
মডেলআউটপুটস্টেপ
মডেল দ্বারা উৎপন্ন আউটপুট।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "model_output" -এ সেট করা থাকে।
কোনো বিবরণ দেওয়া হয়নি।
চিন্তার পদক্ষেপ
একটি চিন্তাশীল পদক্ষেপ।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "thought" অবস্থায় সেট করা থাকে।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
সারাংশ, চিন্তার সারসংক্ষেপ, বিষয়বস্তু (ঐচ্ছিক)
চিন্তাভাবনার সারসংক্ষেপ।
সম্ভাব্য প্রকার
পলিমরফিক ডিসক্রিমিনেটর: type
টেক্সট কন্টেন্ট
একটি টেক্সট কন্টেন্ট ব্লক।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "text" হিসেবে সেট করা থাকে।
প্রয়োজনীয়। পাঠ্য বিষয়বস্তু।
টীকা (ঐচ্ছিক )
মডেল-সৃষ্ট কন্টেন্টের জন্য উদ্ধৃতি তথ্য।
সম্ভাব্য প্রকার
পলিমরফিক ডিসক্রিমিনেটর: type
ইউআরএল উদ্ধৃতি
ইউআরএল উদ্ধৃতি টীকা।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "url_citation" এ সেট করা থাকে।
ইউআরএল।
ইউআরএল-এর শিরোনাম।
প্রতিক্রিয়ার যে অংশটি এই উৎসের সাথে সম্পর্কিত, এটি তার শুরু। সূচকটি অংশের শুরু নির্দেশ করে, যা বাইটে পরিমাপ করা হয়।
আরোপিত অংশের সমাপ্তি, স্বতন্ত্র।
ফাইল উদ্ধৃতি
ফাইল উদ্ধৃতি টীকা।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "file_citation" এ সেট করা থাকে।
ফাইলটির URI।
ফাইলটির নাম।
পাঠ্যের একটি অংশের উৎস উল্লেখ করা হয়েছে।
ব্যবহারকারী সংগৃহীত কনটেক্সট সম্পর্কে মেটাডেটা প্রদান করেছেন।
উদ্ধৃত নথির পৃষ্ঠা নম্বর, যদি প্রযোজ্য হয়।
ছবির উদ্ধৃতির ক্ষেত্রে, প্রযোজ্য হলে মিডিয়া আইডি।
প্রতিক্রিয়ার যে অংশটি এই উৎসের সাথে সম্পর্কিত, এটি তার শুরু। সূচকটি অংশের শুরু নির্দেশ করে, যা বাইটে পরিমাপ করা হয়।
আরোপিত অংশের সমাপ্তি, স্বতন্ত্র।
স্থান উদ্ধৃতি
স্থান উদ্ধৃতি টীকা।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "place_citation" এ সেট করা থাকে।
স্থানটির আইডি, `places/{place_id}` ফরম্যাটে।
স্থানটির নাম।
স্থানটির URI রেফারেন্স।
পর্যালোচনা_স্নিপেট পর্যালোচনাস্নিপেট (ঐচ্ছিক)
গুগল ম্যাপসে কোনো নির্দিষ্ট স্থানের বৈশিষ্ট্য সম্পর্কে উত্তর তৈরি করতে ব্যবহৃত পর্যালোচনার অংশবিশেষ।
ক্ষেত্র
পর্যালোচনার শিরোনাম।
গুগল ম্যাপস-এ ব্যবহারকারীর পর্যালোচনার সাথে সম্পর্কিত একটি লিঙ্ক।
রিভিউ স্নিপেটটির আইডি।
প্রতিক্রিয়ার যে অংশটি এই উৎসের সাথে সম্পর্কিত, এটি তার শুরু। সূচকটি অংশের শুরু নির্দেশ করে, যা বাইটে পরিমাপ করা হয়।
আরোপিত অংশের সমাপ্তি, স্বতন্ত্র।
ছবির বিষয়বস্তু
একটি চিত্র বিষয়বস্তু ব্লক।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "image" হিসেবে সেট করা থাকে।
ছবির বিষয়বস্তু।
ছবিটির URI।
ছবিটির মাইম টাইপ।
সম্ভাব্য মানসমূহ:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
রেজোলিউশন মিডিয়ারেজোলিউশন (ঐচ্ছিক)
গণমাধ্যমের সংকল্প।
সম্ভাব্য মানসমূহ:
-
low -
medium -
high -
ultra_high
ফাংশনকলস্টেপ
একটি ফাংশন টুল কল করার ধাপ।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "function_call" এ সেট করা থাকে।
প্রয়োজনীয়। যে টুলটি কল করতে হবে তার নাম।
প্রয়োজনীয়। ফাংশনে পাস করার জন্য আর্গুমেন্টগুলো।
এই নির্দিষ্ট টুল কলের জন্য একটি অনন্য আইডি প্রয়োজন।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
কোডএক্সিকিউশনকলস্টেপ
কোড এক্সিকিউশন কল ধাপ।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "code_execution_call" এ সেট করা থাকে।
আর্গুমেন্টস CodeExecutionCallStepArguments (প্রয়োজনীয়)
প্রয়োজনীয়। কোড নির্বাহের জন্য আর্গুমেন্টসমূহ প্রদান করতে হবে।
ক্ষেত্র
`কোড`-এর প্রোগ্রামিং ভাষা।
সম্ভাব্য মানসমূহ:
-
python
যে কোডটি কার্যকর করা হবে।
এই নির্দিষ্ট টুল কলের জন্য একটি অনন্য আইডি প্রয়োজন।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
UrlContextCallStep
ইউআরএল কনটেক্সট কল ধাপ।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "url_context_call" এ সেট করা থাকে।
আর্গুমেন্টস UrlContextCallStepArguments (প্রয়োজনীয়)
আবশ্যক। ইউআরএল কনটেক্সটে পাস করার জন্য আর্গুমেন্টগুলো।
ক্ষেত্র
যে ইউআরএলগুলো আনতে হবে।
এই নির্দিষ্ট টুল কলের জন্য একটি অনন্য আইডি প্রয়োজন।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
McpServerToolCallStep
MCPServer টুল কল করার ধাপ।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "mcp_server_tool_call" এ সেট করা থাকে।
প্রয়োজনীয়। যে টুলটিকে ডাকা হয়েছিল তার নাম।
প্রয়োজনীয়। ব্যবহৃত এমসিপি সার্ভারের নাম।
আবশ্যক। ফাংশনের আর্গুমেন্টগুলোর JSON অবজেক্ট।
এই নির্দিষ্ট টুল কলের জন্য একটি অনন্য আইডি প্রয়োজন।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
GoogleSearchCallStep
গুগল সার্চ কল স্টেপ।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "google_search_call" এ সেট করা থাকে।
আর্গুমেন্ট GoogleSearchCallStepArguments (প্রয়োজনীয়)
প্রয়োজনীয়। গুগল সার্চে পাঠানোর জন্য আর্গুমেন্টগুলো।
ক্ষেত্র
পরবর্তী ওয়েব অনুসন্ধানের জন্য ওয়েব অনুসন্ধান প্রশ্নাবলী।
অনুসন্ধানের ধরণটি সক্রিয় করা হয়েছে।
সম্ভাব্য মানসমূহ:
-
web_search -
image_search -
enterprise_web_search
এই নির্দিষ্ট টুল কলের জন্য একটি অনন্য আইডি প্রয়োজন।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
ফাইলসার্চকলস্টেপ
ফাইল অনুসন্ধান কল ধাপ।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "file_search_call" এ সেট করা থাকে।
এই নির্দিষ্ট টুল কলের জন্য একটি অনন্য আইডি প্রয়োজন।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
GoogleMapsCallStep
গুগল ম্যাপস কল স্টেপ।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "google_maps_call" এ সেট করা থাকে।
আর্গুমেন্টস GoogleMapsCallStepArguments (ঐচ্ছিক)
গুগল ম্যাপস টুলে যে আর্গুমেন্টগুলো পাস করতে হবে।
ক্ষেত্র
যে কোয়েরিগুলো সম্পাদন করতে হবে।
এই নির্দিষ্ট টুল কলের জন্য একটি অনন্য আইডি প্রয়োজন।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
ফাংশনফলাফলধাপ
ফাংশন টুল কলের ফলাফল।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "function_result" -এ সেট করা থাকে।
যে যন্ত্রটিকে ডাকা হয়েছিল তার নাম।
টুল কলটির ফলে কোনো ত্রুটি ঘটেছে কিনা।
আবশ্যক। আইডিটি অবশ্যই ফাংশন কল ব্লকের আইডির সাথে মিলতে হবে।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
টুল কলের ফলাফল।
কোডএক্সিকিউশনরেজাল্টস্টেপ
কোড নির্বাহের ফলাফল ধাপ।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "code_execution_result" এ সেট করা থাকে।
প্রয়োজনীয়। কোড নির্বাহের আউটপুট।
কোড নির্বাহের ফলে কোনো ত্রুটি ঘটেছে কিনা।
আবশ্যক। আইডিটি অবশ্যই ফাংশন কল ব্লকের আইডির সাথে মিলতে হবে।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
UrlContextResultStep
ইউআরএল কনটেক্সট ফলাফল ধাপ।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "url_context_result" এ সেট করা থাকে।
ফলাফল UrlContextResultItem (প্রয়োজনীয়)
প্রয়োজনীয়। ইউআরএল কনটেক্সটের ফলাফল।
ক্ষেত্র
যে ইউআরএলটি আনা হয়েছিল।
ইউআরএল পুনরুদ্ধারের অবস্থা।
সম্ভাব্য মানসমূহ:
-
success -
error -
paywall -
unsafe
ইউআরএল প্রেক্ষাপটে কোনো ত্রুটি ঘটেছে কিনা।
আবশ্যক। আইডিটি অবশ্যই ফাংশন কল ব্লকের আইডির সাথে মিলতে হবে।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
GoogleSearchResultStep
গুগল অনুসন্ধানের ফলাফল ধাপ।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "google_search_result" এ সেট করা থাকে।
ফলাফল GoogleSearchResultItem (প্রয়োজনীয়)
প্রয়োজনীয় গুগল অনুসন্ধানের ফলাফল।
ক্ষেত্র
ওয়েব কন্টেন্ট স্নিপেট যা একটি ওয়েব পেজ বা অ্যাপ ওয়েবভিউতে এমবেড করা যায়।
গুগল অনুসন্ধানে কোনো ত্রুটি হয়েছে কিনা।
আবশ্যক। আইডিটি অবশ্যই ফাংশন কল ব্লকের আইডির সাথে মিলতে হবে।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
McpServerToolResultStep
MCPServer টুলের ফলাফল ধাপ।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "mcp_server_tool_result" -এ সেট করা থাকে।
এই নির্দিষ্ট টুল কলটির জন্য যে টুলটিকে ডাকা হয়, তার নাম।
ব্যবহৃত এমসিপি সার্ভারটির নাম।
আবশ্যক। আইডিটি অবশ্যই ফাংশন কল ব্লকের আইডির সাথে মিলতে হবে।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
MCP সার্ভার কল থেকে প্রাপ্ত আউটপুট। এটি সাধারণ টেক্সট বা তথ্যসমৃদ্ধ কন্টেন্ট হতে পারে।
ফাইলসার্চরেজাল্টস্টেপ
ফাইল অনুসন্ধানের ফলাফল ধাপ।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "file_search_result" এ সেট করা থাকে।
আবশ্যক। আইডিটি অবশ্যই ফাংশন কল ব্লকের আইডির সাথে মিলতে হবে।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
GoogleMapsResultStep
গুগল ম্যাপস ফলাফল ধাপ।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "google_maps_result" এ সেট করা থাকে।
ফলাফল GoogleMapsResultItem (প্রয়োজনীয়)
কোনো বিবরণ দেওয়া হয়নি।
ক্ষেত্র
স্থানসমূহ GoogleMapsResultPlaces (ঐচ্ছিক)
কোনো বিবরণ দেওয়া হয়নি।
ক্ষেত্র
কোনো বিবরণ দেওয়া হয়নি।
কোনো বিবরণ দেওয়া হয়নি।
কোনো বিবরণ দেওয়া হয়নি।
পর্যালোচনা_স্নিপেট পর্যালোচনাস্নিপেট (ঐচ্ছিক)
কোনো বিবরণ দেওয়া হয়নি।
ক্ষেত্র
পর্যালোচনার শিরোনাম।
গুগল ম্যাপস-এ ব্যবহারকারীর পর্যালোচনার সাথে সম্পর্কিত একটি লিঙ্ক।
রিভিউ স্নিপেটটির আইডি।
কোনো বিবরণ দেওয়া হয়নি।
আবশ্যক। আইডিটি অবশ্যই ফাংশন কল ব্লকের আইডির সাথে মিলতে হবে।
ব্যাকএন্ড যাচাইকরণের জন্য একটি স্বাক্ষর হ্যাশ।
মিথস্ক্রিয়ার জন্য ইনপুট।
এটি নিশ্চিত করে যে তৈরি হওয়া প্রতিক্রিয়াটি একটি JSON অবজেক্ট হবে যা এই ফিল্ডে নির্দিষ্ট করা JSON স্কিমা মেনে চলে।
agent_config অবজেক্ট (ঐচ্ছিক)
এজেন্ট ইন্টারঅ্যাকশনের জন্য কনফিগারেশন প্যারামিটারসমূহ।
সম্ভাব্য প্রকার
পলিমরফিক ডিসক্রিমিনেটর: type
ডাইনামিকএজেন্টকনফিগ
ডাইনামিক এজেন্টদের জন্য কনফিগারেশন।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "dynamic" এ সেট করা থাকে।
DeepResearchAgentConfig
ডিপ রিসার্চ এজেন্টের কনফিগারেশন।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "deep-research" তে সেট করা থাকে।
চিন্তার সারসংক্ষেপ (ঐচ্ছিক)
উত্তরে চিন্তার সারাংশ অন্তর্ভুক্ত করা হবে কিনা।
সম্ভাব্য মানসমূহ:
-
auto -
none
উত্তরে ভিজ্যুয়ালাইজেশন অন্তর্ভুক্ত করা হবে কিনা।
সম্ভাব্য মানসমূহ:
-
off -
auto
ডিপ রিসার্চ এজেন্টের জন্য মানব-সম্পৃক্ত পরিকল্পনা সক্ষম করে। যদি এটি 'true' সেট করা হয়, তাহলে ডিপ রিসার্চ এজেন্ট তার প্রতিক্রিয়ায় একটি গবেষণা পরিকল্পনা প্রদান করবে। এরপর এজেন্টটি কেবল তখনই অগ্রসর হবে, যদি ব্যবহারকারী পরবর্তী টার্নে পরিকল্পনাটি নিশ্চিত করে।
উদাহরণ
উদাহরণ
{ "created": "2025-12-04T15:01:45Z", "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg", "model": "gemini-3-flash-preview", "object": "interaction", "steps": [ { "type": "model_output", "content": [ { "type": "text", "text": "Hello! I'm doing well, functioning as expected. Thank you for asking! How are you doing today?" } ] } ], "status": "completed", "updated": "2025-12-04T15:01:45Z", "usage": { "input_tokens_by_modality": [ { "modality": "text", "tokens": 7 } ], "total_cached_tokens": 0, "total_input_tokens": 7, "total_output_tokens": 23, "total_thought_tokens": 49, "total_tokens": 79, "total_tool_use_tokens": 0 } }
ডেটা মডেল
বিষয়বস্তু
প্রতিক্রিয়ার বিষয়বস্তু।
সম্ভাব্য প্রকার
পলিমরফিক ডিসক্রিমিনেটর: type
টেক্সট কন্টেন্ট
একটি টেক্সট কন্টেন্ট ব্লক।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "text" হিসেবে সেট করা থাকে।
প্রয়োজনীয়। পাঠ্য বিষয়বস্তু।
টীকা (ঐচ্ছিক )
মডেল-সৃষ্ট কন্টেন্টের জন্য উদ্ধৃতি তথ্য।
সম্ভাব্য প্রকার
পলিমরফিক ডিসক্রিমিনেটর: type
ইউআরএল উদ্ধৃতি
ইউআরএল উদ্ধৃতি টীকা।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "url_citation" এ সেট করা থাকে।
ইউআরএল।
ইউআরএল-এর শিরোনাম।
প্রতিক্রিয়ার যে অংশটি এই উৎসের সাথে সম্পর্কিত, এটি তার শুরু। সূচকটি অংশের শুরু নির্দেশ করে, যা বাইটে পরিমাপ করা হয়।
আরোপিত অংশের সমাপ্তি, স্বতন্ত্র।
ফাইল উদ্ধৃতি
ফাইল উদ্ধৃতি টীকা।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "file_citation" এ সেট করা থাকে।
ফাইলটির URI।
ফাইলটির নাম।
পাঠ্যের একটি অংশের উৎস উল্লেখ করা হয়েছে।
ব্যবহারকারী সংগৃহীত কনটেক্সট সম্পর্কে মেটাডেটা প্রদান করেছেন।
উদ্ধৃত নথির পৃষ্ঠা নম্বর, যদি প্রযোজ্য হয়।
ছবির উদ্ধৃতির ক্ষেত্রে, প্রযোজ্য হলে মিডিয়া আইডি।
প্রতিক্রিয়ার যে অংশটি এই উৎসের সাথে সম্পর্কিত, এটি তার শুরু। সূচকটি অংশের শুরু নির্দেশ করে, যা বাইটে পরিমাপ করা হয়।
আরোপিত অংশের সমাপ্তি, স্বতন্ত্র।
স্থান উদ্ধৃতি
স্থান উদ্ধৃতি টীকা।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "place_citation" এ সেট করা থাকে।
স্থানটির আইডি, `places/{place_id}` ফরম্যাটে।
স্থানটির নাম।
স্থানটির URI রেফারেন্স।
পর্যালোচনা_স্নিপেট পর্যালোচনাস্নিপেট (ঐচ্ছিক)
গুগল ম্যাপসে কোনো নির্দিষ্ট স্থানের বৈশিষ্ট্য সম্পর্কে উত্তর তৈরি করতে ব্যবহৃত পর্যালোচনার অংশবিশেষ।
ক্ষেত্র
পর্যালোচনার শিরোনাম।
গুগল ম্যাপস-এ ব্যবহারকারীর পর্যালোচনার সাথে সম্পর্কিত একটি লিঙ্ক।
রিভিউ স্নিপেটটির আইডি।
প্রতিক্রিয়ার যে অংশটি এই উৎসের সাথে সম্পর্কিত, এটি তার শুরু। সূচকটি অংশের শুরু নির্দেশ করে, যা বাইটে পরিমাপ করা হয়।
আরোপিত অংশের সমাপ্তি, স্বতন্ত্র।
ছবির বিষয়বস্তু
একটি চিত্র বিষয়বস্তু ব্লক।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "image" হিসেবে সেট করা থাকে।
ছবির বিষয়বস্তু।
ছবিটির URI।
ছবিটির মাইম টাইপ।
সম্ভাব্য মানসমূহ:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
রেজোলিউশন মিডিয়ারেজোলিউশন (ঐচ্ছিক)
গণমাধ্যমের সংকল্প।
সম্ভাব্য মানসমূহ:
-
low -
medium -
high -
ultra_high
অডিও কন্টেন্ট
একটি অডিও কন্টেন্ট ব্লক।
কোনো বিবরণ দেওয়া হয়নি।
সর্বদা "audio" তে সেট করা থাকে।
অডিও বিষয়বস্তু।
অডিওটির URI।
The mime type of the audio.
Possible values:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
The number of audio channels.
The sample rate of the audio.
DocumentContent
A document content block.
No description provided.
Always set to "document" .
The document content.
The URI of the document.
The mime type of the document.
Possible values:
-
application/pdf
VideoContent
A video content block.
No description provided.
Always set to "video" .
The video content.
The URI of the video.
The mime type of the video.
Possible values:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
resolution MediaResolution (optional)
The resolution of the media.
Possible values:
-
low -
medium -
high -
ultra_high
উদাহরণ
পাঠ্য
{ "type": "text", "text": "Hello, how are you?" }
ছবি
{ "type": "image", "data": "BASE64_ENCODED_IMAGE", "mime_type": "image/png" }
অডিও
{ "type": "audio", "data": "BASE64_ENCODED_AUDIO", "mime_type": "audio/wav" }
নথি
{ "type": "document", "data": "BASE64_ENCODED_DOCUMENT", "mime_type": "application/pdf" }
ভিডিও
{ "type": "video", "uri": "https://www.youtube.com/watch?v=9hE5-98ZeCg" }
সরঞ্জাম
A tool that can be used by the model.
Possible Types
Polymorphic discriminator: type
Function
A tool that can be used by the model.
No description provided.
Always set to "function" .
The name of the function.
A description of the function.
The JSON Schema for the function's parameters.
CodeExecution
A tool that can be used by the model to execute code.
No description provided.
Always set to "code_execution" .
UrlContext
A tool that can be used by the model to fetch URL context.
No description provided.
Always set to "url_context" .
ComputerUse
A tool that can be used by the model to interact with the computer.
No description provided.
Always set to "computer_use" .
The environment being operated.
Possible values:
-
browser
The list of predefined functions that are excluded from the model call.
McpServer
A MCPServer is a server that can be called by the model to perform actions.
No description provided.
Always set to "mcp_server" .
The name of the MCPServer.
The full URL for the MCPServer endpoint. Example: "https://api.example.com/mcp"
Optional: Fields for authentication headers, timeouts, etc., if needed.
allowed_tools AllowedTools (optional)
The allowed tools.
ক্ষেত্র
mode ToolChoiceType (optional)
The mode of the tool choice.
Possible values:
-
auto -
any -
none -
validated
The names of the allowed tools.
GoogleSearch
A tool that can be used by the model to search Google.
No description provided.
Always set to "google_search" .
The types of search grounding to enable.
Possible values:
-
web_search -
image_search -
enterprise_web_search
FileSearch
A tool that can be used by the model to search files.
No description provided.
Always set to "file_search" .
The file search store names to search.
The number of semantic retrieval chunks to retrieve.
Metadata filter to apply to the semantic retrieval documents and chunks.
GoogleMaps
A tool that can be used by the model to call Google Maps.
No description provided.
Always set to "google_maps" .
Whether to return a widget context token in the tool call result of the response.
The latitude of the user's location.
The longitude of the user's location.
Retrieval
A tool that can be used by the model to retrieve files.
No description provided.
Always set to "retrieval" .
The types of file retrieval to enable.
Possible values:
-
vertex_ai_search
vertex_ai_search_config VertexAISearchConfig (optional)
Used to specify configuration for VertexAISearch.
ক্ষেত্র
Optional. Used to specify Vertex AI Search engine.
Optional. Used to specify Vertex AI Search datastores.
উদাহরণ
Function
CodeExecution
UrlContext
ComputerUse
McpServer
GoogleSearch
FileSearch
GoogleMaps
Retrieval
No examples available for this type.
InteractionSseEvent
Possible Types
Polymorphic discriminator: event_type
InteractionCreatedEvent
No description provided.
Always set to "interaction.created" .
No description provided.
The event_id token to be used to resume the interaction stream, from this event.
InteractionCompletedEvent
No description provided.
Always set to "interaction.completed" .
Required. The completed interaction with empty outputs to reduce the payload size. Use the preceding ContentDelta events for the actual output.
The event_id token to be used to resume the interaction stream, from this event.
InteractionStatusUpdate
No description provided.
Always set to "interaction.status_update" .
No description provided.
No description provided.
Possible values:
-
in_progress -
requires_action -
completed -
failed -
cancelled -
incomplete
The event_id token to be used to resume the interaction stream, from this event.
ErrorEvent
No description provided.
Always set to "error" .
error Error (optional)
No description provided.
ক্ষেত্র
A URI that identifies the error type.
A human-readable error message.
The event_id token to be used to resume the interaction stream, from this event.
StepStart
No description provided.
Always set to "step.start" .
No description provided.
step Step (required)
No description provided.
Possible Types
Polymorphic discriminator: type
UserInputStep
Input provided by the user.
No description provided.
Always set to "user_input" .
No description provided.
ModelOutputStep
Output generated by the model.
No description provided.
Always set to "model_output" .
No description provided.
ThoughtStep
A thought step.
No description provided.
Always set to "thought" .
A signature hash for backend validation.
summary ThoughtSummaryContent (optional)
A summary of the thought.
Possible Types
Polymorphic discriminator: type
TextContent
A text content block.
No description provided.
Always set to "text" .
Required. The text content.
annotations Annotation (optional)
Citation information for model-generated content.
Possible Types
Polymorphic discriminator: type
UrlCitation
A URL citation annotation.
No description provided.
Always set to "url_citation" .
The URL.
The title of the URL.
Start of segment of the response that is attributed to this source. Index indicates the start of the segment, measured in bytes.
End of the attributed segment, exclusive.
FileCitation
A file citation annotation.
No description provided.
Always set to "file_citation" .
The URI of the file.
The name of the file.
Source attributed for a portion of the text.
User provided metadata about the retrieved context.
Page number of the cited document, if applicable.
Media ID in-case of image citations, if applicable.
Start of segment of the response that is attributed to this source. Index indicates the start of the segment, measured in bytes.
End of the attributed segment, exclusive.
PlaceCitation
A place citation annotation.
No description provided.
Always set to "place_citation" .
The ID of the place, in `places/{place_id}` format.
Title of the place.
URI reference of the place.
review_snippets ReviewSnippet (optional)
Snippets of reviews that are used to generate answers about the features of a given place in Google Maps.
ক্ষেত্র
Title of the review.
A link that corresponds to the user review on Google Maps.
The ID of the review snippet.
Start of segment of the response that is attributed to this source. Index indicates the start of the segment, measured in bytes.
End of the attributed segment, exclusive.
ImageContent
An image content block.
No description provided.
Always set to "image" .
The image content.
The URI of the image.
The mime type of the image.
Possible values:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (optional)
The resolution of the media.
Possible values:
-
low -
medium -
high -
ultra_high
FunctionCallStep
A function tool call step.
No description provided.
Always set to "function_call" .
Required. The name of the tool to call.
Required. The arguments to pass to the function.
Required. A unique ID for this specific tool call.
A signature hash for backend validation.
CodeExecutionCallStep
Code execution call step.
No description provided.
Always set to "code_execution_call" .
arguments CodeExecutionCallStepArguments (required)
Required. The arguments to pass to the code execution.
ক্ষেত্র
Programming language of the `code`.
Possible values:
-
python
The code to be executed.
Required. A unique ID for this specific tool call.
A signature hash for backend validation.
UrlContextCallStep
URL context call step.
No description provided.
Always set to "url_context_call" .
arguments UrlContextCallStepArguments (required)
Required. The arguments to pass to the URL context.
ক্ষেত্র
The URLs to fetch.
Required. A unique ID for this specific tool call.
A signature hash for backend validation.
McpServerToolCallStep
MCPServer tool call step.
No description provided.
Always set to "mcp_server_tool_call" .
Required. The name of the tool which was called.
Required. The name of the used MCP server.
Required. The JSON object of arguments for the function.
Required. A unique ID for this specific tool call.
A signature hash for backend validation.
GoogleSearchCallStep
Google Search call step.
No description provided.
Always set to "google_search_call" .
arguments GoogleSearchCallStepArguments (required)
Required. The arguments to pass to Google Search.
ক্ষেত্র
Web search queries for the following-up web search.
The type of search grounding enabled.
Possible values:
-
web_search -
image_search -
enterprise_web_search
Required. A unique ID for this specific tool call.
A signature hash for backend validation.
FileSearchCallStep
File Search call step.
No description provided.
Always set to "file_search_call" .
Required. A unique ID for this specific tool call.
A signature hash for backend validation.
GoogleMapsCallStep
Google Maps call step.
No description provided.
Always set to "google_maps_call" .
arguments GoogleMapsCallStepArguments (optional)
The arguments to pass to the Google Maps tool.
ক্ষেত্র
The queries to be executed.
Required. A unique ID for this specific tool call.
A signature hash for backend validation.
FunctionResultStep
Result of a function tool call.
No description provided.
Always set to "function_result" .
The name of the tool that was called.
Whether the tool call resulted in an error.
Required. ID to match the ID from the function call block.
A signature hash for backend validation.
The result of the tool call.
CodeExecutionResultStep
Code execution result step.
No description provided.
Always set to "code_execution_result" .
Required. The output of the code execution.
Whether the code execution resulted in an error.
Required. ID to match the ID from the function call block.
A signature hash for backend validation.
UrlContextResultStep
URL context result step.
No description provided.
Always set to "url_context_result" .
result UrlContextResultItem (required)
Required. The results of the URL context.
ক্ষেত্র
The URL that was fetched.
The status of the URL retrieval.
Possible values:
-
success -
error -
paywall -
unsafe
Whether the URL context resulted in an error.
Required. ID to match the ID from the function call block.
A signature hash for backend validation.
GoogleSearchResultStep
Google Search result step.
No description provided.
Always set to "google_search_result" .
result GoogleSearchResultItem (required)
Required. The results of the Google Search.
ক্ষেত্র
Web content snippet that can be embedded in a web page or an app webview.
Whether the Google Search resulted in an error.
Required. ID to match the ID from the function call block.
A signature hash for backend validation.
McpServerToolResultStep
MCPServer tool result step.
No description provided.
Always set to "mcp_server_tool_result" .
Name of the tool which is called for this specific tool call.
The name of the used MCP server.
Required. ID to match the ID from the function call block.
A signature hash for backend validation.
The output from the MCP server call. Can be simple text or rich content.
FileSearchResultStep
File Search result step.
No description provided.
Always set to "file_search_result" .
Required. ID to match the ID from the function call block.
A signature hash for backend validation.
GoogleMapsResultStep
Google Maps result step.
No description provided.
Always set to "google_maps_result" .
result GoogleMapsResultItem (required)
No description provided.
ক্ষেত্র
places GoogleMapsResultPlaces (optional)
No description provided.
ক্ষেত্র
No description provided.
No description provided.
No description provided.
review_snippets ReviewSnippet (optional)
No description provided.
ক্ষেত্র
Title of the review.
A link that corresponds to the user review on Google Maps.
The ID of the review snippet.
No description provided.
Required. ID to match the ID from the function call block.
A signature hash for backend validation.
The event_id token to be used to resume the interaction stream, from this event.
StepDelta
No description provided.
Always set to "step.delta" .
No description provided.
delta StepDeltaData (required)
No description provided.
Possible Types
Polymorphic discriminator: type
TextDelta
No description provided.
Always set to "text" .
No description provided.
ImageDelta
No description provided.
Always set to "image" .
No description provided.
No description provided.
No description provided.
Possible values:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (optional)
The resolution of the media.
Possible values:
-
low -
medium -
high -
ultra_high
AudioDelta
No description provided.
Always set to "audio" .
No description provided.
No description provided.
No description provided.
Possible values:
-
audio/wav -
audio/mp3 -
audio/aiff -
audio/aac -
audio/ogg -
audio/flac -
audio/mpeg -
audio/m4a -
audio/l16 -
audio/opus -
audio/alaw -
audio/mulaw
Deprecated. Use sample_rate instead. The value is ignored.
The sample rate of the audio.
The number of audio channels.
DocumentDelta
No description provided.
Always set to "document" .
No description provided.
No description provided.
No description provided.
Possible values:
-
application/pdf
VideoDelta
No description provided.
Always set to "video" .
No description provided.
No description provided.
No description provided.
Possible values:
-
video/mp4 -
video/mpeg -
video/mpg -
video/mov -
video/avi -
video/x-flv -
video/webm -
video/wmv -
video/3gpp
resolution MediaResolution (optional)
The resolution of the media.
Possible values:
-
low -
medium -
high -
ultra_high
ThoughtSummaryDelta
No description provided.
Always set to "thought_summary" .
content ThoughtSummaryContent (optional)
A new summary item to be added to the thought.
Possible Types
Polymorphic discriminator: type
TextContent
A text content block.
No description provided.
Always set to "text" .
Required. The text content.
annotations Annotation (optional)
Citation information for model-generated content.
Possible Types
Polymorphic discriminator: type
UrlCitation
A URL citation annotation.
No description provided.
Always set to "url_citation" .
The URL.
The title of the URL.
Start of segment of the response that is attributed to this source. Index indicates the start of the segment, measured in bytes.
End of the attributed segment, exclusive.
FileCitation
A file citation annotation.
No description provided.
Always set to "file_citation" .
The URI of the file.
The name of the file.
Source attributed for a portion of the text.
User provided metadata about the retrieved context.
Page number of the cited document, if applicable.
Media ID in-case of image citations, if applicable.
Start of segment of the response that is attributed to this source. Index indicates the start of the segment, measured in bytes.
End of the attributed segment, exclusive.
PlaceCitation
A place citation annotation.
No description provided.
Always set to "place_citation" .
The ID of the place, in `places/{place_id}` format.
Title of the place.
URI reference of the place.
review_snippets ReviewSnippet (optional)
Snippets of reviews that are used to generate answers about the features of a given place in Google Maps.
ক্ষেত্র
Title of the review.
A link that corresponds to the user review on Google Maps.
The ID of the review snippet.
Start of segment of the response that is attributed to this source. Index indicates the start of the segment, measured in bytes.
End of the attributed segment, exclusive.
ImageContent
An image content block.
No description provided.
Always set to "image" .
The image content.
The URI of the image.
The mime type of the image.
Possible values:
-
image/png -
image/jpeg -
image/webp -
image/heic -
image/heif -
image/gif -
image/bmp -
image/tiff
resolution MediaResolution (optional)
The resolution of the media.
Possible values:
-
low -
medium -
high -
ultra_high
ThoughtSignatureDelta
No description provided.
Always set to "thought_signature" .
Signature to match the backend source to be part of the generation.
TextAnnotationDelta
No description provided.
Always set to "text_annotation_delta" .
annotations Annotation (optional)
Citation information for model-generated content.
Possible Types
Polymorphic discriminator: type
UrlCitation
A URL citation annotation.
No description provided.
Always set to "url_citation" .
The URL.
The title of the URL.
Start of segment of the response that is attributed to this source. Index indicates the start of the segment, measured in bytes.
End of the attributed segment, exclusive.
FileCitation
A file citation annotation.
No description provided.
Always set to "file_citation" .
The URI of the file.
The name of the file.
Source attributed for a portion of the text.
User provided metadata about the retrieved context.
Page number of the cited document, if applicable.
Media ID in-case of image citations, if applicable.
Start of segment of the response that is attributed to this source. Index indicates the start of the segment, measured in bytes.
End of the attributed segment, exclusive.
PlaceCitation
A place citation annotation.
No description provided.
Always set to "place_citation" .
The ID of the place, in `places/{place_id}` format.
Title of the place.
URI reference of the place.
review_snippets ReviewSnippet (optional)
Snippets of reviews that are used to generate answers about the features of a given place in Google Maps.
ক্ষেত্র
Title of the review.
A link that corresponds to the user review on Google Maps.
The ID of the review snippet.
Start of segment of the response that is attributed to this source. Index indicates the start of the segment, measured in bytes.
End of the attributed segment, exclusive.
ArgumentsDelta
No description provided.
Always set to "arguments_delta" .
No description provided.
The event_id token to be used to resume the interaction stream, from this event.
StepStop
No description provided.
Always set to "step.stop" .
No description provided.
The event_id token to be used to resume the interaction stream, from this event.
উদাহরণ
Interaction Created
{ "event_type": "interaction.created", "interaction": { "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg", "model": "gemini-3-flash-preview", "status": "in_progress", "created": "2025-12-04T15:01:45Z", "updated": "2025-12-04T15:01:45Z" }, "event_id": "evt_123" }
মিথস্ক্রিয়া সম্পন্ন হয়েছে
{ "event_type": "interaction.completed", "interaction": { "id": "v1_ChdXS0l4YWZXTk9xbk0xZThQczhEcmlROBIXV0tJeGFmV05PcW5NMWU4UHM4RHJpUTg", "model": "gemini-3-flash-preview", "status": "completed", "created": "2025-12-04T15:01:45Z", "updated": "2025-12-04T15:01:45Z" }, "event_id": "evt_123" }
Interaction Status Update
{ "event_type": "interaction.status_update", "interaction_id": "v1_ChdTMjQ0YWJ5TUF1TzcxZThQdjRpcnFRcxIXUzI0NGFieU1BdU83MWU4UHY0aXJxUXM", "status": "in_progress" }
Error Event
{ "event_type": "error", "error": { "message": "Failed to get completed interaction: Result not found.", "code": "not_found" } }
ধাপ শুরু
{ "event_type": "step.start", "index": 0, "step": { "type": "model_output" } }
Step Delta
{ "event_type": "step.delta", "index": 0, "delta": { "type": "text", "text": "Hello" } }
Step Stop
{ "event_type": "step.stop", "index": 0 }