ইন্টারঅ্যাকশন এপিআই

জেমিনি দিয়ে কিছু তৈরির জন্য ইন্টারঅ্যাকশনস এপিআই হলো নতুন স্ট্যান্ডার্ড, যা সকল নতুন প্রোজেক্টের জন্য সুপারিশ করা হয়। এটি এজেন্টিক ওয়ার্কফ্লো, সার্ভার-সাইড স্টেট ম্যানেজমেন্ট এবং জটিল মাল্টি-মোডাল ও মাল্টি-টার্ন কথোপকথনের জন্য অপ্টিমাইজ করা হয়েছে। মূল generateContent এপিআই-টি এখনও সম্পূর্ণরূপে সমর্থিত।

ইন্টারঅ্যাকশন এপিআই কেন ব্যবহার করবেন?

  • সার্ভার-সাইড হিস্ট্রি ম্যানেজমেন্ট : previous_interaction_id এর মাধ্যমে একাধিক ধাপের প্রবাহকে সহজ করা হয়েছে। সার্ভার ডিফল্টরূপে স্টেট সক্রিয় করে ( store=true ), কিন্তু আপনি store=false সেট করে স্টেটলেস আচরণ বেছে নিতে পারেন।
  • পর্যবেক্ষণযোগ্য নির্বাহ ধাপসমূহ : টাইপ করা ধাপগুলো জটিল ফ্লো ডিবাগ করা এবং অন্তর্বর্তী ইভেন্টগুলোর (যেমন চিন্তা বা সার্চ উইজেট) জন্য UI রেন্ডার করা সহজ করে তোলে।
  • এজেন্টিক ওয়ার্কফ্লোর জন্য নির্মিত : টাইপ করা এক্সিকিউশন স্টেপগুলোর মাধ্যমে বহু-ধাপের টুল ব্যবহার, অর্কেস্ট্রেশন এবং জটিল রিজনিং ফ্লো-এর জন্য নেটিভ সাপোর্ট।
  • দীর্ঘ সময় ধরে চলা এবং ব্যাকগ্রাউন্ড টাস্ক : background=true ব্যবহার করে Deep Think এবং Deep Research- এর মতো সময়সাপেক্ষ অপারেশনগুলিকে ব্যাকগ্রাউন্ড প্রসেসে অফলোড করা সমর্থন করে।
  • নতুন মডেল এবং সক্ষমতাগুলিতে অ্যাক্সেস : ভবিষ্যতে, মূল মেইনলাইন পরিবারের বাইরের নতুন মডেলগুলি, নতুন এজেন্টিক সক্ষমতা এবং সরঞ্জাম সহ, শুধুমাত্র ইন্টারঅ্যাকশনস এপিআই-তে চালু করা হবে।

আপনি যদি একটি নতুন প্রজেক্ট শুরু করেন, এজেন্টিক অ্যাপ্লিকেশন তৈরি করেন, বা সার্ভার-সাইড কনভারসেশন ম্যানেজমেন্টের প্রয়োজন হয়, তাহলে ইন্টারঅ্যাকশনস এপিআই (Interactions API) ব্যবহার করুন। আপনার প্রয়োজনের জন্য যদি আগে থেকেই কোনো ইন্টিগ্রেশন থাকে, অথবা যদি আপনার এমন কোনো ফিচারের প্রয়োজন হয় যা এখনও ইন্টারঅ্যাকশনস এপিআই-তে উপলব্ধ নয় (যেমন ব্যাচ এপিআই বা এক্সপ্লিসিট ক্যাশিং), generateContent ব্যবহার করুন

শুরু করুন

  • আপনার কোডিং এজেন্ট সেট আপ করুন : Gemini Docs MCP- এর সাথে সংযোগ করুন এবং আপনার অ্যাসিস্ট্যান্টকে সর্বশেষ ডেভেলপার ডক্স ও সেরা অনুশীলনগুলিতে সরাসরি অ্যাক্সেস দিতে gemini-interactions-api স্কিলটি ইনস্টল করুন। আপনার কোডিং এজেন্ট সেট আপ করুন →
  • generateContent থেকে মাইগ্রেট করুন : আপনার যদি আগে থেকেই কোনো ইন্টিগ্রেশন থাকে, তাহলে Interactions API-তে স্থানান্তরিত হতে মাইগ্রেশন গাইড অনুসরণ করুন।
  • কুইকস্টার্টটি চেষ্টা করুন : ইন্টারঅ্যাকশনস এপিআই কুইকস্টার্ট- এ একটি ন্যূনতম কার্যকরী উদাহরণ দিয়ে কাজ শুরু করুন।

বৈশিষ্ট্য নির্দেশিকা

এই গাইডগুলির মাধ্যমে ইন্টারঅ্যাকশনস এপিআই (Interactions API)-এর নির্দিষ্ট ক্ষমতাগুলি সম্পর্কে জানুন। আপনি এই পৃষ্ঠাগুলিতে থাকা টগল ব্যবহার করে জেনারেটকন্টেন্ট (generateContent) এবং ইন্টারঅ্যাকশনস এপিআই (Interactions API)-এর মধ্যে পরিবর্তন করতে পারেন:

ইন্টারঅ্যাকশন এপিআই কীভাবে কাজ করে

ইন্টারঅ্যাকশনস এপিআই একটি মূল রিসোর্সকে কেন্দ্র করে গঠিত: Interaction । একটি Interaction কোনো কথোপকথন বা কাজের একটি সম্পূর্ণ পালাকে উপস্থাপন করে। এটি একটি সেশন রেকর্ড হিসেবে কাজ করে, যেখানে একটি ইন্টারঅ্যাকশনের সম্পূর্ণ ইতিহাস তার সম্পাদনের ধাপগুলোর কালানুক্রমিক অনুক্রম হিসেবে থাকে। এই ধাপগুলোর মধ্যে রয়েছে মডেলের ভাবনা, সার্ভার-সাইড বা ক্লায়েন্ট-সাইড টুলের কল এবং তার ফলাফল (যেমন function_call এবং function_result ), এবং চূড়ান্ত model_output । সংরক্ষিত রিসোর্সটিতে (যা interactions.get এর মাধ্যমে পাওয়া যায়) সম্পূর্ণ প্রেক্ষাপটের জন্য user_input ধাপগুলোও অন্তর্ভুক্ত থাকে, যদিও interactions.create রেসপন্সটি শুধুমাত্র মডেল-জেনারেটেড ধাপগুলোই ফেরত দেয়।

যখন আপনি interactions.create কল করেন, তখন আপনি একটি নতুন Interaction রিসোর্স তৈরি করেন।

SDK-এর সুবিধাজনক প্রোপার্টি ব্যবহার করে আউটপুট অ্যাক্সেস করুন

যদিও ইন্টারঅ্যাকশনস এপিআই কার্য সম্পাদনের ধাপগুলোর (যেমন চিন্তা, সার্চ কোয়েরি এবং ফাংশন কল) একটি সুসংগঠিত টাইমলাইন ফেরত দেয়, চূড়ান্ত মডেল রেসপন্সটি পাওয়ার জন্য আপনাকে ম্যানুয়ালি ধাপগুলো অতিক্রম করার প্রয়োজন নেই।

Google GenAI SDK-গুলি বিভিন্ন মোডালিটির আউটপুট অ্যাক্সেস করার জন্য, ফেরত আসা Interaction অবজেক্টের উপর সরাসরি সুবিধাজনক প্রোপার্টি প্রদান করে:

SDK সুবিধাজনক বৈশিষ্ট্য রিটার্ন টাইপ বর্ণনা
interaction.output_text স্ট্রিং মডেলের রেসপন্সের সর্বশেষ টেক্সট ব্লকগুলো ফেরত দেয়। যদি রেসপন্সটি একাধিক ধারাবাহিক TextContent ব্লকে বিভক্ত থাকে, তবে এটি স্বয়ংক্রিয়ভাবে সেগুলোকে একত্রিত করে। এটি নন-টেক্সট কন্টেন্ট (যেমন চিন্তা, ছবি, অডিও বা টুল কল) দ্বারা পৃথক করা পূর্ববর্তী টেক্সট ব্লকগুলোকে অন্তর্ভুক্ত করে না। জটিল বা ইন্টারলিভড মাল্টিমোডাল রেসপন্সের ক্ষেত্রে, আপনাকে এর পরিবর্তে ম্যানুয়ালি steps পুনরাবৃত্তি করতে হবে।
interaction.output_image ইমেজ কন্টেন্ট অথবা None বর্তমান অনুরোধে মডেল দ্বারা তৈরি সর্বশেষ ইমেজ ব্লকটি ফেরত দেয়।
interaction.output_audio অডিও কন্টেন্ট অথবা None বর্তমান অনুরোধে মডেল দ্বারা তৈরি সর্বশেষ অডিও ব্লকটি ফেরত দেয়।

উন্নত ব্যবহারের ক্ষেত্রে—যেমন মধ্যবর্তী চিন্তন প্রক্রিয়া রেন্ডার করা, ধাপে ধাপে টুল কলগুলো পরিদর্শন করা, বা ডিবাগিং—আপনি এখনও ম্যানুয়ালি মূল interaction.steps টাইমলাইনটি পরিদর্শন এবং এর মধ্যে দিয়ে চলাচল করতে পারেন।

সার্ভার-সাইড স্টেট ম্যানেজমেন্ট

পরবর্তী কলে কথোপকথন চালিয়ে যাওয়ার জন্য, আপনি previous_interaction_id প্যারামিটার ব্যবহার করে একটি সম্পন্ন হওয়া ইন্টারঅ্যাকশনের id ব্যবহার করতে পারেন। সার্ভার এই আইডিটি ব্যবহার করে কথোপকথনের ইতিহাস পুনরুদ্ধার করে, ফলে আপনাকে সম্পূর্ণ চ্যাট ইতিহাস পুনরায় পাঠাতে হয় না।

previous_interaction_id প্যারামিটারটি শুধুমাত্র previous_interaction_id ব্যবহার করে হওয়া কথোপকথনের ইতিহাস (ইনপুট এবং আউটপুট) সংরক্ষণ করে। অন্যান্য প্যারামিটারগুলো ইন্টারঅ্যাকশন-ভিত্তিক এবং শুধুমাত্র সেই নির্দিষ্ট ইন্টারঅ্যাকশনটির ক্ষেত্রেই প্রযোজ্য যা আপনি বর্তমানে তৈরি করছেন:

  • tools
  • system_instruction
  • generation_config ( thinking_level , temperature ইত্যাদি সহ)

এর মানে হলো, এই প্যারামিটারগুলো প্রয়োগ করতে চাইলে প্রতিটি নতুন ইন্টারঅ্যাকশনে আপনাকে অবশ্যই সেগুলো পুনরায় উল্লেখ করতে হবে। এই সার্ভার-সাইড স্টেট ম্যানেজমেন্ট ঐচ্ছিক; আপনি প্রতিটি অনুরোধে সম্পূর্ণ কথোপকথনের ইতিহাস পাঠিয়ে স্টেটলেস মোডেও কাজ করতে পারেন।

ডেটা সংরক্ষণ এবং ধরে রাখা

ডিফল্টরূপে, এপিআই সমস্ত ইন্টারঅ্যাকশন অবজেক্ট সংরক্ষণ করে ( store=true ), যাতে সার্ভার-সাইড স্টেট ম্যানেজমেন্ট ফিচার ( previous_interaction_id ব্যবহার করে), ব্যাকগ্রাউন্ড এক্সিকিউশন ( background=true ব্যবহার করে) এবং পর্যবেক্ষণযোগ্যতার উদ্দেশ্যগুলো সহজ হয়।

  • পেইড টিয়ার : সিস্টেমটি ৫৫ দিনের জন্য ইন্টারঅ্যাকশন সংরক্ষণ করে।
  • ফ্রি টিয়ার : সিস্টেমটি ১ দিনের জন্য ইন্টারঅ্যাকশন সংরক্ষণ করে।

আপনি যদি এটি না চান, তাহলে আপনার অনুরোধে store=false সেট করতে পারেন। এই নিয়ন্ত্রণটি স্টেট ম্যানেজমেন্ট থেকে আলাদা; আপনি যেকোনো ইন্টারঅ্যাকশনের জন্য স্টোরেজ বাদ দিতে পারেন। তবে, মনে রাখবেন যে store=false background=true এর সাথে সামঞ্জস্যপূর্ণ নয় এবং পরবর্তী টার্নগুলোর জন্য previous_interaction_id ব্যবহার করতে বাধা দেয়।

আপনি এপিআই রেফারেন্সে থাকা ডিলিট মেথডটি ব্যবহার করে যেকোনো সময় সংরক্ষিত ইন্টারঅ্যাকশনগুলো মুছে ফেলতে পারেন। শুধুমাত্র ইন্টারঅ্যাকশন আইডি জানা থাকলেই আপনি ইন্টারঅ্যাকশনগুলো মুছে ফেলতে পারবেন।

সংরক্ষণের সময়সীমা শেষ হওয়ার পর আপনার ডেটা স্বয়ংক্রিয়ভাবে মুছে যাবে।

সিস্টেমটি শর্তাবলী অনুসারে ইন্টারঅ্যাকশন অবজেক্টগুলো প্রক্রিয়াকরণ করে।

সর্বোত্তম অনুশীলন

  • ক্যাশ হিট রেট : কথোপকথন চালিয়ে যাওয়ার জন্য previous_interaction_id ব্যবহার করলে সিস্টেমটি কথোপকথনের ইতিহাসের জন্য অন্তর্নিহিত ক্যাশিং আরও সহজে ব্যবহার করতে পারে, যা কর্মক্ষমতা উন্নত করে এবং খরচ কমায়।
  • ইন্টারঅ্যাকশনের মিশ্রণ : একটি কথোপকথনের মধ্যে এজেন্ট এবং মডেলের ইন্টারঅ্যাকশনগুলোকে আপনার পছন্দমতো মিলিয়ে ব্যবহার করার স্বাধীনতা আপনার রয়েছে। উদাহরণস্বরূপ, আপনি প্রাথমিক ডেটা সংগ্রহের জন্য ডিপ রিসার্চ এজেন্টের মতো একটি বিশেষায়িত এজেন্ট ব্যবহার করতে পারেন এবং তারপরে সারসংক্ষেপ করা বা পুনঃবিন্যাস করার মতো ফলো-আপ কাজগুলোর জন্য একটি স্ট্যান্ডার্ড জেমিনি মডেল ব্যবহার করতে পারেন, এই ধাপগুলোকে previous_interaction_id সাথে লিঙ্ক করে।

সমর্থিত মডেল এবং এজেন্ট

মডেলের নাম প্রকার মডেল আইডি
জেমিনি ৩.৫ ফ্ল্যাশ মডেল gemini-3.5-flash
জেমিনি ৩.১ ফ্ল্যাশ-লাইট মডেল gemini-3.1-flash-lite
জেমিনি ৩.১ ফ্ল্যাশ-লাইট প্রিভিউ মডেল gemini-3.1-flash-lite-preview
জেমিনি ৩.১ প্রো প্রিভিউ মডেল gemini-3.1-pro-preview
জেমিনি ৩ ফ্ল্যাশ প্রিভিউ মডেল gemini-3-flash-preview
জেমিনি ২.৫ প্রো মডেল gemini-2.5-pro
জেমিনি ২.৫ ফ্ল্যাশ মডেল gemini-2.5-flash
জেমিনি ২.৫ ফ্ল্যাশ-লাইট মডেল gemini-2.5-flash-lite
লিরিয়া ৩ ক্লিপ প্রিভিউ মডেল lyria-3-clip-preview
লাইরিয়া ৩ প্রো প্রিভিউ মডেল lyria-3-pro-preview
গভীর গবেষণা পূর্বরূপ এজেন্ট deep-research-pro-preview-12-2025
গভীর গবেষণা পূর্বরূপ এজেন্ট deep-research-preview-04-2026
গভীর গবেষণা পূর্বরূপ এজেন্ট deep-research-max-preview-04-2026

এসডিকে

ইন্টারঅ্যাকশনস এপিআই অ্যাক্সেস করার জন্য আপনি গুগল জেনএআই এসডিকে-এর সর্বশেষ সংস্করণ ব্যবহার করতে পারেন।

  • পাইথনে, 1.55.0 সংস্করণ থেকে এটি হলো google-genai প্যাকেজ।
  • জাভাস্ক্রিপ্টে, 1.33.0 সংস্করণ থেকে এটি হলো @google/genai প্যাকেজ।

লাইব্রেরি পেজে আপনি এসডিকেগুলো কীভাবে ইনস্টল করবেন সে সম্পর্কে আরও জানতে পারবেন।

সীমাবদ্ধতা

  • বিটা স্ট্যাটাস : ইন্টারঅ্যাকশনস এপিআইটি বিটা/প্রিভিউ পর্যায়ে রয়েছে। এর ফিচার ও স্কিমা পরিবর্তিত হতে পারে।
  • রিমোট এমসিপি : জেমিনি ৩ রিমোট এমসিপি সমর্থন করে না, এটি শীঘ্রই আসছে।

নিম্নলিখিত বৈশিষ্ট্যগুলি generateContent API দ্বারা সমর্থিত, কিন্তু Interactions API-তে এখনও উপলব্ধ নয় :

ব্রেকিং পরিবর্তন

ইন্টারঅ্যাকশনস এপিআই বর্তমানে একটি প্রাথমিক বিটা পর্যায়ে রয়েছে। আমরা বাস্তব ব্যবহার এবং ডেভেলপারদের মতামতের উপর ভিত্তি করে এপিআই-এর সক্ষমতা, রিসোর্স স্কিমা এবং এসডিকে ইন্টারফেস সক্রিয়ভাবে উন্নত ও পরিমার্জন করছি। ফলস্বরূপ, কিছু বড় ধরনের পরিবর্তন (ব্রেকিং চেঞ্জ) ঘটতে পারে

বিদ্যমান ব্রেকিং পরিবর্তনসমূহ:

  • ধাপসমূহের কাঠামো : একটি নতুন ধাপসমূহ অ্যারে আউটপুট অ্যারেটিকে প্রতিস্থাপন করে, যা প্রতিটি মিথস্ক্রিয়ার পালাক্রমের একটি সুসংগঠিত সময়রেখা প্রদান করে।

সর্বশেষ ব্রেকিং চেঞ্জ সম্পর্কে জানতে এবং কীভাবে মাইগ্রেট করতে হয় তা বুঝতে, ব্রেকিং চেঞ্জ মাইগ্রেশন গাইড (মে ২০২৬) দেখুন।

অন্যান্য সম্ভাব্য আপডেটের মধ্যে ইনপুট ও আউটপুটের স্কিমা, SDK মেথড সিগনেচার ও অবজেক্ট স্ট্রাকচার এবং নির্দিষ্ট ফিচারের আচরণে পরিবর্তন অন্তর্ভুক্ত থাকতে পারে।

প্রোডাকশন ওয়ার্কলোডের জন্য, আপনার স্ট্যান্ডার্ড generateContent API ব্যবহার করা চালিয়ে যাওয়া উচিত। স্থিতিশীল ডেপ্লয়মেন্টের জন্য এটিই প্রস্তাবিত পথ, এবং আমরা সক্রিয়ভাবে এর উন্নয়ন ও রক্ষণাবেক্ষণ চালিয়ে যাব।

প্রতিক্রিয়া

ইন্টারঅ্যাকশনস এপিআই-এর উন্নয়নের জন্য আপনার মতামত অত্যন্ত গুরুত্বপূর্ণ। আমাদের গুগল এআই ডেভেলপার কমিউনিটি ফোরামে আপনার ভাবনা শেয়ার করুন, বাগ রিপোর্ট করুন, অথবা নতুন ফিচারের জন্য অনুরোধ জানান।

এরপর কী?