১২ ডিসেম্বর, ২০২৫
Ava: Gemini 2.5 Flash এবং Live API দিয়ে এজেন্টিক ওয়ার্কফ্লো তৈরি করা

আভা হল একটি "এআই-চালিত পারিবারিক অপারেটিং সিস্টেম" যা চাহিদা অনুমান করে এবং কাজগুলি স্বয়ংক্রিয় করে পারিবারিক জীবনের সরবরাহ পরিচালনা করার জন্য ডিজাইন করা হয়েছে।
অভিভাবকরা যে তথ্য পরিচালনা করেন তা খুব কমই কাঠামোগত হয়; এটি অসঙ্গত স্কুল ইমেল, ফ্লায়ারগুলির স্ক্রিনশট, পিডিএফ সংযুক্তি, দীর্ঘ হোয়াটসঅ্যাপ থ্রেড এবং ভয়েস নোটের মাধ্যমে আসে। আভাকে অবশ্যই প্রেক্ষাপট বুঝতে হবে এবং বহিরাগত পরিষেবাগুলির সাথে নির্বিঘ্নে যোগাযোগ করতে হবে।
বাস্তব জগতের অগোছালো, অসংগঠিত ইনপুটগুলি পরিচালনা করার জন্য, Ava টিম তাদের এজেন্টিক পাইপলাইনের বিভিন্ন পর্যায়ের জন্য Gemini 2.5 Flash মডেল এবং একটি কথোপকথনমূলক ইন্টারফেস প্রদানের জন্য Live API ব্যবহার করে একটি স্তরযুক্ত স্থাপত্য বাস্তবায়ন করেছে।

কর্মক্ষমতা এবং দক্ষতা অপ্টিমাইজ করা
ব্যবহারকারীর অভিজ্ঞতাকে প্রতিক্রিয়াশীল করে তুলতে আগত অনুরোধগুলি প্রথমে একটি হালকা এজেন্ট রাউটারের মুখোমুখি হয়। এই রাউটারটি ট্রাইএজ সিস্টেম হিসাবে কাজ করে, ইনপুটের অগ্রাধিকার শ্রেণীবদ্ধ করে, কী স্লটগুলি (কে, কখন, কোথায়) বের করে এবং কোন বিশেষায়িত সরঞ্জাম বা পরবর্তী মডেল প্রয়োজন তা নির্ধারণ করে।
Ava-এর সহ-প্রতিষ্ঠাতা এবং CTO জো অ্যালিকাটার মতে, “Gemini 2.5 Flash-Lite অতি-হালকা ওজনের পরীক্ষা-নিরীক্ষার জন্য উজ্জ্বল,” সাব-সেকেন্ড প্রতিক্রিয়া প্রদানের সময় অভিপ্রায় সনাক্তকরণ এবং সংক্ষিপ্ত আকারের সারসংক্ষেপ পরিচালনা করে।
জটিল পরিকল্পনা এবং বাস্তবায়ন পরিচালনা করা
একবার উদ্দেশ্য প্রতিষ্ঠিত হয়ে গেলে, কাজের জন্য প্রায়শই গভীর যুক্তির প্রয়োজন হয়। উদাহরণস্বরূপ, একটি স্কুল ক্যালেন্ডার বিশ্লেষণ করা, অসঙ্গত তারিখগুলি স্বাভাবিক করা এবং সঠিক ইভেন্ট প্রস্তাব করার জন্য সূক্ষ্ম বোধগম্যতা প্রয়োজন। জেমিনি 2.5 ফ্ল্যাশ কঠোর প্রযুক্তিগত প্রয়োজনীয়তা পূরণ করে আভাকে একটি দক্ষ "পরিবারের সিওও" হিসেবে কাজ করতে সক্ষম করে:
- মাল্টিমোডাল বোঝাপড়া : একক পাসে টেক্সট, ছবি এবং অডিও প্রক্রিয়াকরণ
- অস্পষ্টতার মধ্যে বর্ধিত নির্ভুলতা : অসঙ্গত স্কুল যোগাযোগের সঠিকভাবে ব্যাখ্যা করা
- নির্ভরযোগ্য ফাংশন কলিং : জিমেইল এবং ক্যালেন্ডার এপিআই কল করার মতো ক্রিয়াকলাপগুলি কাঠামোগত এবং বিশ্বাসযোগ্য ডেটা ব্যবহার করে তা নিশ্চিত করা।
পরিবারগুলি লাইভ এপিআই দ্বারা সক্ষম ভয়েস ইন্টারঅ্যাকশনের মাধ্যমে তাদের গৃহস্থালীর কাজগুলি সম্পূর্ণরূপে পরিচালনা করতে পারে। অ্যালিকাটা উল্লেখ করেছেন যে তাদের "নেটিভ অডিওর জন্য একটি কঠিন প্রয়োজনীয়তা" ছিল তাই আভা এটিকে কাজে লাগানোর জন্য একটি প্রাকৃতিক হাতিয়ার বলে মনে করেন।
এজেন্টিক সিস্টেম নির্মাণের জন্য একটি পরিপক্ক পদ্ধতি
দলটি উন্নয়নের সময় গুগল এআই স্টুডিও ব্যাপকভাবে ব্যবহার করেছে যাতে প্রম্পট এবং টুল স্কিমাগুলির পাশাপাশি A/B পরীক্ষার প্রার্থী মডেলগুলিতে দ্রুত পুনরাবৃত্তি করা যায়, যার ফলে আইডিয়া-টু-টেস্ট লুপ দিন থেকে ঘন্টায় সংক্ষিপ্ত হয়।
ফলাফলগুলি তাদের মাল্টি-মডেল পদ্ধতির কার্যকারিতা প্রদর্শন করেছে। তারা ইমেল থ্রেড এবং ফ্লায়ারদের ছবির মতো শব্দযুক্ত ইনপুটগুলিতে উচ্চতর ফার্স্ট-পাস নির্ভুলতা লক্ষ্য করেছে। এর আলফা স্প্রিন্টের সময়, ৮০% Ava ব্যবহারকারী দৈনিক সক্রিয় ব্যবহারকারী ছিলেন এবং হাজার হাজার ট্রাইএজড ইভেন্ট অনুমোদিত হয়েছিল এবং ক্যালেন্ডারে যুক্ত করা হয়েছিল।
দ্রুত পঠনের জন্য অত্যন্ত দক্ষ মডেল ব্যবহার করে এবং জটিল বিশ্লেষণের জন্য আরও সম্পদ-নিবিড় মডেল সংরক্ষণ করে, এজেন্টিক সিস্টেমগুলি বাস্তব জীবনের গতিতে কাজ করতে পারে।
জেমিনি মডেল এবং লাইভ API কীভাবে এজেন্টিক ওয়ার্কফ্লোকে স্ট্রিমলাইন করতে পারে তা অন্বেষণ করতে, আমাদের API ডকুমেন্টেশন পর্যালোচনা করুন।
বৃষ্টির ফোঁটা
রেইনড্রপের এআই মনিটরিং প্ল্যাটফর্মটি জেমিনি ২.৫ ফ্ল্যাশ ব্যবহার করে রিয়েল-টাইম সমস্যা সনাক্তকরণ, অনুসন্ধানের সময় উল্লেখযোগ্যভাবে হ্রাস এবং ৯০% এরও বেশি খরচ কমাতে সাহায্য করে।