সিমন
মাল্টিমোডাল খেলনা রোবট যা ফাংশন-কল জেনারেটেড আচরণ করে
এটা কি করে
সিমন মানুষের অনুকরণ করার চেষ্টা করে, যেমন "সাইমন বলেছেন" খেলা। প্রথমে একজন মানুষ একটি টাচস্ক্রিন ডিসপ্লেতে Chrome Gradio Python অ্যাপের মাধ্যমে একটি ছোট ভিডিও, ছবি বা অডিও রেকর্ড করবে। Gemini API এই মিডিয়া ইনপুট আপলোড করে এবং দৃশ্য এবং যেকোনো মানুষের একটি পাঠ্য বিবরণ পায়। পাঠ্য বিবরণটি তখন প্রম্পট-ইঞ্জিনিয়ার করা হয় যাতে জেমিনি ফাংশন-কলিং কয়েক ডজন প্রার্থীর মধ্যে থেকে সম্ভাব্য সেরা রোবট আচরণ ফাংশন বেছে নেয়। রোবট আচরণের ফাংশনগুলি হাতে তৈরি করা হয়, তবে একটি স্ক্রিপ্ট ব্যবহার করে জেমিনি (কোড জেনারেশন) দিয়ে নতুন নতুন আচরণও তৈরি করা যেতে পারে। আমরা একটি YouTube লাইভস্ট্রিম হোস্ট করেছি যাতে ডেভেলপাররা কীভাবে তাদের নিজস্ব রোবট আচরণ ফাংশন তৈরি করতে পারে সে সম্পর্কে নির্দেশনা দেয়। সিমন ফোম, মোজা এবং টেপ দিয়ে তৈরি এবং একটি ক্যামেরা, ইউএসবি মাইক্রোফোন এবং স্পিকার, তিনটি শখের সার্ভো, দুটি এলইডি চোখ এবং একটি টাচস্ক্রিন ডিসপ্লে সহ একটি রাস্পবেরি পাইতে চলে৷ সমস্ত কোড ওপেন সোর্স এবং আমরা ইনস্টল নির্দেশাবলী এবং একটি BOM সহ একটি সম্পূর্ণ বিল্ড গাইড প্রদান করি। আমরা একটি হেল্পার স্ক্রিপ্ট প্রদান করি যা ডেভেলপারদের একটি জেমিনি চ্যাট ইন্সট্যান্সে সিমন সম্পর্কে প্রশ্ন জিজ্ঞাসা করতে দেয়, প্রাসঙ্গিক প্রসঙ্গের সাথে প্রাক-পপুলেট করে। সমস্ত কোড পাইথনে লেখা আছে এবং আমরা আচরণ ফাংশন এবং জেমিনি API কলগুলি সমান্তরালভাবে চালানোর জন্য async মডিউল ব্যবহার করি। কোড ডিজাইনটি সহজ কাস্টমাইজযোগ্যতা এবং প্রসারিতযোগ্যতার জন্য মডুলার। আমাদের আশা যে ডেভেলপাররা জেমিনি API ব্যবহার করে তাদের নিজস্ব রোবোটিক্স প্রকল্পগুলি তৈরি করতে সিমনকে একটি লঞ্চিং পয়েন্ট হিসাবে ব্যবহার করতে পারে৷
দিয়ে নির্মিত
- ওয়েব/ক্রোম
দল
দ্বারা
hu-po
থেকে
মার্কিন যুক্তরাষ্ট্র