শেয়ার করুন

16 মে, 2025

Gemini API ব্যবহার করে Cartwheel অ্যাডভান্সেস ক্যারেক্টার অ্যানিমেশন

জোনাথন জার্ভিস

সহ-প্রতিষ্ঠাতা এবং সিটিও

অ্যান্ড্রু কার

সহ-প্রতিষ্ঠাতা ও প্রধান বিজ্ঞানী

বিশাল ধর্মাধিকারী

এআই ডেভরেল

কার্টহুইল শোকেস নায়ক

Gemini API ব্যবহার করে Cartwheel অ্যাডভান্সেস ক্যারেক্টার অ্যানিমেশন

কার্টহুইল পরবর্তী প্রজন্মের অ্যানিমেশনের অগ্রভাগে দাঁড়িয়েছে, একটি প্ল্যাটফর্ম অফার করে যেখানে প্রাকৃতিক ভাষা ইনপুট (যেমন, "জাম্প," "সালসা ডান্স স্পিন") সরাসরি চরিত্রের ক্রিয়াকলাপ। এই উদ্ভাবন ভিডিও, গেমিং, বিজ্ঞাপন এবং সোশ্যাল মিডিয়ার জন্য নির্মাতারা কীভাবে অ্যানিমেট করে তা উন্নত করে৷ কার্টহুইল স্বজ্ঞাত টেক্সট-টু-ক্যারেক্টার ডিজাইনের জন্য ইমেজেন 3কে সংহত করে, এবং অত্যাধুনিক অ্যানিমেশন-নির্দিষ্ট অ্যালগরিদম বিকাশ করতে, জটিল কোডবেসগুলি অন্বেষণ করতে এবং প্ল্যাটফর্ম অপ্টিমাইজেশানকে ত্বরান্বিত করতে, ব্যবহারকারীদের তাদের সৃজনশীল গল্প বলার ক্ষমতা বাড়াতে জেমিনি 2.5 প্রো প্রিভিউ ব্যবহার করে।

জেনারেটিভ 3D মোশনে R&D বাধা অতিক্রম করা

একটি অত্যাধুনিক অ্যানিমেশন প্ল্যাটফর্মের বিকাশের জন্য শুধুমাত্র ব্যবহারকারী-বান্ধব ডিজাইন সরঞ্জামই নয়, ব্যাকএন্ড অ্যালগরিদম এবং দক্ষ কোডবেস ব্যবস্থাপনায় ক্রমাগত উদ্ভাবনও প্রয়োজন। কার্টহুইল দ্রুত প্রোটোটাইপিং এবং জটিল অ্যানিমেশন বৈশিষ্ট্যগুলি বাস্তবায়ন, কর্মক্ষমতার জন্য তাদের বিস্তৃত কোডবেসকে অপ্টিমাইজ করার এবং বিকাশকারীদের দ্রুত বুঝতে এবং একটি বড়-স্কেল সিস্টেমে অবদান রাখতে সক্ষম করার চ্যালেঞ্জের মুখোমুখি হয়েছিল। তাদের উন্নয়ন প্রচেষ্টাকে সুপারচার্জ করার জন্য তাদের একটি শক্তিশালী এআই অংশীদার প্রয়োজন।

কার্টহুইল কিভাবে Imagen 3 এবং Gemini 2.5 Pro প্রিভিউ ব্যবহার করে

কার্টহুইল তার ব্যবহারকারী-মুখী সৃষ্টি পাইপলাইন উন্নত করতে এবং এর অভ্যন্তরীণ উন্নয়ন প্রক্রিয়ায় সহায়তা করতে Gemini API ব্যবহার করে।

  • ইমেজেন 3-এর সাথে AI-চালিত চরিত্রের ধারণা: কার্টহুইল ইমেজেন 3 টেক্সট-টু-ইমেজ ক্ষমতাকে একীভূত করে, যা নির্মাতাদেরকে প্ল্যাটফর্মের মধ্যে সরাসরি ধারণা এবং অনন্য ক্যারেক্টার ভিজ্যুয়াল তৈরি করতে টেক্সট প্রম্পট ব্যবহার করতে দেয়। এই কাস্টম-ডিজাইন করা অক্ষরগুলি প্রাকৃতিক ভাষা ব্যবহার করে অ্যানিমেটেড করা যেতে পারে, তারপর সম্পূর্ণভাবে রফতানি করা যায় এবং মায়া বা ব্লেন্ডারের মতো শিল্প-মানের 3D সম্পাদনা সফ্টওয়্যারের জন্য প্রস্তুত, পেশাদার উত্পাদন পরিবেশে একীকরণ সক্ষম করে।
  • জেমিনি 2.5 প্রো প্রিভিউয়ের সাথে R&D এবং অপ্টিমাইজেশানে সহায়তা করা: কার্টহুইল টিম তার ইঞ্জিনিয়ারিং এবং গবেষণা কর্মপ্রবাহকে সমর্থন করার জন্য অভ্যন্তরীণভাবে জেমিনি 2.5 প্রো প্রিভিউ ব্যবহার করে:
    • ডেভেলপিং অ্যালগরিদম: জেমিনি 2.5 প্রো প্রিভিউ অ্যানিমেশন-নির্দিষ্ট বৈশিষ্ট্যগুলি বিকাশে সহায়তা করার জন্য নিযুক্ত করা হয়, যার মধ্যে ডেটা সংশ্লেষণের জন্য মোশন ব্লারের জন্য অ্যালগরিদম, মিশ্রণের জন্য ল্যাপ্লাসিয়ান পিরামিড এবং ইন-এডিটর পোজিংয়ের জন্য অটো আইকে (ইনভার্স কাইনেমেটিক্স) অন্তর্ভুক্ত রয়েছে।
    • কোড অন্বেষণ এবং ডিবাগিং: দলটি জটিল কোডবেসগুলি অন্বেষণ করতে, নতুন পরীক্ষাগুলির জন্য ধারণা তৈরি করতে এবং জটিল ক্যামেরা ঘূর্ণন ত্রুটিগুলির মতো দক্ষতার সাথে ডিবাগ করার ক্ষেত্রে সহায়তা করতে Gemini 2.5 Pro প্রিভিউ ব্যবহার করে৷
    • কোডবেস অপারেশনের জন্য লং কনটেক্সট ব্যবহার করা: জেমিনি 2.5 প্রো প্রিভিউ এর দীর্ঘ প্রসঙ্গ ক্ষমতাগুলি কার্টহুইলের পুরো কোডবেস জুড়ে কাজ করতে ব্যবহৃত হয়। এটি ডেভেলপারদের সক্ষম করে, উদাহরণস্বরূপ, নতুন কোডবেসগুলিকে (যেমন ফ্রন্ট-এন্ড) প্রেক্ষাপটে আনতে সাহায্য করে বৈশিষ্ট্য যোগ করতে বা সিস্টেমের আর্কিটেকচার এবং কার্যকারিতা সম্পর্কে উচ্চ-স্তরের প্রশ্ন জিজ্ঞাসা করতে।

অ্যানিমেশন ওয়ার্কফ্লোকে ক্ষমতায়ন করা

অ্যালগরিদম ডেভেলপমেন্ট, কোড এক্সপ্লোরেশন এবং ডিবাগিং-এ সহায়তা করার জন্য জেমিনি 2.5 প্রো প্রিভিউ ব্যবহার করে, কার্টহুইল এর উন্নয়ন প্রক্রিয়াগুলিকে উন্নত করা এবং প্ল্যাটফর্ম অপ্টিমাইজেশনকে ত্বরান্বিত করার লক্ষ্য রাখে। Imagen 3 এর ইন্টিগ্রেশন ব্যবহারকারীদের পাঠ্য থেকে অক্ষর ভিজ্যুয়াল তৈরি করার জন্য একটি সুবিন্যস্ত উপায় প্রদান করে, যখন Gemini 2.5 Pro প্রিভিউ বিকাশকারীদের অন্তর্নিহিত প্রযুক্তি তৈরিতে সহায়তা করার একটি সরঞ্জাম হিসাবে কাজ করে। এই ইন্টিগ্রেশনগুলি অ্যানিমেশন ওয়ার্কফ্লোগুলিকে দ্রুত এবং আরও অ্যাক্সেসযোগ্য করার জন্য কার্টহুইলের লক্ষ্যগুলিকে সমর্থন করে, যেমন ব্যবহারগুলি সক্ষম করে:

  • গেম এবং ভিডিওর জন্য সম্পদ তৈরির গতি ত্বরান্বিত করা, দলগুলিকে মূল ডিজাইনে ফোকাস করার অনুমতি দেয়।
  • দক্ষ বিপণন এবং সামাজিক মিডিয়া বিষয়বস্তু তৈরির সুবিধা প্রদান।

"অ্যানিমেশন হল আপনার মাথা থেকে একটি গল্প বের করে বিশ্বের কাছে দেখানোর সবচেয়ে বিশুদ্ধতম উপায়গুলির মধ্যে একটি৷ আমরা এটিকে সবার জন্য সহজ এবং আরও অ্যাক্সেসযোগ্য করার জন্য সরঞ্জাম তৈরি করছি!"

- জনাথন জার্ভিস, সিইও / সহ-প্রতিষ্ঠাতা, কার্টহুইল

অ্যানিমেশনের ভবিষ্যত তৈরি করা

Cartwheel-এর Imagen 3 এবং Gemini 2.5 Pro প্রিভিউ-এর ইন্টিগ্রেশন হাইলাইট করে যে কীভাবে Google AI ব্যবহার করা যেতে পারে নতুন ব্যবহারকারী-মুখী বৈশিষ্ট্যগুলিকে সক্ষম করতে এবং পরবর্তী প্রজন্মের সরঞ্জামগুলি তৈরি করার জন্য প্রয়োজনীয় জটিল উন্নয়ন কাজে সহায়তা করতে।

Gemini API ডকুমেন্টেশন অন্বেষণ করুন, Imagen 3 সম্পর্কে জানুন এবং Google AI স্টুডিওতে শুরু করুন।

Cartwheel হল Google-এর AI ফিউচার ফান্ডের একজন অংশগ্রহণকারী যেটি AI-তে পরবর্তী কী হবে তা তৈরি করার জন্য উচ্চাভিলাষী স্টার্টআপগুলিতে বিনিয়োগ করে এবং সহযোগিতা করে৷

সর্বোত্তম এআই

সর্বোত্তম AI কোড পর্যালোচনার সময় 50% কমাতে Gemini API ব্যবহার করে