۱۶ مه ۲۰۲۵
Cartwheel با استفاده از Gemini API انیمیشن شخصیت را ارتقا میدهد

Cartwheel با استفاده از Gemini API انیمیشن شخصیت را ارتقا میدهد
کارتویل در خط مقدم انیمیشن نسل بعدی قرار دارد و پلتفرمی را ارائه میدهد که در آن ورودیهای زبان طبیعی (مثلاً "پرش"، "چرخش رقص سالسا") حرکات شخصیت را هدایت میکنند. این نوآوری نحوهی انیمیشنسازی سازندگان برای ویدیو، بازی، تبلیغات و رسانههای اجتماعی را بهبود میبخشد. کارتویل Imagen 3 را برای طراحی بصری تبدیل متن به شخصیت ادغام میکند و از پیشنمایش Gemini 2.5 Pro برای توسعه الگوریتمهای پیچیدهی مخصوص انیمیشن، کاوش در پایگاههای کد پیچیده و تسریع بهینهسازی پلتفرم استفاده میکند و به کاربران این امکان را میدهد تا داستانسرایی خلاقانهی خود را گسترش دهند.
غلبه بر موانع تحقیق و توسعه در حرکت مولد سهبعدی
توسعه یک پلتفرم انیمیشن پیشرفته نه تنها به ابزارهای طراحی کاربرپسند، بلکه به نوآوری مداوم در الگوریتمهای backend و مدیریت کارآمد پایگاه کد نیز نیاز دارد. Cartwheel با چالش نمونهسازی سریع و پیادهسازی ویژگیهای پیچیده انیمیشن، بهینهسازی پایگاه کد گسترده خود برای عملکرد بهتر و قادر ساختن توسعهدهندگان به درک سریع و مشارکت در یک سیستم در مقیاس بزرگ مواجه بود. آنها به یک شریک قدرتمند هوش مصنوعی نیاز داشتند تا تلاشهای توسعه خود را تقویت کنند.
نحوه استفاده Cartwheel از پیشنمایش Imagen 3 و Gemini 2.5 Pro
کارتویل از رابط برنامهنویسی نرمافزار Gemini برای بهبود فرآیند تولید محتوا برای کاربران و کمک به فرآیندهای توسعه داخلی خود استفاده میکند.
- طراحی شخصیت مبتنی بر هوش مصنوعی با Imagen 3: Cartwheel قابلیتهای تبدیل متن به تصویر Imagen 3 را ادغام میکند و به سازندگان اجازه میدهد تا از پیامهای متنی برای مفهومسازی و تولید تصاویر منحصر به فرد شخصیتها مستقیماً در داخل پلتفرم استفاده کنند. این شخصیتهای سفارشی را میتوان با استفاده از زبان طبیعی متحرکسازی کرد، سپس به طور کامل ریگبندی شده و آماده برای نرمافزارهای ویرایش سهبعدی استاندارد صنعتی مانند Maya یا Blender صادر کرد و امکان ادغام در محیطهای تولید حرفهای را فراهم نمود.
- کمک به تحقیق و توسعه و بهینهسازی با پیشنمایش Gemini 2.5 Pro: تیم Cartwheel از پیشنمایش Gemini 2.5 Pro به صورت داخلی برای پشتیبانی از گردشهای کاری مهندسی و تحقیقاتی خود استفاده میکند:
- توسعه الگوریتمها: پیشنمایش Gemini 2.5 Pro برای کمک به توسعه ویژگیهای خاص انیمیشن، از جمله الگوریتمهای تاری حرکت برای سنتز دادهها، هرمهای لاپلاسی برای ترکیب و IK خودکار (سینماتیک معکوس) برای ژستدهی در ویرایشگر، به کار گرفته شده است.
- کاوش و اشکالزدایی کد: این تیم از پیشنمایش Gemini 2.5 Pro برای کاوش در پایگاههای کد پیچیده، ایجاد ایده برای آزمایشهای جدید و کمک به اشکالزدایی کارآمد موارد حاشیهای، مانند خطاهای پیچیده چرخش دوربین، استفاده میکند.
- استفاده از Long Context برای عملیات Codebase: قابلیتهای Long Context در Gemini 2.5 Pro Preview برای کار بر روی کل Codebase کارتویل استفاده میشود. این امر به توسعهدهندگان این امکان را میدهد که مثلاً Codebaseهای جدید (مانند front-end) را به context اضافه کنند تا به افزودن ویژگیها یا پرسیدن سوالات سطح بالا در مورد معماری و عملکرد سیستم کمک کنند.
توانمندسازی گردشهای کاری انیمیشن
با استفاده از پیشنمایش Gemini 2.5 Pro برای کمک به توسعه الگوریتم، کاوش کد و اشکالزدایی، Cartwheel قصد دارد فرآیندهای توسعه خود را بهبود بخشد و بهینهسازی پلتفرم را تسریع کند. ادغام Imagen 3 روشی ساده برای تولید تصاویر کاراکتر از متن در اختیار کاربران قرار میدهد، در حالی که پیشنمایش Gemini 2.5 Pro به عنوان ابزاری برای کمک به توسعهدهندگان در ساخت فناوری زیربنایی عمل میکند. این ادغامها از اهداف Cartwheel برای سریعتر و قابل دسترستر کردن گردشهای کاری انیمیشن پشتیبانی میکنند و کاربردهایی مانند موارد زیر را ممکن میسازند:
- تسریع در ایجاد دارایی برای بازیها و ویدیو، که به تیمها اجازه میدهد تا روی طراحی اصلی تمرکز کنند.
- تسهیل بازاریابی کارآمد و تولید محتوای رسانههای اجتماعی.
«انیمیشن یکی از نابترین راهها برای بیرون کشیدن یک داستان از ذهن و نمایش آن به جهان است. ما در حال ساخت ابزارهایی هستیم تا این کار را برای همه آسانتر و قابل دسترستر کنیم!»
ساختن آینده انیمیشن
ادغام Imagen 3 و Gemini 2.5 Pro Preview توسط Cartwheel نشان میدهد که چگونه میتوان از هوش مصنوعی گوگل برای فعال کردن ویژگیهای جدید کاربری و کمک به کارهای توسعه پیچیده مورد نیاز برای ساخت ابزارهای نسل بعدی استفاده کرد.
مستندات رابط برنامهنویسی نرمافزار Gemini را بررسی کنید، با Imagen 3 آشنا شوید و کار با Google AI Studio را آغاز کنید.
کارتویل یکی از اعضای صندوق آتی هوش مصنوعی گوگل است که در استارتآپهای بلندپروازی که در حال ساخت آینده هوش مصنوعی هستند، سرمایهگذاری و با آنها همکاری میکند.
هوش مصنوعی بهینه
هوش مصنوعی بهینه (Optimal AI) با استفاده از رابط برنامهنویسی Gemini، زمان بررسی کد را تا 50 درصد کاهش میدهد.