16 مه 2025
Cartwheel انیمیشن شخصیت ها را با استفاده از Gemini API پیشرفت می دهد

Cartwheel انیمیشن شخصیت ها را با استفاده از Gemini API پیشرفت می دهد
Cartwheel در خط مقدم انیمیشن های نسل بعدی قرار دارد و بستری را ارائه می دهد که در آن ورودی های زبان طبیعی (به عنوان مثال، "پرش"، "چرخش رقص سالسا") کنش های شخصیت را هدایت می کنند. این نوآوری نحوه انیمیشن سازی سازندگان برای ویدیو، بازی، تبلیغات و رسانه های اجتماعی را بهبود می بخشد. Cartwheel Imagen 3 را برای طراحی بصری متن به کاراکتر ادغام میکند و از Gemini 2.5 Pro Preview برای توسعه الگوریتمهای پیچیده انیمیشن خاص، کاوش پایگاههای کد پیچیده و سرعت بخشیدن به بهینهسازی پلتفرم استفاده میکند و به کاربران قدرت میدهد تا داستان سرایی خلاقانه خود را گسترش دهند.
غلبه بر موانع تحقیق و توسعه در حرکت سه بعدی مولد
توسعه یک پلتفرم انیمیشن پیشرفته نه تنها به ابزارهای طراحی کاربر پسند بلکه به نوآوری مداوم در الگوریتم های باطن و مدیریت کارآمد کد پایه نیاز دارد. Cartwheel با چالش نمونهسازی سریع و پیادهسازی ویژگیهای انیمیشن پیچیده، بهینهسازی پایگاه کد گسترده آنها برای عملکرد، و قادر ساختن توسعهدهندگان به درک سریع و مشارکت در یک سیستم در مقیاس بزرگ، مواجه شد. آنها به یک شریک قدرتمند هوش مصنوعی نیاز داشتند تا تلاش های توسعه خود را افزایش دهند.
Cartwheel چگونه از Imagen 3 و Gemini 2.5 Pro Preview استفاده می کند
Cartwheel از Gemini API برای بهبود خط لوله ایجاد کاربر و کمک به فرآیندهای توسعه داخلی خود استفاده می کند.
- مفهوم شخصیت مبتنی بر هوش مصنوعی با Imagen 3: Cartwheel قابلیتهای تصویر به تصویر Imagen 3 را ادغام میکند و به سازندگان این امکان را میدهد تا از پیامهای متنی برای مفهومسازی و تولید تصاویر بصری شخصیت منحصربهفرد مستقیماً در پلتفرم استفاده کنند. این کاراکترهای طراحی شده سفارشی را می توان با استفاده از زبان طبیعی متحرک کرد، سپس به صورت کاملا جعلی و آماده برای نرم افزارهای ویرایش سه بعدی استاندارد صنعتی مانند Maya یا Blender صادر کرد و امکان ادغام در محیط های تولید حرفه ای را فراهم می کند.
- کمک به تحقیق و توسعه و بهینهسازی با پیشنمایش Gemini 2.5 Pro: تیم Cartwheel از Gemini 2.5 Pro Preview به صورت داخلی برای پشتیبانی از جریانهای کاری مهندسی و تحقیقاتی خود استفاده میکند:
- در حال توسعه الگوریتمها: پیشنمایش Gemini 2.5 Pro برای کمک به توسعه ویژگیهای خاص انیمیشن، از جمله الگوریتمهای تاری حرکت برای ترکیب دادهها، هرمهای لاپلاسی برای ترکیب، و IK خودکار (Inverse Kinematics) برای ژست گرفتن در ویرایشگر استفاده میشود.
- کاوش کد و اشکالزدایی: این تیم از Gemini 2.5 Pro Preview برای بررسی پایگاههای کد پیچیده، ایجاد ایدههایی برای آزمایشهای جدید، و کمک به اشکالزدایی کارآمد لبهها، مانند خطاهای پیچیده چرخش دوربین، استفاده میکند.
- استفاده از زمینه طولانی برای عملیات Codebase: قابلیت های زمینه طولانی Gemini 2.5 Pro Preview برای کار بر روی کل پایگاه کد Cartwheel استفاده می شود. این به توسعه دهندگان این امکان را می دهد که، برای مثال، پایگاه های کد جدید (مانند قسمت جلویی) را در متن بیاورند تا به افزودن ویژگی ها کمک کنند یا سؤالات سطح بالا در مورد معماری و عملکرد سیستم بپرسند.
توانمندسازی گردش کار انیمیشن
با استفاده از Gemini 2.5 Pro Preview برای کمک به توسعه الگوریتم، کاوش کد و اشکالزدایی، Cartwheel قصد دارد فرآیندهای توسعه خود را بهبود بخشد و بهینهسازی پلتفرم را تسریع بخشد. ادغام Imagen 3 راهی ساده را برای تولید تصاویر بصری کاراکتر از متن در اختیار کاربران قرار می دهد، در حالی که Gemini 2.5 Pro Preview به عنوان ابزاری برای کمک به توسعه دهندگان در ساخت فناوری زیربنایی عمل می کند. این ادغامها از اهداف Cartwheel برای سریعتر کردن و در دسترستر کردن گردشهای کاری انیمیشن پشتیبانی میکنند و امکان استفادههایی مانند موارد زیر را فراهم میکنند:
- تسریع ایجاد دارایی برای بازیها و ویدیوها، به تیمها اجازه میدهد روی طراحی اصلی تمرکز کنند.
- تسهیل بازاریابی کارآمد و تولید محتوای رسانه های اجتماعی.
"انیمیشن یکی از نابترین راهها برای خارج کردن داستان از ذهن شما و نشان دادن آن به جهان است. ما در حال ساخت ابزارهایی هستیم تا آن را برای همه آسانتر و در دسترستر کنیم!"
ساخت آینده انیمیشن
ادغام Cartwheel از Imagen 3 و Gemini 2.5 Pro Preview نشان می دهد که چگونه می توان از هوش مصنوعی Google برای فعال کردن ویژگی های جدید کاربر و کمک به کارهای توسعه پیچیده مورد نیاز برای ساخت ابزارهای نسل بعدی استفاده کرد.
اسناد Gemini API را کاوش کنید، درباره Imagen 3 بیاموزید و در Google AI Studio شروع به کار کنید.
Cartwheel یکی از شرکتکنندگان در صندوق آینده هوش مصنوعی گوگل است که در استارتآپهای بلندپرواز سرمایهگذاری میکند و با آنها همکاری میکند تا آیندهای در هوش مصنوعی ایجاد کند.
هوش مصنوعی بهینه
هوش مصنوعی بهینه از Gemini API برای کاهش زمان بازبینی کد تا 50٪ استفاده می کند.