اشتراک گذاری

۱۶ مه ۲۰۲۵

Cartwheel با استفاده از Gemini API انیمیشن شخصیت را ارتقا می‌دهد

جاناتان جارویس

هم‌بنیانگذار و مدیر ارشد فناوری

اندرو کار

بنیانگذار و دانشمند ارشد

ویشال دارمادیکاری

توسعه‌دهنده هوش مصنوعی

قهرمان ویترین چرخ و فلک

Cartwheel با استفاده از Gemini API انیمیشن شخصیت را ارتقا می‌دهد

کارت‌ویل در خط مقدم انیمیشن نسل بعدی قرار دارد و پلتفرمی را ارائه می‌دهد که در آن ورودی‌های زبان طبیعی (مثلاً "پرش"، "چرخش رقص سالسا") حرکات شخصیت را هدایت می‌کنند. این نوآوری نحوه‌ی انیمیشن‌سازی سازندگان برای ویدیو، بازی، تبلیغات و رسانه‌های اجتماعی را بهبود می‌بخشد. کارت‌ویل Imagen 3 را برای طراحی بصری تبدیل متن به شخصیت ادغام می‌کند و از پیش‌نمایش Gemini 2.5 Pro برای توسعه الگوریتم‌های پیچیده‌ی مخصوص انیمیشن، کاوش در پایگاه‌های کد پیچیده و تسریع بهینه‌سازی پلتفرم استفاده می‌کند و به کاربران این امکان را می‌دهد تا داستان‌سرایی خلاقانه‌ی خود را گسترش دهند.

غلبه بر موانع تحقیق و توسعه در حرکت مولد سه‌بعدی

توسعه یک پلتفرم انیمیشن پیشرفته نه تنها به ابزارهای طراحی کاربرپسند، بلکه به نوآوری مداوم در الگوریتم‌های backend و مدیریت کارآمد پایگاه کد نیز نیاز دارد. Cartwheel با چالش نمونه‌سازی سریع و پیاده‌سازی ویژگی‌های پیچیده انیمیشن، بهینه‌سازی پایگاه کد گسترده خود برای عملکرد بهتر و قادر ساختن توسعه‌دهندگان به درک سریع و مشارکت در یک سیستم در مقیاس بزرگ مواجه بود. آنها به یک شریک قدرتمند هوش مصنوعی نیاز داشتند تا تلاش‌های توسعه خود را تقویت کنند.

نحوه استفاده Cartwheel از پیش‌نمایش Imagen 3 و Gemini 2.5 Pro

کارت‌ویل از رابط برنامه‌نویسی نرم‌افزار Gemini برای بهبود فرآیند تولید محتوا برای کاربران و کمک به فرآیندهای توسعه داخلی خود استفاده می‌کند.

  • طراحی شخصیت مبتنی بر هوش مصنوعی با Imagen 3: Cartwheel قابلیت‌های تبدیل متن به تصویر Imagen 3 را ادغام می‌کند و به سازندگان اجازه می‌دهد تا از پیام‌های متنی برای مفهوم‌سازی و تولید تصاویر منحصر به فرد شخصیت‌ها مستقیماً در داخل پلتفرم استفاده کنند. این شخصیت‌های سفارشی را می‌توان با استفاده از زبان طبیعی متحرک‌سازی کرد، سپس به طور کامل ریگ‌بندی شده و آماده برای نرم‌افزارهای ویرایش سه‌بعدی استاندارد صنعتی مانند Maya یا Blender صادر کرد و امکان ادغام در محیط‌های تولید حرفه‌ای را فراهم نمود.
  • کمک به تحقیق و توسعه و بهینه‌سازی با پیش‌نمایش Gemini 2.5 Pro: تیم Cartwheel از پیش‌نمایش Gemini 2.5 Pro به صورت داخلی برای پشتیبانی از گردش‌های کاری مهندسی و تحقیقاتی خود استفاده می‌کند:
    • توسعه الگوریتم‌ها: پیش‌نمایش Gemini 2.5 Pro برای کمک به توسعه ویژگی‌های خاص انیمیشن، از جمله الگوریتم‌های تاری حرکت برای سنتز داده‌ها، هرم‌های لاپلاسی برای ترکیب و IK خودکار (سینماتیک معکوس) برای ژست‌دهی در ویرایشگر، به کار گرفته شده است.
    • کاوش و اشکال‌زدایی کد: این تیم از پیش‌نمایش Gemini 2.5 Pro برای کاوش در پایگاه‌های کد پیچیده، ایجاد ایده برای آزمایش‌های جدید و کمک به اشکال‌زدایی کارآمد موارد حاشیه‌ای، مانند خطاهای پیچیده چرخش دوربین، استفاده می‌کند.
    • استفاده از Long Context برای عملیات Codebase: قابلیت‌های Long Context در Gemini 2.5 Pro Preview برای کار بر روی کل Codebase کارت‌ویل استفاده می‌شود. این امر به توسعه‌دهندگان این امکان را می‌دهد که مثلاً Codebaseهای جدید (مانند front-end) را به context اضافه کنند تا به افزودن ویژگی‌ها یا پرسیدن سوالات سطح بالا در مورد معماری و عملکرد سیستم کمک کنند.

توانمندسازی گردش‌های کاری انیمیشن

با استفاده از پیش‌نمایش Gemini 2.5 Pro برای کمک به توسعه الگوریتم، کاوش کد و اشکال‌زدایی، Cartwheel قصد دارد فرآیندهای توسعه خود را بهبود بخشد و بهینه‌سازی پلتفرم را تسریع کند. ادغام Imagen 3 روشی ساده برای تولید تصاویر کاراکتر از متن در اختیار کاربران قرار می‌دهد، در حالی که پیش‌نمایش Gemini 2.5 Pro به عنوان ابزاری برای کمک به توسعه‌دهندگان در ساخت فناوری زیربنایی عمل می‌کند. این ادغام‌ها از اهداف Cartwheel برای سریع‌تر و قابل دسترس‌تر کردن گردش‌های کاری انیمیشن پشتیبانی می‌کنند و کاربردهایی مانند موارد زیر را ممکن می‌سازند:

  • تسریع در ایجاد دارایی برای بازی‌ها و ویدیو، که به تیم‌ها اجازه می‌دهد تا روی طراحی اصلی تمرکز کنند.
  • تسهیل بازاریابی کارآمد و تولید محتوای رسانه‌های اجتماعی.

«انیمیشن یکی از ناب‌ترین راه‌ها برای بیرون کشیدن یک داستان از ذهن و نمایش آن به جهان است. ما در حال ساخت ابزارهایی هستیم تا این کار را برای همه آسان‌تر و قابل دسترس‌تر کنیم!»

- جاناتان جارویس، مدیرعامل / هم‌بنیانگذار، کارت‌ویل

ساختن آینده انیمیشن

ادغام Imagen 3 و Gemini 2.5 Pro Preview توسط Cartwheel نشان می‌دهد که چگونه می‌توان از هوش مصنوعی گوگل برای فعال کردن ویژگی‌های جدید کاربری و کمک به کارهای توسعه پیچیده مورد نیاز برای ساخت ابزارهای نسل بعدی استفاده کرد.

مستندات رابط برنامه‌نویسی نرم‌افزار Gemini را بررسی کنید، با Imagen 3 آشنا شوید و کار با Google AI Studio را آغاز کنید.

کارت‌ویل یکی از اعضای صندوق آتی هوش مصنوعی گوگل است که در استارت‌آپ‌های بلندپروازی که در حال ساخت آینده هوش مصنوعی هستند، سرمایه‌گذاری و با آنها همکاری می‌کند.

هوش مصنوعی بهینه

هوش مصنوعی بهینه (Optimal AI) با استفاده از رابط برنامه‌نویسی Gemini، زمان بررسی کد را تا 50 درصد کاهش می‌دهد.