به اشتراک بگذارید

16 مه 2025

Cartwheel انیمیشن شخصیت ها را با استفاده از Gemini API پیشرفت می دهد

جاناتان جارویس

یکی از بنیانگذاران و CTO

اندرو کار

هم بنیانگذار و دانشمند ارشد

ویشال دارمادیکاری

هوش مصنوعی DevRel

قهرمان ویترین Cartwheel

Cartwheel انیمیشن شخصیت ها را با استفاده از Gemini API پیشرفت می دهد

Cartwheel در خط مقدم انیمیشن های نسل بعدی قرار دارد و بستری را ارائه می دهد که در آن ورودی های زبان طبیعی (به عنوان مثال، "پرش"، "چرخش رقص سالسا") کنش های شخصیت را هدایت می کنند. این نوآوری نحوه انیمیشن سازی سازندگان برای ویدیو، بازی، تبلیغات و رسانه های اجتماعی را بهبود می بخشد. Cartwheel Imagen 3 را برای طراحی بصری متن به کاراکتر ادغام می‌کند و از Gemini 2.5 Pro Preview برای توسعه الگوریتم‌های پیچیده انیمیشن خاص، کاوش پایگاه‌های کد پیچیده و سرعت بخشیدن به بهینه‌سازی پلتفرم استفاده می‌کند و به کاربران قدرت می‌دهد تا داستان سرایی خلاقانه خود را گسترش دهند.

غلبه بر موانع تحقیق و توسعه در حرکت سه بعدی مولد

توسعه یک پلتفرم انیمیشن پیشرفته نه تنها به ابزارهای طراحی کاربر پسند بلکه به نوآوری مداوم در الگوریتم های باطن و مدیریت کارآمد کد پایه نیاز دارد. Cartwheel با چالش نمونه‌سازی سریع و پیاده‌سازی ویژگی‌های انیمیشن پیچیده، بهینه‌سازی پایگاه کد گسترده آن‌ها برای عملکرد، و قادر ساختن توسعه‌دهندگان به درک سریع و مشارکت در یک سیستم در مقیاس بزرگ، مواجه شد. آنها به یک شریک قدرتمند هوش مصنوعی نیاز داشتند تا تلاش های توسعه خود را افزایش دهند.

Cartwheel چگونه از Imagen 3 و Gemini 2.5 Pro Preview استفاده می کند

Cartwheel از Gemini API برای بهبود خط لوله ایجاد کاربر و کمک به فرآیندهای توسعه داخلی خود استفاده می کند.

  • مفهوم شخصیت مبتنی بر هوش مصنوعی با Imagen 3: Cartwheel قابلیت‌های تصویر به تصویر Imagen 3 را ادغام می‌کند و به سازندگان این امکان را می‌دهد تا از پیام‌های متنی برای مفهوم‌سازی و تولید تصاویر بصری شخصیت منحصربه‌فرد مستقیماً در پلتفرم استفاده کنند. این کاراکترهای طراحی شده سفارشی را می توان با استفاده از زبان طبیعی متحرک کرد، سپس به صورت کاملا جعلی و آماده برای نرم افزارهای ویرایش سه بعدی استاندارد صنعتی مانند Maya یا Blender صادر کرد و امکان ادغام در محیط های تولید حرفه ای را فراهم می کند.
  • کمک به تحقیق و توسعه و بهینه‌سازی با پیش‌نمایش Gemini 2.5 Pro: تیم Cartwheel از Gemini 2.5 Pro Preview به صورت داخلی برای پشتیبانی از جریان‌های کاری مهندسی و تحقیقاتی خود استفاده می‌کند:
    • در حال توسعه الگوریتم‌ها: پیش‌نمایش Gemini 2.5 Pro برای کمک به توسعه ویژگی‌های خاص انیمیشن، از جمله الگوریتم‌های تاری حرکت برای ترکیب داده‌ها، هرم‌های لاپلاسی برای ترکیب، و IK خودکار (Inverse Kinematics) برای ژست گرفتن در ویرایشگر استفاده می‌شود.
    • کاوش کد و اشکال‌زدایی: این تیم از Gemini 2.5 Pro Preview برای بررسی پایگاه‌های کد پیچیده، ایجاد ایده‌هایی برای آزمایش‌های جدید، و کمک به اشکال‌زدایی کارآمد لبه‌ها، مانند خطاهای پیچیده چرخش دوربین، استفاده می‌کند.
    • استفاده از زمینه طولانی برای عملیات Codebase: قابلیت های زمینه طولانی Gemini 2.5 Pro Preview برای کار بر روی کل پایگاه کد Cartwheel استفاده می شود. این به توسعه دهندگان این امکان را می دهد که، برای مثال، پایگاه های کد جدید (مانند قسمت جلویی) را در متن بیاورند تا به افزودن ویژگی ها کمک کنند یا سؤالات سطح بالا در مورد معماری و عملکرد سیستم بپرسند.

توانمندسازی گردش کار انیمیشن

با استفاده از Gemini 2.5 Pro Preview برای کمک به توسعه الگوریتم، کاوش کد و اشکال‌زدایی، Cartwheel قصد دارد فرآیندهای توسعه خود را بهبود بخشد و بهینه‌سازی پلتفرم را تسریع بخشد. ادغام Imagen 3 راهی ساده را برای تولید تصاویر بصری کاراکتر از متن در اختیار کاربران قرار می دهد، در حالی که Gemini 2.5 Pro Preview به عنوان ابزاری برای کمک به توسعه دهندگان در ساخت فناوری زیربنایی عمل می کند. این ادغام‌ها از اهداف Cartwheel برای سریع‌تر کردن و در دسترس‌تر کردن گردش‌های کاری انیمیشن پشتیبانی می‌کنند و امکان استفاده‌هایی مانند موارد زیر را فراهم می‌کنند:

  • تسریع ایجاد دارایی برای بازی‌ها و ویدیوها، به تیم‌ها اجازه می‌دهد روی طراحی اصلی تمرکز کنند.
  • تسهیل بازاریابی کارآمد و تولید محتوای رسانه های اجتماعی.

"انیمیشن یکی از ناب‌ترین راه‌ها برای خارج کردن داستان از ذهن شما و نشان دادن آن به جهان است. ما در حال ساخت ابزارهایی هستیم تا آن را برای همه آسان‌تر و در دسترس‌تر کنیم!"

- جاناتان جارویس، مدیر عامل / بنیانگذار Cartwheel

ساخت آینده انیمیشن

ادغام Cartwheel از Imagen 3 و Gemini 2.5 Pro Preview نشان می دهد که چگونه می توان از هوش مصنوعی Google برای فعال کردن ویژگی های جدید کاربر و کمک به کارهای توسعه پیچیده مورد نیاز برای ساخت ابزارهای نسل بعدی استفاده کرد.

اسناد Gemini API را کاوش کنید، درباره Imagen 3 بیاموزید و در Google AI Studio شروع به کار کنید.

Cartwheel یکی از شرکت‌کنندگان در صندوق آینده هوش مصنوعی گوگل است که در استارت‌آپ‌های بلندپرواز سرمایه‌گذاری می‌کند و با آن‌ها همکاری می‌کند تا آینده‌ای در هوش مصنوعی ایجاد کند.

هوش مصنوعی بهینه

هوش مصنوعی بهینه از Gemini API برای کاهش زمان بازبینی کد تا 50٪ استفاده می کند.