16 במאי 2025
Cartwheel משפרת את אנימציית הדמויות באמצעות Gemini API

Cartwheel משפרת את אנימציית הדמויות באמצעות Gemini API
Cartwheel היא פלטפורמה מתקדמת ליצירת אנימציה מדור הבא, שמאפשרת להשתמש בקלט של שפה טבעית (למשל, "jump", "salsa dance spin") פעולות ישירות של הדמות. החידוש הזה משפר את האופן שבו יוצרים יוצרים אנימציות לסרטונים, למשחקים, לפרסום ולמדיה החברתית. ב-Cartwheel משולבים Imagen 3 לצורך עיצוב אינטואיטיבי של טקסט לדמויות, וגרסה מוקדמת של Gemini 2.5 Pro לצורך פיתוח של אלגוריתמים מתוחכמים ספציפיים לאנימציה, חקירה של מאגרי קוד מורכבים וקידום אופטימיזציה של הפלטפורמה, כדי לאפשר למשתמשים להרחיב את היכולות היצירתיות שלהם לספרת סיפורים.
ניהול אתגרי המחקר והפיתוח בתנועה גנרטיבית תלת-ממדית
כדי לפתח פלטפורמת אנימציה מתקדמת, צריך לא רק כלי עיצוב ידידותיים למשתמש, אלא גם חדשנות מתמשכת באלגוריתמים לקצה העורפי וניהול יעיל של קוד הבסיס. ב-Cartwheel נתקלו באתגר של יצירת אבות טיפוס ופיתוח מהיר של תכונות אנימציה מורכבות, אופטימיזציה של קוד הבסיס הנרחב שלהם לשיפור הביצועים, והענקת אפשרות למפתחים להבין במהירות את המערכת בקנה מידה רחב ולתרום לה. הם נזקקו לשותף AI חזק כדי לשפר את מאמצי הפיתוח שלהם.
איך צוות Cartwheel משתמש ב-Imagen 3 ובתצוגה המקדימה של Gemini 2.5 Pro
ב-Cartwheel משתמשים ב-Gemini API כדי לשפר את צינור עיבוד הנתונים ליצירה שגלוי למשתמשים, ולעזור בתהליכי הפיתוח הפנימיים.
- יצירת דמויות מבוססות-AI באמצעות Imagen 3: פלטפורמת Cartwheel משלבת את היכולות של Imagen 3 להמרת טקסט לתמונה, ומאפשרת ליוצרים להשתמש בהנחיות טקסט כדי ליצור דמויות ייחודיות ולהגות מושגים ישירות בפלטפורמה. אפשר ליצור אנימציה של הדמויות בהתאמה אישית באמצעות שפה טבעית, ולאחר מכן לייצא אותן עם ריגוול מלא, מוכנות לשימוש בתוכנות עריכה תלת-ממדיות סטנדרטיות בתעשייה כמו Maya או Blender, כדי לשלב אותן בסביבות ייצור מקצועיות.
-
סיוע בפיתוח מוצרים ובאופטימיזציה באמצעות גרסת הטרום-השקה של Gemini 2.5 Pro: צוות Cartwheel משתמש בגרסת הטרום-השקה של Gemini 2.5 Pro באופן פנימי כדי לתמוך בתהליכי העבודה של מהנדסי החברה ושל צוות המחקר:
- פיתוח אלגוריתמים: אנחנו משתמשים בגרסת ה-Preview של Gemini 2.5 Pro כדי לפתח תכונות ספציפיות לאנימציה, כולל אלגוריתמים לטשטוש תנועה לסינתז נתונים, פירמידות Laplacian למיזוג ו-IK (קינטיקה הפוכה) אוטומטי ליצירת תנוחות בתוך הכלי לעריכה.
- ניתוח קוד וניפוי באגים: הצוות משתמש ב-Gemini 2.5 Pro Preview כדי לבחון מערכות קוד מורכבות, ליצור רעיונות לניסויים חדשים ולעזור לנפות באגים ביעילות במקרים קיצוניים, כמו שגיאות מורכבות של סיבוב מצלמה.
- שימוש בהקשר ארוך לפעולות בבסיס הקוד: יכולות ההקשר הארוך של Gemini 2.5 Pro Preview משמשות לפעולות בבסיס הקוד כולו של Cartwheel. כך, למשל, מפתחים יכולים להוסיף קודי מקור חדשים (כמו הקצה הקדמי) להקשר כדי להוסיף תכונות או לשאול שאלות ברמה גבוהה על הארכיטקטורה והפונקציונליות של המערכת.
שיפור תהליכי העבודה באנימציה
בעזרת Gemini 2.5 Pro Preview, צוות Cartwheel יכול לקבל עזרה בפיתוח אלגוריתמים, בניתוח קוד ובניפוי באגים, וכך לשפר את תהליכי הפיתוח ולהאיץ את האופטימיזציה של הפלטפורמה. השילוב של Imagen 3 מספק למשתמשים דרך יעילה ליצור רכיבים חזותיים של דמויות מטקסט, בעוד שגרסת טרום ההשקה של Gemini 2.5 Pro משמשת ככלי שעוזר למפתחים לפתח את הטכנולוגיה הבסיסית. השילובים האלה תומכים ביעדים של Cartwheel: להפוך את תהליכי העבודה באנימציה למהירים ונגישים יותר, ולאפשר שימושים כמו:
- יצירת נכסים מהירה יותר למשחקים ולסרטונים, שמאפשרת לצוותים להתמקד בעיצוב הליבה.
- יצירת תוכן יעיל לצורכי שיווק ורשתות חברתיות.
"אנימציה היא אחת הדרכים הטהורות ביותר להוציא סיפור מהראש ולהציג אותו לעולם. אנחנו מפתחים כלים שיעזרו לכם לעשות זאת בקלות ובנגישות לכולם".
יצירת העתיד של האנימציה
השילוב של Imagen 3 ו-Gemini 2.5 Pro Preview ב-Cartwheel מדגים איך אפשר להשתמש ב-AI מבית Google כדי להפעיל תכונות חדשות שמתמקדות במשתמשים ולסייע בעבודת הפיתוח המורכבת שנדרשת כדי ליצור כלים מדור הבא.
כדאי לעיין במסמכי העזרה של Gemini API, ללמוד על Imagen 3 ולהתחיל לעבוד ב-Google AI Studio.
Cartwheel היא חברה שמשתתפת בקרן AI Futures של Google, שמשקיעה בסטארט-אפים שאפתניים שמפתחים את הדור הבא של ה-AI, ומשתפת איתם פעולה.