שיתוף

‫16 במאי 2025

‫Cartwheel משפרת את אנימציית הדמויות באמצעות Gemini API

ג'ונתן ג'רוויס

מייסד שותף ומנהל טכנולוגיות ראשי (CTO)

Andrew Carr

מייסד שותף ומדען ראשי

וישאל דהרמדיקארי

AI DevRel

תמונה ראשית (Hero) של Cartwheel

‫Cartwheel משפרת את אנימציית הדמויות באמצעות Gemini API

‫Cartwheel נמצאת בחזית של האנימציה מהדור הבא, ומציעה פלטפורמה שבה קלט של שפה טבעית (למשל, 'קפיצה', 'סיבוב סלסה') פעולות ישירות של הדמות. החידוש הזה משפר את האופן שבו יוצרים יוצרים אנימציה לסרטונים, למשחקים, לפרסום ולמדיה חברתית. ‫Cartwheel משלב את Imagen 3 לעיצוב אינטואיטיבי של טקסט לדמויות, ומשתמש בגרסת טרום-ההשקה של Gemini 2.5 Pro כדי לפתח אלגוריתמים מתוחכמים שמתאימים במיוחד לאנימציה, לבחון בסיסי קוד מורכבים ולזרז את האופטימיזציה של הפלטפורמה. כך המשתמשים יכולים להרחיב את היכולות שלהם ליצירת סיפורים.

התמודדות עם מכשולים במחקר ופיתוח של תנועה תלת-ממדית גנרטיבית

פיתוח פלטפורמת אנימציה מתקדמת דורש לא רק כלי עיצוב ידידותיים למשתמש, אלא גם חדשנות מתמשכת באלגוריתמים של ה-Backend וניהול יעיל של בסיס הקוד. צוות Cartwheel התמודד עם האתגרים הבאים: יצירת אבות טיפוס והטמעה מהירה של תכונות אנימציה מורכבות, אופטימיזציה של בסיס הקוד הנרחב לשיפור הביצועים, ומתן אפשרות למפתחים להבין במהירות את המערכת רחבת ההיקף ולתרום לה. הם היו צריכים שותף AI חזק שיעזור להם לשפר את מאמצי הפיתוח.

איך Cartwheel משתמש ב-Imagen 3 וב-Gemini 2.5 Pro Preview

‫Cartwheel משתמשת ב-Gemini API כדי לשפר את צינור היצירה שפונה למשתמשים ולסייע בתהליכי הפיתוח הפנימיים שלה.

  • יצירת דמויות מבוססת-AI עם Imagen 3: Cartwheel משלבת את היכולות של Imagen 3 ליצירת תמונות מטקסט, ומאפשרת ליוצרים להשתמש בהנחיות טקסט כדי ליצור דמויות ייחודיות ישירות בפלטפורמה. אפשר להנפיש את הדמויות המותאמות אישית האלה באמצעות שפה טבעית, ואז לייצא אותן כשהן מוכנות לחלוטין לשימוש בתוכנות עריכה תלת-ממדיות בתקן התעשייה, כמו Maya או Blender, וכך לשלב אותן בסביבות הפקה מקצועיות.
  • עזרה במו"פ ובאופטימיזציה באמצעות גרסת טרום-השקה (Preview) של Gemini 2.5 Pro: הצוות של Cartwheel משתמש בגרסת טרום-השקה (Preview) של Gemini 2.5 Pro באופן פנימי כדי לתמוך בתהליכי העבודה של ההנדסה והמחקר:
    • פיתוח אלגוריתמים: נעשה שימוש בגרסת טרום-השקה של Gemini 2.5 Pro כדי לפתח תכונות ספציפיות לאנימציה, כולל אלגוריתמים לטשטוש תנועה לסינתזת נתונים, פירמידות לפלסיאן למיזוג ו-IK אוטומטי (קינמטיקה הפוכה) ליצירת תנוחות בעורך.
    • בדיקה וניפוי באגים בקוד: הצוות משתמש בגרסת הטרום-השקה של Gemini 2.5 Pro כדי לבדוק בסיסי קוד מורכבים, ליצור רעיונות לניסויים חדשים ולעזור בניפוי באגים ביעילות במקרים קיצוניים, כמו שגיאות מורכבות בסיבוב המצלמה.
    • שימוש בהקשר ארוך לפעולות בבסיס קוד: היכולות של ההקשר הארוך בגרסת הטרום-השקה של Gemini 2.5 Pro משמשות לפעולות בכל בסיס הקוד של Cartwheel. כך, למשל, מפתחים יכולים להוסיף בסיסי קוד חדשים (כמו קצה הלקוח) להקשר כדי לעזור להם להוסיף תכונות או לשאול שאלות ברמה גבוהה על הארכיטקטורה והפונקציונליות של המערכת.

שיפור תהליכי העבודה של אנימציה

באמצעות Gemini 2.5 Pro Preview, ‏ Cartwheel שואפת לשפר את תהליכי הפיתוח שלה ולהאיץ את האופטימיזציה של הפלטפורמה, בעזרת פיתוח אלגוריתמים, ניתוח קוד וניפוי באגים. השילוב של Imagen 3 מספק למשתמשים דרך יעילה ליצור רכיבים חזותיים של דמויות מטקסט, בעוד שגרסת טרום ההשקה של Gemini 2.5 Pro משמשת ככלי שמסייע למפתחים לבנות את הטכנולוגיה הבסיסית. השילובים האלה תומכים במטרות של Cartwheel: להפוך את תהליכי העבודה של האנימציה למהירים ונגישים יותר, ולאפשר שימושים כמו:

  • האצת יצירת נכסים למשחקים ולסרטונים, כדי לאפשר לצוותים להתמקד בעיצוב הליבה.
  • עוזר ליצור תוכן שיווקי ותוכן לרשתות החברתיות בצורה יעילה.

"אנימציה היא אחת הדרכים הכי טהורות להוציא סיפור מהראש ולהראות אותו לעולם. אנחנו מפתחים כלים כדי להפוך את התהליך הזה לקל ונגיש יותר לכולם".

‫- ג'ונתן ג'רוויס (Jonathan Jarvis), מנכ"ל / מייסד שותף, Cartwheel

בונים את העתיד של האנימציה

השילוב של Imagen 3 ו-Gemini 2.5 Pro בגרסת טרום-ההשקה ב-Cartwheel מדגיש איך אפשר להשתמש ב-AI מבית Google כדי להוסיף תכונות חדשות שפונות למשתמשים ולעזור בעבודת הפיתוח המורכבת שנדרשת לבניית כלים מהדור הבא.

מומלץ לעיין במסמכי התיעוד של Gemini API, לקרוא על Imagen 3 ולהתחיל להשתמש ב-Google AI Studio.

‫Cartwheel משתתפת בקרן העתיד של Google AI, שמשקיעה בסטארטאפים שאפתניים ומשתפת איתם פעולה כדי לבנות את הדור הבא של ה-AI.