שיתוף

‫12 בדצמבר 2025

‫Toongether שומר על עקביות בסגנון האומנותי באמצעות Gemini 2.5 Flash Image

סמיר נאסר אדין

מייסד שותף של toongether

גיום ורנד

DeepMind Senior Developer Advocate

תמונה ראשית של Toongether

ההתפתחות של AI גנרטיבי פתחה אפשרויות חדשות לביטוי יצירתי, ומאפשרת למפתחים ליצור כלים שהופכים משתמשים רגילים לאומנים. עם זאת, כשמדובר באומנות רציפה כמו קומיקס, האתגר הוא לא רק ליצור תמונה טובה אחת, אלא ליצור עשרות לוחות עם דמויות, סגנונות וסיפורים עקביים.

חברת Toongether, שמפתחת את אפליקציית הקומיקס באינטרנט, מתמודדת עם האתגר הזה באופן ישיר. המטרה שלהם היא להנגיש את סיפורים חזותיים לכולם, ולספק פלטפורמה שבה משתמשים רגילים יכולים לא רק כבר קראתי קומיקס, אלא גם ליצור ולשתף קומיקס משלהם ישירות מהמכשירים הניידים שלהם. הם משלבים את Gemini 2.5 Flash Image בצינור היצירה שלהם כדי לעזור למשתמשים להתגבר על המכשולים הטכניים של ציור, וכך מאפשרים לקהילה חדשה של מספרים ליצור יחד.

שמירה על עקביות בקנה מידה נרחב

יצירת קומיקס דורשת עקביות קפדנית. הדמויות צריכות להישאר מזוהות בתנוחות, בתלבושות ובבעיטויי פנים שונים, וכל זאת תוך שמירה על סגנון אמנותי אחיד.

בתחילה, צוות toongether הסתמך על מחסנית מורכבת שכללה מודל Stable Diffusion XL מכוונן, ששופר באמצעות כלים כמו ControlNet ו-IPAdapters. השיטה הזו הניבה תוצאות איכותיות, אבל היא התקשתה להתמודד עם זמן האחזור והגמישות – צווארי בקבוק משמעותיים למפתחים של אפליקציות לנייד. יצירת תמונה אחת נמשכה בין 20 ל-30 שניות, שזה יותר מדי זמן בשביל חוויית משתמש חלקה. בנוסף, כדי להוסיף תמיכה בתנוחות חדשות או בסגנונות ציור חדשים נדרש מאמץ הנדסי משמעותי, מה שמגביל את היכולת שלהם לבצע איטרציות במהירות.

תזמור של צינורות עיבוד נתונים מורכבים באמצעות Gemini

כדי להתגבר על צווארי הבקבוק האלה, חברת toongether העבירה את צינור יצירת התמונות המרכזי שלה ל-Gemini API. הם בחרו ב-Gemini 2.5 Flash Image – שנקרא גם Nano Banana בחיבה בגלל המהירות והגמישות שלו – שהציע את היכולות המתקדמות של עריכה וביצוע הוראות שנדרשות לטיפול במשימות מורכבות של יצירה מרובת שלבים.

המעבר האיץ באופן דרמטי את קצב ההתקדמות במשפך השיווק שלהם, כשהצוות עבר מאב טיפוס להטמעה מלאה של הייצור תוך שבועיים בלבד.

כדי לשמור על עקביות הדמויות ולאפשר למשתמשים להתאים אישית את התמונות, צוות toongether השתמש ב-Gemini 2.5 Flash Image כדי לבנות צינור מורכב עם כמה שלבים:

  • ניתוח סגנון ויצירת הפניה: כשמשתמש יוצר דמות חדשה, האפליקציה מספקת למודל רשימה שנבחרה בקפידה של דמויות להפניה כדי לנתח את הסגנון הרצוי. על סמך תיאור טקסט פשוט, המודל יוצר תמונה לדוגמה של הדמות המקורית החדשה בתנוחה ניטרלית.
  • חבילות נכסים ויצירת תנוחות: כדי להוסיף את הדמות לסיפור, toongether משתמשת ב'חבילות נכסים' – רשימות מקובצות של תיאורים לתנוחות ולתרחישי שימוש רצויים. באמצעות הנחיה עם הוראות ותמונת הדוגמה הניטרלית, הם יכולים להנחות את Gemini 2.5 Flash Image ליצור תרחישים ספציפיים בלי לפגוע בזהות החזותית של הדמות.
  • קומפוזיציה של הסצנה: הצוות מספק תמונות לדוגמה של רקעים ורכיבים אחרים כדי להסיק את סגנון האומנות הנכון, וכך לוודא שהלוחות יהיו עקביים.

HubX

"הצלחנו לתמוך בכל תרחישי השימוש שלנו באמצעות יכולות העריכה וההוראות המתקדמות של Gemini 2.5 Flash Image", מסביר סמיר נאסר אדין, מייסד שותף של toongether. "היא הפכה לחלק חיוני בתהליכי יצירת התמונות שלנו".

מה השלב הבא ב-toongether

אחרי שהצוות של toongether הניח את היסודות, הוא מתכנן להוסיף תכונות מתקדמות של נרטיב, שבעבר נחשבו כדורשות יותר מדי משאבים. הם מתכננים להשתמש במודלים של Gemini כדי לתמוך באינטראקציות מורכבות בין כמה דמויות בתוך פאנל אחד, וכדי להציג מגוון רחב יותר של סגנונות ציור.

המסע של toongether ממחיש איך Gemini API עוזר לדור הבא של יוצרים לעבור מניהול של מערכות מורכבות של מודלים ליצירת כלים יצירתיים מתוחכמים ועקביים שמתאימים גם למשתמשים מזדמנים.

כדי להתחיל לבנות אפליקציות יצירתיות משלכם באמצעות מודלים של Gemini, כדאי לקרוא את תיעוד ה-API.