7 בנובמבר 2025
HubX משלב את Gemini 2.5 Flash Image לעריכת תמונות בהקשר עם זמן אחזור נמוך באפליקציית ReShoot
HubX הוא מרכז טכנולוגי גלובלי שמשרת יותר מ-300 מיליון משתמשים באמצעות חבילת האפליקציות לנייד שלו. כשפיתחו את האפליקציה האחרונה שלהם, ReShoot, הם שאפו להנגיש את עריכת התמונות ברמה מקצועית באמצעות AI גנרטיבי. באמצעות Gemini API, הצוות הצליח להשיג מהירות פיתוח יוצאת דופן, והפרויקט עבר משלב התחלת הפיתוח של MVP להשקה חיה ב-iOS תוך שבועיים בלבד. זמן קצר לאחר מכן, אפליקציית ReShoot הגיעה למקום הראשון בקטגוריית הגרפיקה והעיצוב בארה "ב ב-App Store.
המטרה של האפליקציה היא לאפשר למשתמשים לשנות את הסצנה או הסגנון של תמונה בלי לאבד את המראה הטבעי והזהות של הנושא המקורי. למפתחים, לספק רמה כזו של נימוק מורכב ורב-אופני במסגרת הדרישות המחמירות של זמן אחזור נמוך בחוויית שימוש בנייד, מהווה אתגר ארכיטקטוני משמעותי. כדי לפתור את הבעיה הזו, חברת HubX השתמשה ב-Gemini API כדי לבנות צינור מתוחכם לעריכת תמונות, שמשלב בין הבנה הקשרית ברמת דיוק גבוהה לבין מהירות הסקה יוצאת דופן.
עריכה באיכות גבוהה עם Nano Banana
כדי לבנות את מנוע הנימוקים שמאחורי ReShoot, חברת HubX עבדה עם צוות Google כדי לשלב את Gemini 2.5 Flash Image, שנקרא גם Nano Banana.
אתגר טכני מרכזי ביצירת תמונות מתמונות הוא שמירה על זהות הנושא תוך פענוח בקשות מורכבות של סצנות. בניגוד לצינורות מסורתיים שלרוב דורשים שרשור של מודלים נפרדים להסקת מסקנות מטקסט ולסינתזת תמונות, Gemini 2.5 Flash Image הוא מולטי-מודאלי באופן טבעי. הוא מעבד הנחיות טקסט וקלט של תמונות בשלב אחד ומאוחד.
הארכיטקטורה הזו מאפשרת ל-ReShoot לבצע עריכה שיחתית (תמונה + טקסט לתמונה) תוך הקפדה על ההנחיות של המשתמשים, ושמירה על הזהות וההקשר של התמונות שהועלו. בהשוואה לחלופות שנבדקו, ב-HubX גילו שהמודל של Gemini מציע הבנה חזותית מעולה ועקביות מולטי-מודאלית.
הפחתת זמן האחזור של האפליקציה ב-40%
יצירת תמונות באיכות גבוהה היא חובה, אבל משתמשים בניידים מצפים לתוצאות כמעט מיידיות. כל חיכוך בתהליך היצירתי עלול להוביל לירידה ברמת המעורבות.
החברה השתמשה במודל Gemini 2.5 Flash Image כדי ליצור תמונות, וכך קיצרה את זמן התגובה הממוצע לעדכון ולעריכה של תמונות בכמעט 40%. הקיצור המשמעותי הזה של זמן האחזור משפר את חוויית המשתמש, והופך את מצב ההמתנה הפסיבי לתהליך יצירתי דינמי. זה חשוב במיוחד לשימור משתמשים באפליקציות לנייד.
ייעול תהליכי העבודה של הפיתוח
בנוסף לשיפורים המיידיים בביצועים, השילוב של Gemini API פישט באופן משמעותי את ארכיטקטורת הפיתוח של HubX. הצוות משתמש ב-Google AI Studio כדי ליצור אב טיפוס ולבדוק שרשראות הנחיות לפני הפריסה שלהן בסביבת הייצור באמצעות חבילות Node.js מותאמות אישית שמחוברות לקצה העורפי של האפליקציה לנייד.
לפני השימוש במודלים של Gemini, משימות שכללו ניתוח נתונים מולטימודאליים דרשו לרוב לוגיקה מורכבת בהתאמה אישית או שרשור של מודלים שונים. בעזרת Gemini 2.5 Flash Image, HubX הצליחה לאחד את המשימות האלה למסגרת מודלים אחת ועקבית, וכך לצמצם את המורכבות האדריכלית ולשפר את מהירות ההסקה.
השלב הבא
אחרי השילוב המוצלח של Gemini API, חברת HubX הבחינה בעלייה ברמת המעורבות של המשתמשים, כפי שאפשר לראות בשיעורי השמירה והלייקים הגבוהים יותר של התוכן שנוצר. בעתיד, הם מתכננים להפוך את ReShoot מכלי למטרה אחת לפלטפורמה מקיפה לעריכת תמונות בצורה חלקה.
ההטמעה של HubX מדגימה איך מפתחים יכולים לנצל את המהירות ואת היכולות המולטימודאליות המובנות של Gemini API כדי ליצור אפליקציות אינטואיטיביות עם ביצועים גבוהים שעונות על הדרישות של משתמשים בנייד.
כדי להתחיל ליצור תמונות באמצעות מודלים של Gemini, אפשר לקרוא את התיעוד שלנו בנושא יצירת תמונות.