शेयर करें

7 नवंबर, 2025

HubX ने ReShoot ऐप्लिकेशन में, Gemini 2.5 Flash Image को इंटिग्रेट किया है. इससे, कम समय में कॉन्टेक्स्ट के हिसाब से फ़ोटो में बदलाव किया जा सकता है

सेर्तक चनार

सीनियर प्रॉडक्ट मैनेजर, HubX

विशाल धर्माधिकारी

प्रॉडक्ट सॉल्यूशंस इंजीनियर

Pascal AI Showcase Hero

HubX एक ग्लोबल टेक्नोलॉजी हब है. यह अपने मोबाइल ऐप्लिकेशन के पोर्टफ़ोलियो के ज़रिए, 30 करोड़ से ज़्यादा उपयोगकर्ताओं को सेवाएं देता है. ReShoot नाम का नया ऐप्लिकेशन बनाते समय, उनका मकसद जनरेटिव एआई का इस्तेमाल करके, प्रोफ़ेशनल लेवल पर फ़ोटो एडिटिंग की सुविधा को सभी के लिए उपलब्ध कराना था. Gemini API का इस्तेमाल करके, टीम ने बहुत कम समय में इस प्रोजेक्ट को पूरा किया. एमवीपी (मिनिमम वायबल प्रॉडक्ट) डेवलपमेंट की शुरुआत से लेकर iOS पर लाइव लॉन्च करने तक, टीम को सिर्फ़ दो हफ़्ते लगे. इसके कुछ समय बाद, ReShoot ने अमेरिका में App Store पर ग्राफ़िक्स और डिज़ाइन कैटगरी में पहला स्थान हासिल किया.

इस ऐप्लिकेशन का मकसद, लोगों को किसी फ़ोटो के सीन या स्टाइल में बदलाव करने की सुविधा देना है. हालांकि, इससे फ़ोटो में मौजूद ओरिजनल ऑब्जेक्ट की पहचान और नैचुरल लुक पर कोई असर नहीं पड़ता. डेवलपर के लिए, मोबाइल पर कम समय में काम करने वाले ऐप्लिकेशन में, इस तरह की जटिल और मल्टीमॉडल लॉजिकल क्षमता को शामिल करना एक बड़ी चुनौती है. इस समस्या को हल करने के लिए, HubX ने Gemini API का इस्तेमाल करके फ़ोटो एडिटिंग की एक बेहतर पाइपलाइन बनाई. इससे फ़ोटो के कॉन्टेक्स्ट को सटीक तरीके से समझा जा सकता है. साथ ही, फ़ोटो को तेज़ी से एडिट किया जा सकता है.

HubX

Nano Banana की मदद से, इमेज में सटीक बदलाव करना

ReShoot के पीछे काम करने वाले रीज़निंग इंजन को बनाने के लिए, HubX ने Google की टीम के साथ मिलकर काम किया. इसके लिए, उन्होंने Gemini 2.5 Flash Image को इंटिग्रेट किया. इसे Nano Banana के नाम से भी जाना जाता है.

इमेज से इमेज जनरेट करने में, मुख्य तकनीकी चुनौती यह है कि जटिल सीन के अनुरोधों को समझने के साथ-साथ, विषय की पहचान को बनाए रखा जाए. आम तौर पर, टेक्स्ट को प्रोसेस करने और इमेज बनाने के लिए अलग-अलग मॉडल को एक साथ इस्तेमाल करना पड़ता है. हालांकि, Gemini 2.5 Flash Image में टेक्स्ट, इमेज वग़ैरह को प्रोसेस करने की क्षमता पहले से मौजूद है. यह टेक्स्ट प्रॉम्प्ट और इमेज इनपुट को एक ही चरण में प्रोसेस करता है.

इस आर्किटेक्चर की मदद से, ReShoot में बातचीत के ज़रिए इमेज में बदलाव किया जा सकता है. इसके लिए, इमेज और टेक्स्ट-टू-इमेज का इस्तेमाल किया जाता है. इससे, अपलोड की गई फ़ोटो की मुख्य पहचान और कॉन्टेक्स्ट को बनाए रखते हुए, उपयोगकर्ता के प्रॉम्प्ट के हिसाब से बदलाव किए जा सकते हैं. HubX ने अन्य विकल्पों की तुलना में पाया कि Gemini मॉडल, विज़ुअल को बेहतर तरीके से समझता है और मल्टीमॉडल के साथ बेहतर तरीके से काम करता है.

ऐप्लिकेशन के इंतज़ार के समय को 40% तक कम करना

हाई-फ़िडेलिटी जनरेशन ज़रूरी है. हालांकि, मोबाइल उपयोगकर्ता तुरंत नतीजे मिलने की उम्मीद करते हैं. क्रिएटिव प्रोसेस में किसी भी तरह की रुकावट आने से, लोगों की दिलचस्पी कम हो सकती है.

Gemini 2.5 Flash Image का इस्तेमाल करने से, HubX को इमेज अपडेट करने और उनमें बदलाव करने में लगने वाले औसत समय में करीब 40% की कमी आई. इंतज़ार के समय में हुई इस कमी से, उपयोगकर्ता का अनुभव बेहतर हो जाता है. इससे उपयोगकर्ता, इंतज़ार करने की स्थिति से हटकर क्रिएटिव प्रोसेस में शामिल हो जाता है. यह उपभोक्ताओं के मोबाइल ऐप्लिकेशन में उपयोगकर्ताओं को बनाए रखने के लिए ज़रूरी है.

डेवलपमेंट वर्कफ़्लो को आसान बनाना

Gemini API को इंटिग्रेट करने से, न सिर्फ़ परफ़ॉर्मेंस में तुरंत सुधार हुआ, बल्कि HubX के डेवलपमेंट आर्किटेक्चर को भी काफ़ी हद तक आसान बना दिया गया. टीम, प्रॉम्प्ट चेन को प्रोटोटाइप करने और उनकी जांच करने के लिए Google AI Studio का इस्तेमाल करती है. इसके बाद, उन्हें कस्टम Node.js पैकेज के ज़रिए प्रोडक्शन में डिप्लॉय करती है. ये पैकेज, उनके मोबाइल बैकएंड से कनेक्ट होते हैं.

Gemini मॉडल का इस्तेमाल करने से पहले, मल्टीमॉडल डेटा की व्याख्या करने वाले टास्क के लिए अक्सर जटिल कस्टम लॉजिक या अलग-अलग मॉडल को एक साथ इस्तेमाल करने की ज़रूरत होती थी. Gemini 2.5 Flash Image का इस्तेमाल करके, HubX ने इन सभी टास्क को एक ही मॉडलिंग फ़्रेमवर्क में शामिल कर दिया. इससे आर्किटेक्चर की जटिलता कम हो गई और अनुमान लगाने की स्पीड बढ़ गई.

अब क्या होगा

Gemini API को इंटिग्रेट करने के बाद, HubX को उपयोगकर्ता की दिलचस्पी में बढ़ोतरी देखने को मिली. ऐसा जनरेट किए गए कॉन्टेंट को सेव करने और पसंद करने की ज़्यादा दरों से पता चलता है. आगे चलकर, कंपनी ReShoot को एक ही काम के लिए इस्तेमाल होने वाले टूल से बदलकर, नेटिव और आसानी से फ़ोटो में बदलाव करने वाले एक बेहतरीन प्लैटफ़ॉर्म के तौर पर विकसित करने का प्लान बना रही है.

HubX के इस उदाहरण से पता चलता है कि डेवलपर, Gemini API की तेज़ प्रोसेसिंग और नेटिव मल्टीमॉडल सुविधाओं का इस्तेमाल करके, मोबाइल उपयोगकर्ताओं की ज़रूरतों को पूरा करने वाले बेहतरीन परफ़ॉर्मेंस वाले ऐप्लिकेशन कैसे बना सकते हैं.

Gemini मॉडल का इस्तेमाल शुरू करने के लिए, इमेज जनरेट करने से जुड़ा हमारा दस्तावेज़ पढ़ें.