शेयर करें

7 नवंबर, 2025

HubX ने ReShoot ऐप्लिकेशन में, Gemini 2.5 Flash Image को इंटिग्रेट किया है. इससे, कम समय में कॉन्टेक्स्ट के हिसाब से फ़ोटो में बदलाव किया जा सकता है

सेर्तक चिनार

सीनियर प्रॉडक्ट मैनेजर, HubX

विशाल धर्माधिकारी

प्रॉडक्ट सॉल्यूशंस इंजीनियर

Pascal AI Showcase Hero

HubX एक ग्लोबल टेक्नोलॉजी हब है. यह अपने मोबाइल ऐप्लिकेशन के पोर्टफ़ोलियो के ज़रिए, 30 करोड़ से ज़्यादा उपयोगकर्ताओं को सेवाएं देता है. ReShoot नाम का नया ऐप्लिकेशन बनाते समय, उनका मकसद जनरेटिव एआई का इस्तेमाल करके, प्रोफ़ेशनल लेवल पर फ़ोटो एडिटिंग की सुविधा को सभी के लिए उपलब्ध कराना था. Gemini API का इस्तेमाल करके, टीम ने बहुत कम समय में इस प्रोजेक्ट को पूरा किया. एमवीपी (मिनिमम वायबल प्रॉडक्ट) डेवलपमेंट की शुरुआत से लेकर iOS पर लाइव लॉन्च तक, इस प्रोजेक्ट को पूरा करने में सिर्फ़ दो हफ़्ते लगे. इसके कुछ समय बाद, ReShoot ने App Store पर अमेरिका में ग्राफ़िक्स और डिज़ाइन कैटगरी में पहला स्थान हासिल किया.

इस ऐप्लिकेशन का मकसद, लोगों को फ़ोटो के सीन या स्टाइल में बदलाव करने की सुविधा देना है. हालांकि, इससे फ़ोटो में मौजूद ओरिजनल ऑब्जेक्ट की पहचान और नैचुरल लुक पर कोई असर नहीं पड़ता. डेवलपर के लिए, मोबाइल पर कम समय में जवाब देने की ज़रूरी शर्तों के साथ, इस तरह की जटिल और मल्टीमॉडल तार्किकता को लागू करना, आर्किटेक्चर से जुड़ी एक बड़ी चुनौती है. इस समस्या को हल करने के लिए, HubX ने Gemini API का इस्तेमाल करके फ़ोटो एडिटिंग की एक बेहतर पाइपलाइन बनाई. यह पाइपलाइन, कॉन्टेक्स्ट को सटीक तरीके से समझने और तेज़ी से नतीजे देने के बीच संतुलन बनाए रखती है.

HubX

Nano Banana की मदद से इमेज में सटीक बदलाव करना

ReShoot के पीछे काम करने वाले रीज़निंग इंजन को बनाने के लिए, HubX ने Google की टीम के साथ मिलकर काम किया. इसके लिए, उन्होंने Gemini 2.5 Flash Image को इंटिग्रेट किया. इसे Nano Banana के नाम से भी जाना जाता है.

इमेज से इमेज जनरेट करने में, मुख्य तकनीकी चुनौती यह है कि जटिल सीन के अनुरोधों को समझने के साथ-साथ, विषय की पहचान को बनाए रखा जाए. आम तौर पर, टेक्स्ट रीज़निंग और इमेज सिंथेसिस के लिए अलग-अलग मॉडल को चेन करने की ज़रूरत होती है. हालांकि, Gemini 2.5 Flash Image में, टेक्स्ट, इमेज वग़ैरह को प्रोसेस करने की क्षमता पहले से मौजूद होती है. यह टेक्स्ट प्रॉम्प्ट और इमेज इनपुट को एक ही चरण में प्रोसेस करता है.

इस आर्किटेक्चर की मदद से, ReShoot में बातचीत के आधार पर इमेज में बदलाव किया जा सकता है. इसके लिए, इमेज और टेक्स्ट-टू-इमेज का इस्तेमाल किया जाता है. इससे, अपलोड की गई फ़ोटो की मुख्य पहचान और कॉन्टेक्स्ट को बनाए रखते हुए, उपयोगकर्ता के प्रॉम्प्ट के हिसाब से बदलाव किए जा सकते हैं. HubX ने अन्य विकल्पों की तुलना में पाया कि Gemini मॉडल, विज़ुअल को बेहतर तरीके से समझता है और मल्टीमॉडल के साथ बेहतर तरीके से काम करता है.

ऐप्लिकेशन के इंतज़ार के समय को 40% तक कम करना

हाई-फ़िडेलिटी जनरेशन ज़रूरी है. हालांकि, मोबाइल उपयोगकर्ता तुरंत नतीजे मिलने की उम्मीद करते हैं. क्रिएटिव प्रोसेस में किसी भी तरह की रुकावट आने से, यूज़र ऐक्टिविटी कम हो सकती है.

Gemini 2.5 Flash Image का इस्तेमाल करके, HubX ने इमेज अपडेट करने और उनमें बदलाव करने के लिए, जवाब देने में लगने वाले औसत समय को करीब 40% तक कम कर दिया. इंतज़ार के समय में हुई इस कमी से, उपयोगकर्ता का अनुभव बेहतर हो जाता है. इससे उपयोगकर्ता, इंतज़ार करने की स्थिति से हटकर क्रिएटिव प्रोसेस में शामिल हो जाता है. यह उपभोक्ताओं के मोबाइल ऐप्लिकेशन में उपयोगकर्ताओं को बनाए रखने के लिए ज़रूरी है.

डेवलपमेंट वर्कफ़्लो को आसान बनाना

Gemini API को इंटिग्रेट करने से, HubX के डेवलपमेंट आर्किटेक्चर को काफ़ी हद तक आसान बना दिया गया. साथ ही, इससे परफ़ॉर्मेंस में भी तुरंत सुधार हुआ. टीम, प्रॉम्प्ट चेन को प्रोटोटाइप करने और उनकी जांच करने के लिए Google AI Studio का इस्तेमाल करती है. इसके बाद, उन्हें कस्टम Node.js पैकेज के ज़रिए प्रोडक्शन में डिप्लॉय करती है. ये पैकेज, उनके मोबाइल बैकएंड से कनेक्ट होते हैं.

Gemini मॉडल का इस्तेमाल करने से पहले, मल्टीमॉडल डेटा इंटरप्रिटेशन से जुड़े टास्क के लिए, अक्सर जटिल कस्टम लॉजिक या अलग-अलग मॉडल को एक साथ इस्तेमाल करने की ज़रूरत होती थी. Gemini 2.5 Flash Image का इस्तेमाल करके, HubX ने इन सभी टास्क को एक ही मॉडलिंग फ़्रेमवर्क में शामिल कर दिया. इससे आर्किटेक्चर की जटिलता कम हो गई और अनुमान लगाने की स्पीड बढ़ गई.

अब क्या होगा

Gemini API को इंटिग्रेट करने के बाद, HubX को उपयोगकर्ता की दिलचस्पी में बढ़ोतरी देखने को मिली. ऐसा जनरेट किए गए कॉन्टेंट को सेव करने और पसंद करने की ज़्यादा दरों से पता चलता है. आगे चलकर, कंपनी का प्लान ReShoot को एक ही काम के लिए इस्तेमाल होने वाले टूल से बदलकर, नेटिव और आसानी से फ़ोटो में बदलाव करने वाले एक बेहतरीन प्लैटफ़ॉर्म के तौर पर विकसित करना है.

HubX के इस उदाहरण से पता चलता है कि डेवलपर, Gemini API की तेज़ प्रोसेसिंग और नेटिव मल्टीमॉडल सुविधाओं का इस्तेमाल करके, मोबाइल उपयोगकर्ताओं की ज़रूरतों को पूरा करने वाले बेहतरीन ऐप्लिकेशन कैसे बना सकते हैं.

Gemini मॉडल का इस्तेमाल शुरू करने के लिए, इमेज जनरेट करने से जुड़ा हमारा दस्तावेज़ पढ़ें.