Ndaj

7 nëntor 2025

HubX integron Gemini 2.5 Flash Image për redaktim të fotove me vonesë të ulët dhe kontekstual në aplikacionin ReShoot.

Sertac Çınar

Menaxher i Lartë i Produkteve HubX

Vishal Dharmadhikari

Inxhinier i Zgjidhjeve të Produkteve

Heroi i shfaqjes së Pascal AI

HubX është një qendër globale teknologjike që u shërben mbi 300 milionë përdoruesve në të gjithë portofolin e saj të aplikacioneve mobile. Kur zhvilluan aplikacionin e tyre të fundit, ReShoot, ata synuan të demokratizonin redaktimin e fotove në nivel profesional duke përdorur inteligjencën artificiale gjeneruese. Duke shfrytëzuar Gemini API, ekipi arriti një shpejtësi të jashtëzakonshme zhvillimi, duke e çuar projektin nga fillimi i zhvillimit të MVP në një lançim të drejtpërdrejtë në iOS në vetëm dy javë. Pak më vonë, ReShoot mori renditjen #1 në kategorinë Grafikë dhe Dizajn në SHBA në App Store.

Qëllimi i aplikacionit është t'u lejojë përdoruesve të ndryshojnë skenën ose stilin e një fotoje pa humbur pamjen natyrale dhe identitetin e subjektit origjinal. Për zhvilluesit, ofrimi i këtij niveli të arsyetimit kompleks dhe multimodal brenda kërkesave të rrepta të vonesës së ulët të një përvoje mobile paraqet një sfidë të rëndësishme arkitekturore. Për t'iu përgjigjur kësaj, HubX përdori Gemini API për të ndërtuar një kanal të sofistikuar të redaktimit të fotove që balancon kuptimin kontekstual me besnikëri të lartë me shpejtësi të jashtëzakonshme të nxjerrjes së përfundimeve.

HubX

Redaktim me besueshmëri të lartë me Nano Banana

Për të ndërtuar motorin e arsyetimit që qëndron pas ReShoot, HubX punoi me ekipin e Google për të integruar Gemini 2.5 Flash Image — i njohur edhe si Nano Banana .

Një sfidë kryesore teknike në gjenerimin imazh-me-imazh është ruajtja e identitetit të subjektit gjatë interpretimit të kërkesave komplekse të skenës. Ndryshe nga kanalet tradicionale që shpesh kërkojnë zinxhirimin e modeleve të ndara për arsyetimin e tekstit dhe sintezën e imazhit, Gemini 2.5 Flash Image është multimodal në vetvete. Ai përpunon kërkesat e tekstit dhe hyrjet e imazhit në një hap të vetëm dhe të unifikuar.

Kjo arkitekturë i lejon ReShoot të kryejë redaktim bisedor (imazh + tekst në imazh) me respektim të lartë të kërkesave të përdoruesit, duke ruajtur identitetin dhe kontekstin thelbësor të fotove të ngarkuara. Krahasuar me alternativat e testuara, HubX zbuloi se modeli Gemini ofronte një kuptim vizual superior dhe qëndrueshmëri multimodale.

Ulja e vonesës së aplikacionit me 40%

Ndërkohë që gjenerimi i besueshmërisë së lartë është i domosdoshëm, përdoruesit e celularëve presin rezultate pothuajse të menjëhershme. Çdo fërkim në procesin krijues mund të çojë në humbje të angazhimit.

Duke standardizuar Gemini 2.5 Flash Image, HubX uli kohën mesatare të reagimit për përditësimin dhe manipulimin e imazheve me gati 40%. Ky reduktim kritik i latencës transformon përvojën e përdoruesit nga një gjendje pritjeje pasive në një proces krijues fluid, i cili është thelbësor për ruajtjen e të dhënave në aplikacionet mobile të konsumatorit.

Përmirësimi i rrjedhave të punës së zhvillimit

Përtej përmirësimeve të menjëhershme në performancë, integrimi i Gemini API thjeshtoi ndjeshëm arkitekturën e zhvillimit të HubX. Ekipi përdor Google AI Studio për të prototipuar dhe testuar zinxhirët e prompt-eve përpara se t'i vendosë ato në prodhim nëpërmjet paketave të personalizuara Node.js të lidhura me backend-in e tyre celular.

Përpara përdorimit të modeleve Gemini, detyrat që përfshinin interpretimin e të dhënave multimodale shpesh kërkonin logjikë komplekse të personalizuar ose zinxhirin e modeleve të shpërndara. Duke adoptuar Gemini 2.5 Flash Image , HubX i konsolidoi këto detyra në një kornizë të vetme dhe koherente modelimi, duke zvogëluar kompleksitetin arkitektonik dhe duke përmirësuar shpejtësinë e nxjerrjes së përfundimeve.

Çfarë vjen më pas

Pas integrimit të suksesshëm të Gemini API, HubX vërejti një rritje në angazhimin e përdoruesve, siç tregohet nga normat më të larta të ruajtjes dhe pëlqimit të përmbajtjes së gjeneruar. Duke parë përpara, ata planifikojnë ta zhvillojnë ReShoot nga një mjet me një qëllim të vetëm në një platformë gjithëpërfshirëse për redaktim natyral dhe të lehtë të fotove.

Implementimi i HubX tregon se si zhvilluesit mund të shfrytëzojnë shpejtësinë dhe aftësitë multimodale native të Gemini API për të ndërtuar aplikacione intuitive dhe me performancë të lartë që plotësojnë kërkesat e përdoruesve të celularëve.

Për të filluar ndërtimin me modelet Gemini, lexoni dokumentacionin tonë për gjenerimin e imazheve .

Volejboll

Volley përdor Gemini 2.5 Pro për të përshpejtuar procesin e zhvillimit të lojërave, duke ndërtuar aventura gjithëpërfshirëse në burgje me inteligjencë artificiale zanore me pamje nga Gemini 2.0 Flash dhe Veo 2.