Condividi

7 novembre 2025

HubX integra Gemini 2.5 Flash Image per l'editing di foto contestuali a bassa latenza nell'app ReShoot

Sertac Çınar

Sr. Product Manager HubX

Vishal Dharmadhikari

Product Solutions Engineer

hero vetrina AI Pascal

HubX è un hub tecnologico globale che serve oltre 300 milioni di utenti nel suo portafoglio di applicazioni mobile. Durante lo sviluppo della loro ultima app, ReShoot, l'obiettivo era democratizzare l'editing fotografico di livello professionale utilizzando l'AI generativa. Sfruttando l'API Gemini, il team ha raggiunto una velocità di sviluppo notevole, portando il progetto dall'inizio dello sviluppo dell'MVP al lancio live su iOS in sole due settimane. Poco dopo, ReShoot ha raggiunto il primo posto nella categoria Grafica e design dell'App Store negli Stati Uniti.

L'obiettivo dell'app è consentire agli utenti di modificare la scena o lo stile di una foto senza perdere l'aspetto naturale e l'identità del soggetto originale. Per gli sviluppatori, fornire questo livello di ragionamento complesso e multimodale all'interno dei rigorosi requisiti di bassa latenza di un'esperienza mobile rappresenta una sfida architettonica significativa. Per risolvere questo problema, HubX ha utilizzato l'API Gemini per creare una pipeline di editing fotografico sofisticata che bilancia la comprensione contestuale ad alta fedeltà con una velocità di inferenza eccezionale.

HubX

Modifica ad alta fedeltà con Nano Banana

Per costruire il motore di ragionamento alla base di ReShoot, HubX ha collaborato con il team di Google per integrare Gemini 2.5 Flash Image, noto anche come Nano Banana.

Una delle principali sfide tecniche nella generazione di immagini è mantenere l'identità del soggetto interpretando richieste di scene complesse. A differenza delle pipeline tradizionali che spesso richiedono di concatenare modelli separati per il ragionamento testuale e la sintesi delle immagini, Gemini 2.5 Flash Image è multimodale in modo nativo. Elabora i prompt di testo e gli input di immagini in un unico passaggio unificato.

Questa architettura consente a ReShoot di eseguire modifiche conversazionali (immagine + conversione da testo a immagine) con un'elevata aderenza ai prompt degli utenti, preservando l'identità e il contesto principali delle foto caricate. Rispetto alle alternative testate, HubX ha scoperto che il modello Gemini offre una comprensione visiva e una coerenza multimodale superiori.

Riduzione della latenza delle app del 40%

Sebbene la generazione ad alta fedeltà sia un requisito necessario, gli utenti di dispositivi mobili si aspettano risultati quasi istantanei. Qualsiasi attrito nel processo creativo può comportare una perdita di coinvolgimento.

Grazie alla standardizzazione di Gemini 2.5 Flash Image, HubX ha ridotto il tempo di risposta medio per l'aggiornamento e la manipolazione delle immagini di quasi il 40%. Questa riduzione critica della latenza trasforma l'esperienza utente da uno stato di attesa passiva a un processo creativo fluido, essenziale per la fidelizzazione nelle app mobile consumer.

Semplificare i workflow di sviluppo

Oltre ai miglioramenti immediati delle prestazioni, l'integrazione dell'API Gemini ha semplificato notevolmente l'architettura di sviluppo di HubX. Il team utilizza Google AI Studio per prototipare e testare le catene di prompt prima di eseguirne il deployment in produzione tramite pacchetti Node.js personalizzati collegati al backend mobile.

Prima di utilizzare i modelli Gemini, le attività che comportano l'interpretazione di dati multimodali spesso richiedevano una logica personalizzata complessa o il concatenamento di modelli diversi. Adottando Gemini 2.5 Flash Image, HubX ha consolidato queste attività in un unico framework di modellazione coerente, riducendo la complessità dell'architettura e migliorando la velocità di inferenza.

Passaggi successivi

A seguito dell'integrazione riuscita dell'API Gemini, HubX ha osservato un aumento del coinvolgimento degli utenti, come indicato da tassi di salvataggio e Mi piace più elevati sui contenuti generati. In futuro, l'azienda prevede di trasformare ReShoot da strumento monoscopo in una piattaforma completa per l'editing di foto nativo e senza interruzioni.

L'implementazione di HubX dimostra come gli sviluppatori possono sfruttare la velocità e le funzionalità multimodali native dell'API Gemini per creare applicazioni intuitive e ad alte prestazioni che soddisfano le esigenze degli utenti di dispositivi mobili.

Per iniziare a creare con i modelli Gemini, leggi la nostra documentazione sulla generazione di immagini.