Partager

7 novembre 2025

HubX intègre Gemini 2.5 Flash Image pour une retouche photo contextuelle à faible latence dans l'application ReShoot

Sertaç Çınar

Haut responsable produit HubX

Vishal Dharmadhikari

Ingénieur en solutions produit

Vidéo héros de présentation de Pascal AI

HubX est un hub technologique mondial qui dessert plus de 300 millions d'utilisateurs grâce à son portefeuille d'applications mobiles. Lors du développement de leur dernière application, ReShoot, ils ont cherché à démocratiser la retouche photo de niveau professionnel à l'aide de l'IA générative. En tirant parti de l'API Gemini, l'équipe a atteint une vitesse de développement remarquable, passant du début du développement du MVP au lancement de l'application iOS en seulement deux semaines. Peu de temps après, ReShoot s'est classée n°1 dans la catégorie "Graphisme et design" de l'App Store aux États-Unis.

L'objectif de l'application est de permettre aux utilisateurs de modifier la scène ou le style d'une photo sans perdre l'aspect naturel et l'identité du sujet d'origine. Pour les développeurs, fournir ce niveau de raisonnement multimodal complexe dans le cadre des exigences strictes de faible latence d'une expérience mobile représente un défi architectural important. Pour résoudre ce problème, HubX a utilisé l'API Gemini afin de créer un pipeline de retouche photo sophistiqué qui équilibre la compréhension contextuelle haute fidélité et la vitesse d'inférence exceptionnelle.

HubX

Retouche haute fidélité avec Nano Banana

Pour concevoir le moteur de raisonnement de ReShoot, HubX a collaboré avec l'équipe Google afin d'intégrer Gemini 2.5 Flash Image, également connu sous le nom de Nano Banana.

L'un des principaux défis techniques de la génération d'images à partir d'images consiste à préserver l'identité du sujet tout en interprétant des requêtes de scènes complexes. Contrairement aux pipelines traditionnels qui nécessitent souvent d'enchaîner des modèles distincts pour le raisonnement textuel et la synthèse d'images, Gemini 2.5 Flash Image est multimodal par nature. Il traite les requêtes textuelles et les entrées d'image en une seule étape unifiée.

Cette architecture permet à ReShoot d'effectuer des retouches conversationnelles (image + texte vers image) en respectant scrupuleusement les requêtes des utilisateurs tout en préservant l'identité et le contexte des photos importées. Par rapport aux alternatives testées, HubX a constaté que le modèle Gemini offrait une compréhension visuelle et une cohérence multimodale supérieures.

Réduire la latence des applications de 40 %

Si la génération haute fidélité est requise, les utilisateurs mobiles s'attendent à des résultats quasi instantanés. Toute friction dans le processus de création peut entraîner une perte d'engagement.

En standardisant Gemini 2.5 Flash Image, HubX a réduit le temps de réponse moyen pour la mise à jour et la manipulation des images de près de 40 %. Cette réduction critique de la latence transforme l'expérience utilisateur, qui passe d'un état d'attente passif à un processus créatif fluide, ce qui est essentiel pour la fidélisation dans les applications mobiles grand public.

Simplifier les workflows de développement

Au-delà des gains de performances immédiats, l'intégration de l'API Gemini a considérablement simplifié l'architecture de développement de HubX. L'équipe utilise Google AI Studio pour prototyper et tester les chaînes de requêtes avant de les déployer en production via des packages Node.js personnalisés connectés à son backend mobile.

Avant l'utilisation des modèles Gemini, les tâches impliquant l'interprétation de données multimodales nécessitaient souvent une logique personnalisée complexe ou l'enchaînement de modèles disparates. En adoptant Gemini 2.5 Flash Image, HubX a regroupé ces tâches dans un framework de modélisation unique et cohérent, ce qui a permis de réduire la complexité de l'architecture tout en améliorant la vitesse d'inférence.

Étapes suivantes

Après avoir intégré l'API Gemini, HubX a constaté une augmentation de l'engagement des utilisateurs, comme en témoignent les taux de sauvegarde et d'appréciation plus élevés pour les contenus générés. À l'avenir, ils prévoient de faire évoluer ReShoot, qui n'est pour l'instant qu'un outil à usage unique, en une plate-forme complète pour la retouche photo native et fluide.

L'implémentation de HubX montre comment les développeurs peuvent tirer parti de la vitesse et des capacités multimodales natives de l'API Gemini pour créer des applications intuitives et performantes qui répondent aux besoins des utilisateurs mobiles.

Pour commencer à créer avec les modèles Gemini, consultez notre documentation sur la génération d'images.