7. November 2025
HubX integriert Gemini 2.5 Flash Image für die kontextbezogene Fotobearbeitung mit geringer Latenz in der ReShoot App
HubX ist ein globaler Technologie-Hub, der mit seinem Portfolio an mobilen Anwendungen über 300 Millionen Nutzer erreicht. Bei der Entwicklung ihrer neuesten App, ReShoot, wollten sie die Fotobearbeitung auf professionellem Niveau mithilfe generativer KI demokratisieren. Durch die Nutzung der Gemini API konnte das Team eine bemerkenswerte Entwicklungsgeschwindigkeit erzielen. Das Projekt wurde in nur zwei Wochen von der Entwicklung des MVP bis zur Einführung der Live-iOS-App umgesetzt. Kurz darauf belegte ReShoot den ersten Platz in der Kategorie „Grafik & Design“ im US-App Store.
Ziel der App ist es, Nutzern zu ermöglichen, die Szene oder den Stil eines Fotos zu ändern, ohne das natürliche Aussehen und die Identität des ursprünglichen Motivs zu verlieren. Für Entwickler stellt es eine erhebliche architektonische Herausforderung dar, diese komplexe, multimodale Argumentation innerhalb der strengen Anforderungen an die geringe Latenz einer mobilen Umgebung zu liefern. Um dieses Problem zu beheben, hat HubX die Gemini API verwendet, um eine ausgefeilte Bildbearbeitungspipeline zu erstellen, die ein kontextbezogenes Verständnis mit hoher Genauigkeit mit einer außergewöhnlichen Inferenzgeschwindigkeit in Einklang bringt.
Bearbeitung mit hoher Wiedergabetreue mit Nano Banana
Um die Reasoning Engine hinter ReShoot zu entwickeln, hat HubX mit dem Google-Team zusammengearbeitet, um Gemini 2.5 Flash Image, auch bekannt als Nano Banana, zu integrieren.
Eine der größten technischen Herausforderungen bei der Bild-zu-Bild-Generierung besteht darin, die Identität des Motivs beizubehalten und gleichzeitig komplexe Szenenanfragen zu interpretieren. Im Gegensatz zu herkömmlichen Pipelines, bei denen oft separate Modelle für die Textanalyse und Bildsynthese verkettet werden müssen, ist Gemini 2.5 Flash Image nativ multimodal. Text-Prompts und Bildeingaben werden in einem einzigen, einheitlichen Schritt verarbeitet.
Diese Architektur ermöglicht es ReShoot, konversationelle Bearbeitungen (Bild + Text-zu-Bild) mit hoher Einhaltung der Nutzerprompts durchzuführen und gleichzeitig die Kernidentität und den Kontext der hochgeladenen Fotos beizubehalten. Im Vergleich zu den getesteten Alternativen stellte HubX fest, dass das Gemini-Modell eine bessere visuelle Verarbeitung und multimodale Konsistenz bietet.
App-Latenz um 40 % verringern
Die Generierung von High-Fidelity-Bildern ist zwar erforderlich, aber Nutzer von Mobilgeräten erwarten nahezu sofortige Ergebnisse. Jegliche Reibung im kreativen Prozess kann zu einem Verlust von Interaktionen führen.
Durch die Standardisierung auf Gemini 2.5 Flash Image konnte HubX die durchschnittliche Reaktionszeit für das Aktualisieren und Bearbeiten von Bildern um fast 40 % reduzieren. Durch diese erhebliche Reduzierung der Latenz wird die Nutzererfahrung von einem passiven Warten zu einem flüssigen kreativen Prozess, was für die Kundenbindung in mobilen Apps für Verbraucher unerlässlich ist.
Entwickler-Workflows optimieren
Die Integration der Gemini API hat nicht nur die Leistung gesteigert, sondern auch die Entwicklungsarchitektur von HubX deutlich vereinfacht. Das Team nutzt Google AI Studio, um Prompt-Ketten zu prototypisieren und zu testen, bevor sie über benutzerdefinierte Node.js-Pakete, die mit dem mobilen Backend verbunden sind, in der Produktion bereitgestellt werden.
Vor der Verwendung von Gemini-Modellen erforderten Aufgaben, die eine multimodale Dateninterpretation umfassten, oft eine komplexe benutzerdefinierte Logik oder die Verkettung unterschiedlicher Modelle. Durch die Einführung von Gemini 2.5 Flash Image konnte HubX diese Aufgaben in einem einzigen, kohärenten Modellierungsframework konsolidieren. So wurde die architektonische Komplexität reduziert und die Inferenzgeschwindigkeit verbessert.
Weiteres Vorgehen
Nach der erfolgreichen Integration der Gemini API verzeichnete HubX eine Steigerung des Nutzer-Engagements, was sich in höheren Raten für das Speichern und Liken von generierten Inhalten zeigte. In Zukunft soll ReShoot von einem Tool für einen bestimmten Zweck zu einer umfassenden Plattform für die native, nahtlose Fotobearbeitung weiterentwickelt werden.
Die Implementierung von HubX zeigt, wie Entwickler die Geschwindigkeit und die nativen multimodalen Funktionen der Gemini API nutzen können, um intuitive, leistungsstarke Anwendungen zu entwickeln, die den Anforderungen von Mobilgerätenutzern gerecht werden.
Wenn Sie mit der Entwicklung mit Gemini-Modellen beginnen möchten, lesen Sie unsere Dokumentation zur Bildgenerierung.