Bagikan

7 November 2025

HubX mengintegrasikan Gemini 2.5 Flash Image untuk pengeditan foto kontekstual dengan latensi rendah di aplikasi ReShoot

Sertac Çınar

Sr. Product Manager HubX

Vishal Dharmadhikari

Product Solutions Engineer

Banner besar showcase AI Pascal

HubX adalah hub teknologi global yang melayani lebih dari 300 juta pengguna di seluruh portofolio aplikasi selulernya. Saat mengembangkan aplikasi terbaru mereka, ReShoot, mereka bertujuan untuk mendemokratisasi pengeditan foto tingkat profesional menggunakan AI generatif. Dengan memanfaatkan Gemini API, tim mencapai kecepatan pengembangan yang luar biasa, membawa project dari awal pengembangan MVP hingga peluncuran iOS live hanya dalam waktu dua minggu. Segera setelah itu, ReShoot mengklaim peringkat #1 dalam kategori Grafis & Desain AS di App Store.

Tujuan aplikasi ini adalah memungkinkan pengguna mengubah suasana atau gaya foto tanpa menghilangkan tampilan alami dan identitas subjek aslinya. Bagi developer, memberikan penalaran multimodal yang kompleks di tingkat ini dalam persyaratan latensi rendah yang ketat untuk pengalaman seluler merupakan tantangan arsitektur yang signifikan. Untuk mengatasi hal ini, HubX menggunakan Gemini API untuk membangun pipeline pengeditan foto canggih yang menyeimbangkan pemahaman kontekstual dengan fidelitas tinggi dan kecepatan inferensi yang luar biasa.

HubX

Pengeditan dengan kualitas tinggi menggunakan Nano Banana

Untuk membangun mesin penalaran di balik ReShoot, HubX bekerja sama dengan tim Google untuk mengintegrasikan Gemini 2.5 Flash Image —juga dikenal sebagai Nano Banana.

Tantangan teknis utama dalam pembuatan gambar ke gambar adalah mempertahankan identitas subjek sekaligus menafsirkan permintaan adegan yang kompleks. Tidak seperti pipeline tradisional yang sering kali memerlukan penggabungan model terpisah untuk penalaran teks dan sintesis gambar, Gemini 2.5 Flash Image secara native bersifat multimodal. Model ini memproses perintah teks dan input gambar dalam satu langkah terpadu.

Arsitektur ini memungkinkan ReShoot melakukan pengeditan percakapan (gambar + text-to-image) dengan kepatuhan tinggi terhadap perintah pengguna sekaligus mempertahankan identitas dan konteks inti foto yang diupload. Dibandingkan dengan alternatif yang diuji, HubX mendapati bahwa model Gemini menawarkan pemahaman visual dan konsistensi multimodal yang lebih unggul.

Mengurangi latensi aplikasi sebesar 40%

Meskipun generasi fidelitas tinggi diperlukan, pengguna seluler mengharapkan hasil yang hampir instan. Hambatan apa pun dalam proses kreatif dapat menyebabkan hilangnya engagement.

Dengan menstandardisasi Gemini 2.5 Flash Image, HubX mengurangi waktu respons rata-rata untuk memperbarui dan memanipulasi gambar hingga hampir 40%. Pengurangan latensi yang sangat penting ini mengubah pengalaman pengguna dari status menunggu pasif menjadi proses kreatif yang lancar, yang penting untuk retensi di aplikasi seluler konsumen.

Menyederhanakan alur kerja pengembangan

Selain peningkatan performa langsung, mengintegrasikan Gemini API menyederhanakan arsitektur pengembangan HubX secara signifikan. Tim menggunakan Google AI Studio untuk membuat prototipe dan menguji rangkaian perintah sebelum men-deploy-nya ke produksi melalui paket Node.js kustom yang terhubung ke backend seluler mereka.

Sebelum menggunakan model Gemini, tugas yang melibatkan interpretasi data multimodal sering kali memerlukan logika kustom yang kompleks atau penggabungan model yang berbeda-beda. Dengan mengadopsi Gemini 2.5 Flash Image, HubX menggabungkan tugas-tugas ini ke dalam satu framework pemodelan yang koheren, sehingga mengurangi kompleksitas arsitektur sekaligus meningkatkan kecepatan inferensi.

Langkah selanjutnya

Setelah berhasil mengintegrasikan Gemini API, HubX mengamati peningkatan engagement pengguna, sebagaimana ditunjukkan oleh rasio simpan dan suka yang lebih tinggi pada konten yang dihasilkan. Ke depannya, mereka berencana mengembangkan ReShoot dari alat serbaguna menjadi platform komprehensif untuk pengeditan foto yang lancar dan native.

Implementasi HubX menunjukkan cara developer dapat memanfaatkan kecepatan dan kemampuan multimodal native Gemini API untuk membangun aplikasi berperforma tinggi yang intuitif dan memenuhi permintaan pengguna seluler.

Untuk mulai membangun dengan model Gemini, baca dokumentasi pembuatan gambar kami.