7 ноября 2025 г.
HubX интегрирует Gemini 2.5 Flash Image для контекстного редактирования фотографий с малой задержкой в приложении ReShoot

HubX — это глобальный технологический центр, обслуживающий более 300 миллионов пользователей своего портфолио мобильных приложений. При разработке своего последнего приложения ReShoot они стремились сделать редактирование фотографий на профессиональном уровне доступным с помощью генеративного искусственного интеллекта. Используя API Gemini, команда достигла впечатляющей скорости разработки, проведя проект от начала разработки MVP до запуска на iOS всего за две недели. Вскоре после этого ReShoot занял первое место в категории «Графика и дизайн» в США в App Store.
Цель приложения — позволить пользователям изменять сцену или стиль фотографии, не теряя естественности и идентичности исходного объекта. Для разработчиков реализация такого уровня сложных мультимодальных рассуждений в условиях строгих требований к низкой задержке мобильного взаимодействия представляет собой серьёзную архитектурную задачу. Для решения этой задачи HubX использовал API Gemini для создания сложного конвейера обработки фотографий, сочетающего высокую точность понимания контекста с исключительной скоростью вывода.

Высококачественное редактирование с помощью Nano Banana
Чтобы создать логический механизм ReShoot, HubX работал с командой Google над интеграцией Gemini 2.5 Flash Image , также известного как Nano Banana .
Основная техническая сложность при генерации изображений — сохранение идентичности объекта при интерпретации сложных запросов на обработку сцен. В отличие от традиционных конвейеров, которые часто требуют объединения отдельных моделей для обработки текста и синтеза изображений, Gemini 2.5 Flash Image изначально является многомодальным. Он обрабатывает текстовые запросы и вводимые изображения за один унифицированный шаг.
Эта архитектура позволяет ReShoot выполнять диалоговое редактирование (изображение + преобразование текста в изображение) с точным соблюдением пользовательских подсказок, сохраняя при этом основную идентичность и контекст загруженных фотографий. По сравнению с протестированными альтернативами, HubX обнаружил, что модель Gemini обеспечивает превосходное визуальное восприятие и мультимодальную согласованность.
Сокращение задержки приложения на 40%
Хотя генерация высококачественных изображений необходима, мобильные пользователи ожидают практически мгновенных результатов. Любые трудности в творческом процессе могут привести к потере вовлеченности.
Используя стандарт Gemini 2.5 Flash Image, HubX сократил среднее время отклика при обновлении и обработке изображений почти на 40%. Это критическое сокращение задержки преобразует пользовательский опыт из пассивного состояния ожидания в динамичный творческий процесс, что крайне важно для удержания пользователей в мобильных приложениях.
Оптимизация рабочих процессов разработки
Помимо непосредственного повышения производительности, интеграция API Gemini значительно упростила архитектуру разработки HubX. Команда использует Google AI Studio для создания прототипов и тестирования цепочек подсказок перед их развертыванием в рабочей среде с помощью специальных пакетов Node.js, подключенных к мобильному бэкенду.
До использования моделей Gemini задачи, связанные с интерпретацией мультимодальных данных, часто требовали сложной пользовательской логики или объединения разрозненных моделей в цепочку. Внедрив Gemini 2.5 Flash Image , HubX объединил эти задачи в единую, согласованную структуру моделирования, снизив архитектурную сложность и повысив скорость вывода.
Что дальше?
После успешной интеграции API Gemini компания HubX отметила рост вовлечённости пользователей, о чём свидетельствует рост числа сохранений и лайков создаваемого контента. В перспективе компания планирует превратить ReShoot из специализированного инструмента в комплексную платформу для удобного и нативного редактирования фотографий.
Реализация HubX демонстрирует, как разработчики могут использовать скорость и собственные многомодальные возможности API Gemini для создания интуитивно понятных, высокопроизводительных приложений, отвечающих требованиям мобильных пользователей.
Чтобы приступить к работе с моделями Gemini, прочтите нашу документацию по созданию изображений .
Залп
Volley использует Gemini 2.5 Pro для ускорения процесса разработки игр, создавая захватывающие приключения в подземельях с голосовым управлением ИИ и визуальными эффектами от Gemini 2.0 Flash и Veo 2.