7 ноября 2025 г.
HubX интегрирует технологию Gemini 2.5 Flash Image для контекстной обработки фотографий с низкой задержкой в приложении ReShoot.

HubX — это глобальный технологический хаб, обслуживающий более 300 миллионов пользователей благодаря своему портфолио мобильных приложений. При разработке своего последнего приложения ReShoot они стремились демократизировать профессиональную обработку фотографий с помощью генеративного искусственного интеллекта. Используя API Gemini, команда добилась впечатляющей скорости разработки, пройдя путь от разработки MVP до запуска iOS-приложения всего за две недели. Вскоре после этого ReShoot занял первое место в категории «Графика и дизайн» в App Store в США.
Цель приложения — позволить пользователям изменять сцену или стиль фотографии, не теряя при этом естественного вида и индивидуальности исходного объекта. Для разработчиков реализация такого уровня сложного, многомодального анализа в условиях жестких требований к низкой задержке мобильного приложения представляет собой серьезную архитектурную проблему. Для решения этой задачи HubX использовал API Gemini для создания сложного конвейера редактирования фотографий, который обеспечивает баланс между высокоточным контекстным пониманием и исключительной скоростью обработки данных.

Высококачественный монтаж с помощью Nano Banana
Для создания механизма обработки данных в ReShoot компания HubX совместно с командой Google интегрировала технологию Gemini 2.5 Flash Image , также известную как Nano Banana .
Основная техническая проблема при создании изображений методом «изображение к изображению» заключается в сохранении идентичности объекта при интерпретации сложных запросов сцены. В отличие от традиционных конвейеров обработки изображений, которые часто требуют объединения отдельных моделей для анализа текста и синтеза изображений, Gemini 2.5 Flash Image изначально является мультимодальным. Он обрабатывает текстовые подсказки и изображения в рамках одного унифицированного шага.
Эта архитектура позволяет ReShoot выполнять редактирование в диалоговом режиме (изображение + текст в изображение) с высокой степенью соответствия запросам пользователя, сохраняя при этом основную идентичность и контекст загруженных фотографий. По сравнению с протестированными альтернативами, HubX обнаружил, что модель Gemini обеспечивает превосходное визуальное восприятие и мультимодальную согласованность.
Снижение задержки приложения на 40%
Хотя высококачественная генерация необходима, пользователи мобильных устройств ожидают практически мгновенных результатов. Любые препятствия в творческом процессе могут привести к снижению вовлеченности аудитории.
Благодаря стандартизации на основе Gemini 2.5 Flash Image, HubX сократил среднее время отклика при обновлении и обработке изображений почти на 40%. Это существенное сокращение задержки преобразует пользовательский опыт из пассивного ожидания в плавный творческий процесс, что крайне важно для удержания пользователей в мобильных приложениях.
Оптимизация рабочих процессов разработки
Помимо непосредственного повышения производительности, интеграция API Gemini значительно упростила архитектуру разработки HubX. Команда использует Google AI Studio для создания прототипов и тестирования цепочек подсказок перед их развертыванием в продакшене с помощью пользовательских пакетов Node.js, подключенных к их мобильному бэкенду.
До использования моделей Gemini задачи, связанные с интерпретацией мультимодальных данных, часто требовали сложной пользовательской логики или объединения разрозненных моделей. Внедрение Gemini 2.5 Flash Image позволило HubX объединить эти задачи в единую, согласованную структуру моделирования, снизив архитектурную сложность и повысив скорость вывода результатов.
Что дальше?
После успешной интеграции API Gemini компания HubX отметила увеличение вовлеченности пользователей, о чем свидетельствует рост количества сохранений и лайков созданного контента. В дальнейшем они планируют превратить ReShoot из инструмента с одной функцией в комплексную платформу для удобного и интуитивно понятного редактирования фотографий.
Реализация HubX демонстрирует, как разработчики могут использовать скорость и встроенные многомодальные возможности API Gemini для создания интуитивно понятных, высокопроизводительных приложений, отвечающих потребностям мобильных пользователей.
Чтобы начать работу с моделями Gemini, ознакомьтесь с нашей документацией по генерации изображений .
Волей
Volley использует Gemini 2.5 Pro для ускорения процесса разработки игр, создавая захватывающие приключения в подземельях с голосовым ИИ, используя визуальные эффекты Gemini 2.0 Flash и Veo 2.