Чтобы использовать Imagen, вы должны предоставить текстовое описание того, что вы хотите создать. Эти описания называются подсказками , и эти подсказки являются основным способом взаимодействия с Imagen.
В этом руководстве показано, как изменение частей приглашения преобразования текста в изображение может привести к различным результатам, а также приведены примеры изображений, которые вы можете создать.
Основы письма (тема, контекст и стиль)
Хотя существует множество способов написать хорошее приглашение, добавление некоторых ключевых слов и модификаторов поможет вам приблизиться к конечной цели. Подсказки не обязательно должны быть длинными или сложными, но большинство хороших подсказок описательны и ясны.
Хорошей отправной точкой может быть размышление о теме , контексте и стиле .
![Подсказка с акцентом на тему, контекст и стиль.](https://ai.google.dev/static/gemini-api/docs/images/imagen/style-subject-context.png?hl=ru)
Тема : Первое, о чем следует подумать при любой подсказке, — это тема : объект, человек, животное или пейзаж, изображение которого вы хотите отобразить.
Контекст и предыстория. Не менее важным является фон или контекст , в котором будет помещен объект. Попробуйте разместить объект съемки на разных фонах. Например, студия с белым фоном, на открытом воздухе или в помещении.
Стиль: Наконец, добавьте желаемый стиль изображения. Стили могут быть общими (живопись, фотография, эскизы) или очень конкретными (живопись пастелью, рисунок углем, изометрическое 3D). Вы также можете комбинировать стили.
После того, как вы напишете первую версию приглашения, усовершенствуйте его, добавляя больше деталей, пока не дойдете до нужного изображения. Итерация важна. Начните с определения своей основной идеи, а затем уточняйте и расширяйте ее до тех пор, пока созданный образ не станет близок к вашему видению.
![]() | ![]() | ![]() |
Изображение 3. Написание подсказки
Imagen 3 может превратить ваши идеи в подробные изображения, независимо от того, короткие ли ваши подсказки или длинные и подробные. Уточняйте свое видение с помощью повторяющихся подсказок, добавляя детали, пока не достигнете идеального результата.
Короткие подсказки позволяют быстро создать изображение. ![]() | Более длинные подсказки позволяют добавлять конкретные детали и создавать свой образ. ![]() |
Дополнительные советы по написанию подсказки Imagen 3:
- Используйте описательный язык : используйте подробные прилагательные и наречия, чтобы нарисовать четкую картину Imagen 3.
- Предоставьте контекст : при необходимости включите справочную информацию, которая поможет ИИ понять.
- Ссылайтесь на конкретных художников или стили . Если вы имеете в виду определенную эстетику, может оказаться полезным упоминание конкретных художников или художественных направлений.
- Используйте инструменты оперативного проектирования . Рассмотрите возможность изучения инструментов или ресурсов оперативного проектирования, которые помогут вам усовершенствовать подсказки и достичь оптимальных результатов.
- Улучшение деталей лица на ваших личных и групповых изображениях :
- Укажите детали лица в качестве фокуса фотографии (например, используйте в подсказке слово «портрет»).
Генерация текста в изображениях
Возможность Imagen 3 добавлять текст в ваши изображения открывает творческие возможности создания изображений. Используйте следующие рекомендации, чтобы максимально эффективно использовать эту функцию:
- Выполняйте итерации с уверенностью : возможно, вам придется регенерировать изображения, пока не добьетесь желаемого результата. Интеграция текста в Imagen все еще развивается, и иногда несколько попыток дают наилучшие результаты.
- Будьте краткими : для оптимальной генерации ограничьте текст 25 символами или меньше.
Несколько фраз . Поэкспериментируйте с двумя или тремя разными фразами, чтобы предоставить дополнительную информацию. Избегайте превышения трех фраз для более чистых композиций.
Подсказка: Плакат с надписью «Страна лета», выделенной жирным шрифтом в качестве заголовка, под этим текстом находится слоган «Лето никогда не было таким хорошим». Размещение направляющих : Хотя Imagen может попытаться расположить текст в соответствии с указаниями, следует ожидать случайных изменений. Эта функция постоянно совершенствуется.
Стиль шрифта Inspire : укажите общий стиль шрифта, чтобы слегка повлиять на выбор Imagen. Не полагайтесь на точное копирование шрифта, а ожидайте творческих интерпретаций.
Размер шрифта : укажите размер шрифта или общее указание размера (например, маленький , средний , большой ), чтобы повлиять на создание размера шрифта.
Оперативная параметризация
Чтобы лучше контролировать результаты вывода, вам может оказаться полезным параметризовать входные данные в Imagen. Например, предположим, что вы хотите, чтобы ваши клиенты могли создавать логотипы для своего бизнеса, и вы хотите, чтобы логотипы всегда создавались на сплошном цветном фоне. Вы также хотите ограничить параметры, которые клиент может выбрать из меню.
В этом примере вы можете создать параметризованное приглашение, подобное следующему:
A{logo_style} logo for a{company_area} company on a solid color background. Include the text{company_name} .
В вашем пользовательском интерфейсе клиент может вводить параметры с помощью меню, и выбранное ими значение заполняет подсказку, которую получает Imagen.
Например:
Подсказка:
A minimalist logo for a health care company on a solid color background. Include the text Journey .
Подсказка:
A modern logo for a software company on a solid color background. Include the text Silo .
Подсказка:
A traditional logo for a baking company on a solid color background. Include the text Seed .
Стиль: фотография
- Подсказка включает в себя: «Фотография...»
Чтобы использовать этот стиль, начните с использования ключевых слов, которые четко сообщают Imagen, что вы ищете фотографию. Начните свои подсказки со слов «Фотография...». . Например:
![]() | ![]() | ![]() |
Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 3.
Стиль: иллюстрация и искусство
- Подсказка включает в себя: « painting ...» , « sketch ...».
Художественные стили варьируются от монохромных стилей, таких как карандашные наброски, до гиперреалистичного цифрового искусства. Например, на следующих изображениях используется одна и та же подсказка в разных стилях:
« [art style or creation technique] угловатого спортивного электрического седана на фоне небоскребов»
![]() | ![]() | ![]() |
![]() | ![]() | ![]() |
Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 2.
Продвинутые методы быстрого написания
Используйте следующие примеры, чтобы создать более конкретные подсказки на основе атрибутов: дескрипторы фотографий, формы и материалы, исторические направления искусства и модификаторы качества изображения.
Модификаторы фотографий
В следующих примерах вы можете увидеть несколько модификаторов и параметров, специфичных для фотографии. Вы можете комбинировать несколько модификаторов для более точного управления.
Близость камеры — крупный план, снято издалека.
Подсказка: фотография кофейных зерен крупным планом. Подсказка: Увеличенная фотография небольшого пакета с
кофейные зерна на грязной кухнеПоложение камеры – сверху, снизу.
Подсказка: аэрофотоснимок городского города с небоскребами. Подсказка: фотография полога леса с голубым небом снизу. Освещение – естественное, драматическое, теплое, холодное.
Подсказка: студийное фото современного кресла, естественное освещение. Подсказка: студийное фото современного кресла, эффектное освещение. Настройки камеры — размытие в движении, мягкий фокус, боке, портрет.
Подсказка: фото города с небоскребами из салона автомобиля с размытием изображения Подсказка: фотография моста в ночном городе в мягком фокусе . Типы объективов : 35 мм, 50 мм, «рыбий глаз», широкоугольный, макро.
Подсказка: фото листа, макрообъектив. Подсказка: уличная фотография, Нью-Йорк, объектив «рыбий глаз». Типы пленки – черно-белая, полароид.
Подсказка: поляроидный портрет собаки в солнечных очках. Подсказка: черно-белое фото собаки в солнечных очках.
Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 3.
Формы и материалы
- Подсказка включает в себя: «...сделано из...» , «...в форме...».
Одной из сильных сторон этой технологии является то, что вы можете создавать изображения, которые иначе сложно или невозможно. Например, вы можете воссоздать логотип своей компании, используя разные материалы и текстуры.
![]() | ![]() | ![]() |
Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 3.
Ссылки на историческое искусство
- Подсказка включает в себя: «...в стиле...»
Некоторые стили с годами стали культовыми. Ниже приведены некоторые идеи исторической живописи или художественных стилей, которые вы можете попробовать.
«создать изображение в стиле [art period or movement] : ветряная электростанция»
![]() | ![]() | ![]() |
Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 3.
Модификаторы качества изображения
Определенные ключевые слова могут дать понять модели, что вы ищете высококачественный актив. Примеры модификаторов качества включают следующее:
- Общие Модификаторы - качественные, красивые, стилизованные.
- Фотографии - 4K, HDR, студийное фото
- Искусство, Иллюстрация - от профессионала, подробно
Ниже приведены несколько примеров подсказок без модификаторов качества и того же приглашения с модификаторами качества.
![]() | ![]() фотография стебля кукурузы , сделанная профессиональный фотограф |
Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 3.
Соотношения сторон
Генерация изображений Imagen 3 позволяет установить пять различных соотношений сторон изображения.
- Квадрат (1:1, по умолчанию) — стандартное квадратное фото. Обычное использование этого соотношения сторон включает публикации в социальных сетях.
Полноэкранный режим (4:3). Это соотношение сторон обычно используется в средствах массовой информации или фильмах. Это также размеры большинства старых (неширокоэкранных) телевизоров и камер среднего формата. Он захватывает большую часть сцены по горизонтали (по сравнению с соотношением сторон 1:1), что делает его предпочтительным соотношением сторон для фотографии.
Подсказка: крупный план пальцев музыканта, играющего на фортепиано, черно-белый фильм, винтаж (соотношение сторон 4:3). Подсказка: профессиональная студийная фотография картофеля фри для элитного ресторана в стиле кулинарного журнала (соотношение сторон 4:3). Портретный полноэкранный режим (3:4). Это полноэкранное соотношение сторон, повернутое на 90 градусов. Это позволяет захватить большую часть сцены по вертикали по сравнению с соотношением сторон 1:1.
Подсказка: женщина на прогулке, часть ее ботинок отражается в луже, большие горы на заднем плане, в стиле рекламы, драматические ракурсы (соотношение сторон 3:4). Подсказка: аэрофотоснимок реки, текущей вверх по мистической долине (соотношение сторон 3:4). Широкоэкранный (16:9). Это соотношение заменило 4:3 и теперь является наиболее распространенным соотношением сторон для телевизоров, мониторов и экранов мобильных телефонов (альбомная ориентация). Используйте это соотношение сторон, если хотите захватить большую часть фона (например, живописные пейзажи).
Подсказка: мужчина в белой одежде сидит на пляже, крупный план, освещение «золотого часа» (соотношение сторон 16:9). Портрет (9:16). Это соотношение широкоэкранное, но повернутое. Это относительно новое соотношение сторон, которое стало популяризироваться в приложениях для создания коротких видеороликов (например, короткометражках на YouTube). Используйте это для высоких объектов с сильной вертикальной ориентацией, таких как здания, деревья, водопады и другие подобные объекты.
Подсказка: цифровой рендер огромного небоскреба, современного, грандиозного, эпического, с прекрасным закатом на заднем плане (соотношение сторон 9:16).
Фотореалистичные изображения
Различные версии модели генерации изображений могут предлагать сочетание художественных и фотореалистичных результатов. Используйте следующую формулировку в подсказках, чтобы создать более фотореалистичный результат в зависимости от объекта, который вы хотите создать.
Вариант использования | Тип объектива | Фокусные расстояния | Дополнительная информация |
---|---|---|---|
Люди (портреты) | Прайм, увеличить | 24-35 мм | черно-белая пленка, Нуар, Глубина резкости, дуотон (указать два цвета) |
Еда, насекомые, растения (предметы, натюрморт) | Макрос | 60-105 мм | Высокая детализация, точная фокусировка, контролируемое освещение. |
Спорт, дикая природа (движение) | Телеобъектив с зумом | 100-400 мм | Короткая выдержка, отслеживание действий или движений |
Астрономический, пейзажный (широкоугольный) | Широкоугольный | 10-24 мм | Длительная выдержка, резкий фокус, длинная выдержка, гладкая вода или облака |
Портреты
Вариант использования | Тип объектива | Фокусные расстояния | Дополнительная информация |
---|---|---|---|
Люди (портреты) | Прайм, увеличить | 24-35 мм | черно-белая пленка, Нуар, Глубина резкости, дуотон (указать два цвета) |
Используя несколько ключевых слов из таблицы, Imagen может создать следующие портреты.
![]() | ![]() | ![]() | ![]() |
Подсказка: женщина, портрет 35 мм, синие и серые дуотоны.
Модель: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
Подсказка: женщина, портрет 35 мм, фильм-нуар.
Модель: imagen-3.0-generate-002
Объекты
Вариант использования | Тип объектива | Фокусные расстояния | Дополнительная информация |
---|---|---|---|
Еда, насекомые, растения (предметы, натюрморт) | Макрос | 60-105 мм | Высокая детализация, точная фокусировка, контролируемое освещение. |
Используя несколько ключевых слов из таблицы, Imagen может генерировать следующие изображения объектов.
![]() | ![]() | ![]() | ![]() |
Подсказка: лист молитвенного растения, макрообъектив, 60 мм.
Модель: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
Подсказка: тарелка макарон, макрообъектив 100 мм.
Модель: imagen-3.0-generate-002
Движение
Вариант использования | Тип объектива | Фокусные расстояния | Дополнительная информация |
---|---|---|---|
Спорт, дикая природа (движение) | Телеобъектив с зумом | 100-400 мм | Короткая выдержка, отслеживание действий или движений |
Используя несколько ключевых слов из таблицы, Imagen может генерировать следующие движущиеся изображения.
![]() | ![]() | ![]() | ![]() |
Подсказка: победное приземление, короткая выдержка, отслеживание движения.
Модель: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
Подсказка: олень, бегущий по лесу, короткая выдержка, отслеживание движения.
Модель: imagen-3.0-generate-002
Широкоугольный
Вариант использования | Тип объектива | Фокусные расстояния | Дополнительная информация |
---|---|---|---|
Астрономический, пейзажный (широкоугольный) | Широкоугольный | 10-24 мм | Длительная выдержка, резкий фокус, длинная выдержка, гладкая вода или облака |
Используя несколько ключевых слов из таблицы, Imagen может создать следующие широкоугольные изображения.
![]() | ![]() | ![]() | ![]() |
Подсказка: обширный горный массив, пейзаж, широкий угол обзора 10 мм.
Модель: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
Подсказка: фото Луны, астросъемка, широкоугольный 10мм.
Модель: imagen-3.0-generate-002