Imagen — это высокоточная модель генерации изображений от Google, способная создавать реалистичные и качественные изображения на основе текстовых запросов. Все сгенерированные изображения содержат водяной знак SynthID. Подробнее о доступных вариантах модели Imagen см. в разделе «Версии моделей» .
Генерация изображений с использованием моделей Imagen
В этом примере демонстрируется генерация изображений с помощью модели Imagen :
Питон
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
client = genai.Client()
response = client.models.generate_images(
model='imagen-4.0-generate-001',
prompt='Robot holding a red skateboard',
config=types.GenerateImagesConfig(
number_of_images= 4,
)
)
for generated_image in response.generated_images:
generated_image.image.show()
JavaScript
import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";
async function main() {
const ai = new GoogleGenAI({});
const response = await ai.models.generateImages({
model: 'imagen-4.0-generate-001',
prompt: 'Robot holding a red skateboard',
config: {
numberOfImages: 4,
},
});
let idx = 1;
for (const generatedImage of response.generatedImages) {
let imgBytes = generatedImage.image.imageBytes;
const buffer = Buffer.from(imgBytes, "base64");
fs.writeFileSync(`imagen-${idx}.png`, buffer);
idx++;
}
}
main();
Идти
package main
import (
"context"
"fmt"
"os"
"google.golang.org/genai"
)
func main() {
ctx := context.Background()
client, err := genai.NewClient(ctx, nil)
if err != nil {
log.Fatal(err)
}
config := &genai.GenerateImagesConfig{
NumberOfImages: 4,
}
response, _ := client.Models.GenerateImages(
ctx,
"imagen-4.0-generate-001",
"Robot holding a red skateboard",
config,
)
for n, image := range response.GeneratedImages {
fname := fmt.Sprintf("imagen-%d.png", n)
_ = os.WriteFile(fname, image.Image.ImageBytes, 0644)
}
}
ОТДЫХ
curl -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/imagen-4.0-generate-001:predict" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"instances": [
{
"prompt": "Robot holding a red skateboard"
}
],
"parameters": {
"sampleCount": 4
}
}'

Конфигурация изображения
В настоящее время Imagen поддерживает только подсказки на английском языке и следующие параметры:
-
numberOfImages
: Количество генерируемых изображений, от 1 до 4 (включительно). Значение по умолчанию — 4. -
sampleImageSize
: размер сгенерированного изображения. Поддерживается только для моделей Standard и Ultra. Поддерживаемые значения:1K
и2K
. Значение по умолчанию —1K
. -
aspectRatio
: изменяет соотношение сторон создаваемого изображения. Поддерживаемые значения:"1:1"
,"3:4"
,"4:3"
,"9:16"
и"16:9"
. Значение по умолчанию —"1:1"
. personGeneration
: Разрешить модели генерировать изображения людей. Поддерживаются следующие значения:-
"dont_allow"
: Блокировать генерацию изображений людей. -
"allow_adult"
: создавать изображения взрослых, но не детей. Это значение по умолчанию. -
"allow_all"
: создавать изображения, включающие взрослых и детей.
-
Руководство по подсказкам Imagen
В этом разделе руководства Imagen показано, как изменение запроса на преобразование текста в изображение может привести к разным результатам, а также приведены примеры изображений, которые вы можете создать.
Основы письма в оперативном режиме
Хорошее предложение должно быть описательным и понятным, с использованием значимых ключевых слов и модификаторов. Начните с продумывания темы , контекста и стиля .

Тема : Первое, о чем следует подумать при получении любой подсказки, — это тема : объект, человек, животное или пейзаж, которые вы хотите изобразить.
Контекст и фон: Не менее важен фон или контекст , в котором будет находиться объект съёмки. Попробуйте разместить объект съёмки на разных фонах. Например, в студии с белым фоном, на улице или в помещении.
Стиль: Наконец, выберите нужный стиль изображения. Стили могут быть общими (живопись, фотография, наброски) или узкоспециализированными (пастель, рисунок углём, изометрическая 3D-модель). Вы также можете комбинировать стили.
После того, как вы напишете первую версию своего задания, доработайте его, добавляя детали, пока не получите желаемое изображение. Итерации очень важны. Начните с определения основной идеи, а затем совершенствуйте и развивайте её, пока изображение не будет максимально приближено к вашему замыслу.
![]() | ![]() | ![]() |
Модели Imagen могут превратить ваши идеи в подробные изображения, независимо от того, короткие у вас подсказки или длинные и подробные. Уточняйте своё видение с помощью итеративных подсказок, добавляя детали, пока не достигнете идеального результата.
Короткие подсказки позволят вам быстро создать изображение. ![]() | Более длинные подсказки позволяют вам добавлять конкретные детали и формировать свой образ. ![]() |
Дополнительные советы по написанию подсказок Imagen:
- Используйте описательный язык : используйте подробные прилагательные и наречия, чтобы нарисовать ясную картину для Imagen.
- Предоставьте контекст : при необходимости включите справочную информацию, которая поможет ИИ понять ситуацию.
- Ссылки на конкретных художников или стили : если вы придерживаетесь определенной эстетики, ссылки на конкретных художников или художественные течения могут быть полезны.
- Используйте инструменты проектирования подсказок : рассмотрите возможность изучения инструментов или ресурсов проектирования подсказок, которые помогут вам усовершенствовать подсказки и достичь оптимальных результатов.
- Улучшение деталей лица на личных и групповых снимках : укажите детали лица в качестве фокуса фотографии (например, используйте в подсказке слово «портрет»).
Генерация текста на изображениях
Модели Imagen позволяют добавлять текст к изображениям, открывая более творческие возможности для создания изображений. Чтобы максимально эффективно использовать эту функцию, воспользуйтесь следующими рекомендациями:
- Уверенно повторяйте : возможно, вам придётся пересоздать изображения, пока не добьётесь желаемого результата. Интеграция текста в Imagen всё ещё развивается, и иногда несколько попыток дают наилучшие результаты.
- Соблюдайте краткость : для оптимальной генерации ограничьте текст 25 символами или меньше.
Несколько фраз : экспериментируйте с двумя или тремя разными фразами, чтобы предоставить дополнительную информацию. Избегайте использования более трёх фраз для более чёткого изложения.
Подсказка: Плакат с надписью «Summerland» жирным шрифтом в качестве заголовка, под этим текстом — слоган «Лето никогда не было таким прекрасным». Размещение направляющих : Imagen может пытаться позиционировать текст в соответствии с указаниями, но возможны некоторые отклонения. Эта функция постоянно совершенствуется.
Вдохновляйте на стиль шрифта : укажите общий стиль шрифта, чтобы тонко влиять на выбор Imagen. Не полагайтесь на точное копирование шрифта, но рассчитывайте на творческие интерпретации.
Размер шрифта : укажите размер шрифта или общее указание размера (например, маленький , средний , большой ), чтобы повлиять на генерацию размера шрифта.
Быстрая параметризация
Для лучшего контроля результатов вывода может быть полезно параметризовать входные данные в Imagen. Например, предположим, что вы хотите, чтобы ваши клиенты могли создавать логотипы для своей компании, и вы хотите, чтобы они всегда создавались на однотонном фоне. Вы также хотите ограничить выбор вариантов, которые клиент может выбрать в меню.
В этом примере вы можете создать параметризованное приглашение, подобное следующему:
A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.
В вашем пользовательском интерфейсе клиент может вводить параметры с помощью меню, а выбранное им значение заполняет подсказку, которую получает Imagen.
Например:
Подсказка:
A minimalist logo for a health care company on a solid color background. Include the text Journey .
Подсказка:
A modern logo for a software company on a solid color background. Include the text Silo .
Подсказка:
A traditional logo for a baking company on a solid color background. Include the text Seed .
Продвинутые методы письма в сжатом виде
Используйте следующие примеры для создания более конкретных подсказок на основе таких атрибутов, как описания фотографий, формы и материалы, исторические направления в искусстве и модификаторы качества изображения.
Фотография
- Подсказка включает: «Фотография...»
Чтобы использовать этот стиль, начните с ключевых слов, которые чётко сообщат Imagen, что вы ищете фотографию. Начните запросы со слов «Фотография...» . Например:
![]() | ![]() | ![]() |
Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 3.
Модификаторы фотографии
В следующих примерах вы увидите несколько модификаторов и параметров, специфичных для фотографии. Вы можете комбинировать несколько модификаторов для более точного управления.
Приближение камеры — крупный план, снято издалека
Подсказка: фотография кофейных зерен крупным планом. Подсказка: Уменьшенное фото небольшого пакета
кофейные зерна на грязной кухнеПоложение камеры — сверху, снизу
Подсказка: аэрофотоснимок города с небоскребами. Подсказка: Фотография полога леса с голубым небом снизу. Освещение - естественное, драматическое, теплое, холодное
Подсказка: студийное фото современного кресла, естественное освещение. Подсказка: студийное фото современного кресла, эффектное освещение. Настройки камеры — размытие движения, мягкий фокус, боке, портрет
Подсказка: фотография города с небоскребами из салона автомобиля с размытием движения. Подсказка: фотография моста в городе ночью, сделанная с использованием мягкого фокуса. Типы объективов — 35 мм, 50 мм, «рыбий глаз», широкоугольный, макро
Подсказка: фотография листа, макрообъектив Подсказка: уличная фотография, Нью-Йорк, объектив типа «рыбий глаз» Типы пленок - черно-белая, поляроид
Подсказка: полароидный портрет собаки в солнцезащитных очках. Подсказка: черно-белая фотография собаки в солнцезащитных очках.
Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 3.
Иллюстрация и искусство
- В подсказку включены: « painting с изображением...» , « sketch ...».
Стили рисования варьируются от монохромных, таких как карандашные наброски, до гиперреалистичного цифрового искусства. Например, на следующих изображениях используется одна и та же подсказка, но в разных стилях:
« [art style or creation technique] угловатого спортивного электрического седана на фоне небоскрёбов»
![]() | ![]() | ![]() |
![]() | ![]() | ![]() |
Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 2.
Формы и материалы
- Подсказка включает: «...сделан из...» , «...в форме...»
Одно из преимуществ этой технологии заключается в том, что вы можете создавать изображения, которые иначе было бы сложно или невозможно создать. Например, вы можете воссоздать логотип своей компании, используя различные материалы и текстуры.
![]() | ![]() | ![]() |
Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 3.
Исторические ссылки на искусство
- Подсказка включает: «...в стиле...»
Некоторые стили стали культовыми за годы своего существования. Ниже представлены несколько идей исторической живописи или художественных стилей, которые вы можете попробовать.
«создать изображение в стиле [art period or movement] : ветряная электростанция»
![]() | ![]() | ![]() |
Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 3.
Модификаторы качества изображения
Определённые ключевые слова могут дать модели понять, что вы ищете высококачественный актив. Примеры модификаторов качества:
- Общие модификаторы - качественные, красивые, стилизованные
- Фото — 4K, HDR, студийное фото
- Искусство, Иллюстрация - от профессионального, детального
Ниже приведены несколько примеров подсказок без модификаторов качества и та же подсказка с модификаторами качества.
![]() | ![]() Фотография стебля кукурузы , сделанная профессиональный фотограф |
Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 3.
Соотношения сторон
Генерация изображений Imagen позволяет вам устанавливать пять различных соотношений сторон изображения.
- Квадрат (1:1, по умолчанию) — стандартное квадратное фото. Это соотношение сторон часто используется в публикациях в социальных сетях.
Полноэкранный формат (4:3) — это соотношение сторон обычно используется в медиа и кино. Оно также соответствует формату большинства старых (не широкоэкранных) телевизоров и среднеформатных камер. Оно охватывает большую часть кадра по горизонтали (по сравнению с 1:1), что делает его предпочтительным для фотографии.
Подсказка: крупный план пальцев музыканта, играющего на пианино, черно-белая пленка, винтаж (соотношение сторон 4:3) Подсказка: Профессиональная студийная фотография картофеля фри для дорогого ресторана в стиле кулинарного журнала (соотношение сторон 4:3) Портретная ориентация на весь экран (3:4) — это соотношение сторон полноэкранного изображения, повёрнутое на 90 градусов. Это позволяет охватить большую часть сцены по вертикали по сравнению с соотношением сторон 1:1.
Подсказка: женщина идет пешком, ее ботинки отражаются в луже, на заднем плане — высокие горы, в рекламном стиле, драматичные ракурсы (соотношение сторон 3:4) Подсказка: аэрофотоснимок реки, текущей вверх по таинственной долине (соотношение сторон 3:4) Широкоэкранный (16:9) — это соотношение пришло на смену 4:3 и теперь является наиболее распространённым соотношением сторон для телевизоров, мониторов и экранов мобильных телефонов (альбомная ориентация). Используйте это соотношение сторон, если хотите захватить большую часть фона (например, живописные пейзажи).
Подсказка: мужчина в белой одежде сидит на пляже, крупный план, освещение «золотого часа» (соотношение сторон 16:9) Портрет (9:16) — это соотношение сторон широкоэкранное, но повёрнутое. Это относительно новое соотношение сторон, получившее распространение благодаря приложениям для съёмки коротких видеороликов (например, YouTube Shorts). Используйте его для высоких объектов с ярко выраженной вертикальной ориентацией, таких как здания, деревья, водопады и другие подобные объекты.
Подсказка: цифровая визуализация огромного небоскреба, современного, грандиозного, эпического с красивым закатом на заднем плане (соотношение сторон 9:16)
Фотореалистичные изображения
Различные версии модели генерации изображений могут обеспечивать сочетание художественного и фотореалистичного результата. Используйте следующую формулировку в подсказках для создания более фотореалистичного результата в зависимости от объекта, который вы хотите создать.
Вариант использования | Тип объектива | Фокусные расстояния | Дополнительные детали |
---|---|---|---|
Люди (портреты) | Prime, Zoom | 24-35 мм | Черно-белая пленка, Фильм-нуар, Глубина резкости, Дуотон (укажите два цвета) |
Еда, насекомые, растения (предметы, натюрморт) | Макрос | 60-105 мм | Высокая детализация, точная фокусировка, контролируемое освещение |
Спорт, дикая природа (движение) | Телефото зум | 100-400 мм | Короткая выдержка, отслеживание действий или движения |
Астрономический, пейзажный (широкоугольный) | Широкоугольный | 10-24 мм | Длительное время экспозиции, четкий фокус, длительная выдержка, гладкая вода или облака |
Портреты
Вариант использования | Тип объектива | Фокусные расстояния | Дополнительные детали |
---|---|---|---|
Люди (портреты) | Prime, Zoom | 24-35 мм | Черно-белая пленка, Фильм-нуар, Глубина резкости, Дуотон (укажите два цвета) |
Используя несколько ключевых слов из таблицы, Imagen может сгенерировать следующие портреты:
![]() | ![]() | ![]() | ![]() |
Подсказка: Женщина, портрет, 35 мм, синие и серые дуотоны
Модель: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
Подсказка: Женщина, 35-мм портрет, фильм-нуар
Модель: imagen-3.0-generate-002
Объекты
Вариант использования | Тип объектива | Фокусные расстояния | Дополнительные детали |
---|---|---|---|
Еда, насекомые, растения (предметы, натюрморт) | Макрос | 60-105 мм | Высокая детализация, точная фокусировка, контролируемое освещение |
Используя несколько ключевых слов из таблицы, Imagen может генерировать следующие изображения объектов:
![]() | ![]() | ![]() | ![]() |
Подсказка: лист молитвенного растения, макрообъектив, 60 мм
Модель: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
Подсказка: тарелка пасты, макрообъектив 100 мм.
Модель: imagen-3.0-generate-002
Движение
Вариант использования | Тип объектива | Фокусные расстояния | Дополнительные детали |
---|---|---|---|
Спорт, дикая природа (движение) | Телефото зум | 100-400 мм | Короткая выдержка, отслеживание действий или движения |
Используя несколько ключевых слов из таблицы, Imagen может генерировать следующие движущиеся изображения:
![]() | ![]() | ![]() | ![]() |
Подсказка: победный тачдаун, быстрая выдержка, отслеживание движения
Модель: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
Подсказка: Олень бежит по лесу, короткая выдержка, отслеживание движения.
Модель: imagen-3.0-generate-002
Широкоугольный
Вариант использования | Тип объектива | Фокусные расстояния | Дополнительные детали |
---|---|---|---|
Астрономический, пейзажный (широкоугольный) | Широкоугольный | 10-24 мм | Длительное время экспозиции, четкий фокус, длительная выдержка, гладкая вода или облака |
Используя несколько ключевых слов из таблицы, Imagen может генерировать следующие широкоугольные изображения:
![]() | ![]() | ![]() | ![]() |
Подсказка: обширный горный хребет, пейзаж, широкоугольный объектив 10 мм
Модель: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
Подсказка: фотография Луны, астрофотография, широкоугольный объектив 10 мм.
Модель: imagen-3.0-generate-002
Версии модели
Имидж 4
Свойство | Описание |
---|---|
Код модели | API Близнецов |
Поддерживаемые типы данных | Вход Текст Выход Изображения |
[*] | Лимиты токеновЛимит входных токенов 480 токенов (текст) Выходные изображения От 1 до 4 (Ультра/Стандарт/Быстро) |
Последнее обновление | Июнь 2025 г. |
Имидж 3
Свойство | Описание |
---|---|
Код модели | API Близнецов |
Поддерживаемые типы данных | Вход Текст Выход Изображения |
[*] | Лимиты токеновЛимит входных токенов Н/Д Выходные изображения До 4 |
Последнее обновление | Февраль 2025 г. |