Генерируйте изображения с помощью Imagen

Imagen — это высокоточная модель генерации изображений от Google, способная создавать реалистичные и качественные изображения на основе текстовых запросов. Все сгенерированные изображения содержат водяной знак SynthID. Подробнее о доступных вариантах модели Imagen см. в разделе «Версии моделей» .

Генерация изображений с использованием моделей Imagen

В этом примере демонстрируется генерация изображений с помощью модели Imagen :

Питон

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

response = client.models.generate_images(
    model='imagen-4.0-generate-001',
    prompt='Robot holding a red skateboard',
    config=types.GenerateImagesConfig(
        number_of_images= 4,
    )
)
for generated_image in response.generated_images:
  generated_image.image.show()

JavaScript

import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({});

  const response = await ai.models.generateImages({
    model: 'imagen-4.0-generate-001',
    prompt: 'Robot holding a red skateboard',
    config: {
      numberOfImages: 4,
    },
  });

  let idx = 1;
  for (const generatedImage of response.generatedImages) {
    let imgBytes = generatedImage.image.imageBytes;
    const buffer = Buffer.from(imgBytes, "base64");
    fs.writeFileSync(`imagen-${idx}.png`, buffer);
    idx++;
  }
}

main();

Идти

package main

import (
  "context"
  "fmt"
  "os"
  "google.golang.org/genai"
)

func main() {

  ctx := context.Background()
  client, err := genai.NewClient(ctx, nil)
  if err != nil {
      log.Fatal(err)
  }

  config := &genai.GenerateImagesConfig{
      NumberOfImages: 4,
  }

  response, _ := client.Models.GenerateImages(
      ctx,
      "imagen-4.0-generate-001",
      "Robot holding a red skateboard",
      config,
  )

  for n, image := range response.GeneratedImages {
      fname := fmt.Sprintf("imagen-%d.png", n)
          _ = os.WriteFile(fname, image.Image.ImageBytes, 0644)
  }
}

ОТДЫХ

curl -X POST \
    "https://generativelanguage.googleapis.com/v1beta/models/imagen-4.0-generate-001:predict" \
    -H "x-goog-api-key: $GEMINI_API_KEY" \
    -H "Content-Type: application/json" \
    -d '{
        "instances": [
          {
            "prompt": "Robot holding a red skateboard"
          }
        ],
        "parameters": {
          "sampleCount": 4
        }
      }'
Созданное искусственным интеллектом изображение робота, держащего красный скейтборд
Созданное искусственным интеллектом изображение робота, держащего красный скейтборд

Конфигурация изображения

В настоящее время Imagen поддерживает только подсказки на английском языке и следующие параметры:

  • numberOfImages : Количество генерируемых изображений, от 1 до 4 (включительно). Значение по умолчанию — 4.
  • sampleImageSize : размер сгенерированного изображения. Поддерживается только для моделей Standard и Ultra. Поддерживаемые значения: 1K и 2K . Значение по умолчанию — 1K .
  • aspectRatio : изменяет соотношение сторон создаваемого изображения. Поддерживаемые значения: "1:1" , "3:4" , "4:3" , "9:16" и "16:9" . Значение по умолчанию — "1:1" .
  • personGeneration : Разрешить модели генерировать изображения людей. Поддерживаются следующие значения:

    • "dont_allow" : Блокировать генерацию изображений людей.
    • "allow_adult" : создавать изображения взрослых, но не детей. Это значение по умолчанию.
    • "allow_all" : создавать изображения, включающие взрослых и детей.

Руководство по подсказкам Imagen

В этом разделе руководства Imagen показано, как изменение запроса на преобразование текста в изображение может привести к разным результатам, а также приведены примеры изображений, которые вы можете создать.

Основы письма в оперативном режиме

Хорошее предложение должно быть описательным и понятным, с использованием значимых ключевых слов и модификаторов. Начните с продумывания темы , контекста и стиля .

Подсказка с акцентом на тему, контекст и стиль
Текст изображения: Эскиз ( стиль ) современного многоквартирного дома ( предмет ), окруженного небоскребами ( контекст и фон ).
  1. Тема : Первое, о чем следует подумать при получении любой подсказки, — это тема : объект, человек, животное или пейзаж, которые вы хотите изобразить.

  2. Контекст и фон: Не менее важен фон или контекст , в котором будет находиться объект съёмки. Попробуйте разместить объект съёмки на разных фонах. Например, в студии с белым фоном, на улице или в помещении.

  3. Стиль: Наконец, выберите нужный стиль изображения. Стили могут быть общими (живопись, фотография, наброски) или узкоспециализированными (пастель, рисунок углём, изометрическая 3D-модель). Вы также можете комбинировать стили.

После того, как вы напишете первую версию своего задания, доработайте его, добавляя детали, пока не получите желаемое изображение. Итерации очень важны. Начните с определения основной идеи, а затем совершенствуйте и развивайте её, пока изображение не будет максимально приближено к вашему замыслу.

фотореалистичное изображение образца 1
Подсказка: Парк весной рядом с озером.
фотореалистичное изображение образца 2
Подсказка: Парк весной рядом с озером, солнце садится за озером, золотой час
фотореалистичное изображение образца 3
Подсказка: Весенний парк рядом с озером, солнце садится за озером, золотой час, красные полевые цветы.

Модели Imagen могут превратить ваши идеи в подробные изображения, независимо от того, короткие у вас подсказки или длинные и подробные. Уточняйте своё видение с помощью итеративных подсказок, добавляя детали, пока не достигнете идеального результата.

Короткие подсказки позволят вам быстро создать изображение.

Пример короткой подсказки Imagen 3
Подсказка: фотография крупным планом женщины около 20 лет, уличная фотография, кадр из фильма, приглушенные теплые оранжевые тона.

Более длинные подсказки позволяют вам добавлять конкретные детали и формировать свой образ.

Пример длинной подсказки Imagen 3
Подсказка: захватывающее фото женщины около 20 лет, выполненное в стиле уличной фотографии. Изображение должно выглядеть как кадр из фильма в приглушённых тёплых оранжевых тонах.

Дополнительные советы по написанию подсказок Imagen:

  • Используйте описательный язык : используйте подробные прилагательные и наречия, чтобы нарисовать ясную картину для Imagen.
  • Предоставьте контекст : при необходимости включите справочную информацию, которая поможет ИИ понять ситуацию.
  • Ссылки на конкретных художников или стили : если вы придерживаетесь определенной эстетики, ссылки на конкретных художников или художественные течения могут быть полезны.
  • Используйте инструменты проектирования подсказок : рассмотрите возможность изучения инструментов или ресурсов проектирования подсказок, которые помогут вам усовершенствовать подсказки и достичь оптимальных результатов.
  • Улучшение деталей лица на личных и групповых снимках : укажите детали лица в качестве фокуса фотографии (например, используйте в подсказке слово «портрет»).

Генерация текста на изображениях

Модели Imagen позволяют добавлять текст к изображениям, открывая более творческие возможности для создания изображений. Чтобы максимально эффективно использовать эту функцию, воспользуйтесь следующими рекомендациями:

  • Уверенно повторяйте : возможно, вам придётся пересоздать изображения, пока не добьётесь желаемого результата. Интеграция текста в Imagen всё ещё развивается, и иногда несколько попыток дают наилучшие результаты.
  • Соблюдайте краткость : для оптимальной генерации ограничьте текст 25 символами или меньше.
  • Несколько фраз : экспериментируйте с двумя или тремя разными фразами, чтобы предоставить дополнительную информацию. Избегайте использования более трёх фраз для более чёткого изложения.

    Пример генерации текста в Imagen 3
    Подсказка: Плакат с надписью «Summerland» жирным шрифтом в качестве заголовка, под этим текстом — слоган «Лето никогда не было таким прекрасным».
  • Размещение направляющих : Imagen может пытаться позиционировать текст в соответствии с указаниями, но возможны некоторые отклонения. Эта функция постоянно совершенствуется.

  • Вдохновляйте на стиль шрифта : укажите общий стиль шрифта, чтобы тонко влиять на выбор Imagen. Не полагайтесь на точное копирование шрифта, но рассчитывайте на творческие интерпретации.

  • Размер шрифта : укажите размер шрифта или общее указание размера (например, маленький , средний , большой ), чтобы повлиять на генерацию размера шрифта.

Быстрая параметризация

Для лучшего контроля результатов вывода может быть полезно параметризовать входные данные в Imagen. Например, предположим, что вы хотите, чтобы ваши клиенты могли создавать логотипы для своей компании, и вы хотите, чтобы они всегда создавались на однотонном фоне. Вы также хотите ограничить выбор вариантов, которые клиент может выбрать в меню.

В этом примере вы можете создать параметризованное приглашение, подобное следующему:

A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.

В вашем пользовательском интерфейсе клиент может вводить параметры с помощью меню, а выбранное им значение заполняет подсказку, которую получает Imagen.

Например:

  1. Подсказка: A minimalist logo for a health care company on a solid color background. Include the text Journey .

    Пример параметризации подсказки Imagen 3 1

  2. Подсказка: A modern logo for a software company on a solid color background. Include the text Silo .

    Пример параметризации подсказки Imagen 3 2

  3. Подсказка: A traditional logo for a baking company on a solid color background. Include the text Seed .

    Пример параметризации подсказки Imagen 3 3

Продвинутые методы письма в сжатом виде

Используйте следующие примеры для создания более конкретных подсказок на основе таких атрибутов, как описания фотографий, формы и материалы, исторические направления в искусстве и модификаторы качества изображения.

Фотография

  • Подсказка включает: «Фотография...»

Чтобы использовать этот стиль, начните с ключевых слов, которые чётко сообщат Imagen, что вы ищете фотографию. Начните запросы со слов «Фотография...» . Например:

фотореалистичное изображение образца 1
Подсказка: Фотография кофейных зерен на кухне на деревянной поверхности.
фотореалистичное изображение образца 2
Подсказка: фотография плитки шоколада на кухонном столе.
фотореалистичное изображение образца 3
Подсказка: Фотография современного здания на фоне воды.

Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 3.

Модификаторы фотографии

В следующих примерах вы увидите несколько модификаторов и параметров, специфичных для фотографии. Вы можете комбинировать несколько модификаторов для более точного управления.

  1. Приближение камерыкрупный план, снято издалека

    пример изображения с камеры крупным планом
    Подсказка: фотография кофейных зерен крупным планом.
    пример изображения с уменьшенной камеры
    Подсказка: Уменьшенное фото небольшого пакета
    кофейные зерна на грязной кухне

  2. Положение камерысверху, снизу

    образец изображения аэрофотоснимка
    Подсказка: аэрофотоснимок города с небоскребами.
    вид снизу образец изображения
    Подсказка: Фотография полога леса с голубым небом снизу.
  3. Освещение - естественное, драматическое, теплое, холодное

    образец изображения естественного освещения
    Подсказка: студийное фото современного кресла, естественное освещение.
    изображение образца драматического освещения
    Подсказка: студийное фото современного кресла, эффектное освещение.
  4. Настройки камеры — размытие движения, мягкий фокус, боке, портрет

    образец изображения размытия движения
    Подсказка: фотография города с небоскребами из салона автомобиля с размытием движения.
    образец изображения с мягким фокусом
    Подсказка: фотография моста в городе ночью, сделанная с использованием мягкого фокуса.
  5. Типы объективов35 мм, 50 мм, «рыбий глаз», широкоугольный, макро

    пример изображения макрообъектива
    Подсказка: фотография листа, макрообъектив
    образец изображения с объектива «рыбий глаз»
    Подсказка: уличная фотография, Нью-Йорк, объектив типа «рыбий глаз»
  6. Типы пленок - черно-белая, поляроид

    образец фотографии Polaroid
    Подсказка: полароидный портрет собаки в солнцезащитных очках.
    образец черно-белой фотографии
    Подсказка: черно-белая фотография собаки в солнцезащитных очках.

Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 3.

Иллюстрация и искусство

  • В подсказку включены: « painting с изображением...» , « sketch ...».

Стили рисования варьируются от монохромных, таких как карандашные наброски, до гиперреалистичного цифрового искусства. Например, на следующих изображениях используется одна и та же подсказка, но в разных стилях:

« [art style or creation technique] угловатого спортивного электрического седана на фоне небоскрёбов»

образцы изображений
Подсказка: Технический карандашный рисунок угловатого...
образцы изображений
Подсказка: Рисунок углем, изображающий угловатую...
образцы изображений
Подсказка: Рисунок цветными карандашами угловатого...
образцы изображений
Подсказка: Пастельная картина , изображающая угловатую...
образцы изображений
Подсказка: Цифровое искусство угловатого...
образцы изображений
Подсказка: Плакат в стиле ар-деко с изображением угловатого...

Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 2.

Формы и материалы
  • Подсказка включает: «...сделан из...» , «...в форме...»

Одно из преимуществ этой технологии заключается в том, что вы можете создавать изображения, которые иначе было бы сложно или невозможно создать. Например, вы можете воссоздать логотип своей компании, используя различные материалы и текстуры.

пример форм и материалов, изображение 1
Подсказка: дорожная сумка из сыра
пример форм и материалов, изображение 2
Подсказка: неоновые трубки в форме птицы
пример форм и материалов, изображение 3
Подсказка: кресло из бумаги , студийное фото, стиль оригами.

Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 3.

Исторические ссылки на искусство

  • Подсказка включает: «...в стиле...»

Некоторые стили стали культовыми за годы своего существования. Ниже представлены несколько идей исторической живописи или художественных стилей, которые вы можете попробовать.

«создать изображение в стиле [art period or movement] : ветряная электростанция»

пример изображения импрессионизма
Задание: создать изображение в стиле импрессионистической картины : ветряная электростанция.
пример изображения эпохи Возрождения
Задание: создать изображение в стиле живописи эпохи Возрождения : ветряная электростанция.
пример изображения в стиле поп-арт
Задание: создать изображение в стиле поп-арт : ветряная электростанция.

Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 3.

Модификаторы качества изображения

Определённые ключевые слова могут дать модели понять, что вы ищете высококачественный актив. Примеры модификаторов качества:

  • Общие модификаторы - качественные, красивые, стилизованные
  • Фото4K, HDR, студийное фото
  • Искусство, Иллюстрация - от профессионального, детального

Ниже приведены несколько примеров подсказок без модификаторов качества и та же подсказка с модификаторами качества.

пример изображения кукурузы без модификаторов
Подсказка (без модификаторов качества): фотография стебля кукурузы
пример изображения кукурузы с модификаторами
Подсказка (с модификаторами качества): 4k HDR прекрасно
Фотография стебля кукурузы , сделанная
профессиональный фотограф

Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 3.

Соотношения сторон

Генерация изображений Imagen позволяет вам устанавливать пять различных соотношений сторон изображения.

  1. Квадрат (1:1, по умолчанию) — стандартное квадратное фото. Это соотношение сторон часто используется в публикациях в социальных сетях.
  2. Полноэкранный формат (4:3) — это соотношение сторон обычно используется в медиа и кино. Оно также соответствует формату большинства старых (не широкоэкранных) телевизоров и среднеформатных камер. Оно охватывает большую часть кадра по горизонтали (по сравнению с 1:1), что делает его предпочтительным для фотографии.

    пример соотношения сторон
    Подсказка: крупный план пальцев музыканта, играющего на пианино, черно-белая пленка, винтаж (соотношение сторон 4:3)
    пример соотношения сторон
    Подсказка: Профессиональная студийная фотография картофеля фри для дорогого ресторана в стиле кулинарного журнала (соотношение сторон 4:3)
  3. Портретная ориентация на весь экран (3:4) — это соотношение сторон полноэкранного изображения, повёрнутое на 90 градусов. Это позволяет охватить большую часть сцены по вертикали по сравнению с соотношением сторон 1:1.

    пример соотношения сторон
    Подсказка: женщина идет пешком, ее ботинки отражаются в луже, на заднем плане — высокие горы, в рекламном стиле, драматичные ракурсы (соотношение сторон 3:4)
    пример соотношения сторон
    Подсказка: аэрофотоснимок реки, текущей вверх по таинственной долине (соотношение сторон 3:4)
  4. Широкоэкранный (16:9) — это соотношение пришло на смену 4:3 и теперь является наиболее распространённым соотношением сторон для телевизоров, мониторов и экранов мобильных телефонов (альбомная ориентация). Используйте это соотношение сторон, если хотите захватить большую часть фона (например, живописные пейзажи).

    пример соотношения сторон
    Подсказка: мужчина в белой одежде сидит на пляже, крупный план, освещение «золотого часа» (соотношение сторон 16:9)
  5. Портрет (9:16) — это соотношение сторон широкоэкранное, но повёрнутое. Это относительно новое соотношение сторон, получившее распространение благодаря приложениям для съёмки коротких видеороликов (например, YouTube Shorts). Используйте его для высоких объектов с ярко выраженной вертикальной ориентацией, таких как здания, деревья, водопады и другие подобные объекты.

    пример соотношения сторон
    Подсказка: цифровая визуализация огромного небоскреба, современного, грандиозного, эпического с красивым закатом на заднем плане (соотношение сторон 9:16)

Фотореалистичные изображения

Различные версии модели генерации изображений могут обеспечивать сочетание художественного и фотореалистичного результата. Используйте следующую формулировку в подсказках для создания более фотореалистичного результата в зависимости от объекта, который вы хотите создать.

Вариант использования Тип объектива Фокусные расстояния Дополнительные детали
Люди (портреты) Prime, Zoom 24-35 мм Черно-белая пленка, Фильм-нуар, Глубина резкости, Дуотон (укажите два цвета)
Еда, насекомые, растения (предметы, натюрморт) Макрос 60-105 мм Высокая детализация, точная фокусировка, контролируемое освещение
Спорт, дикая природа (движение) Телефото зум 100-400 мм Короткая выдержка, отслеживание действий или движения
Астрономический, пейзажный (широкоугольный) Широкоугольный 10-24 мм Длительное время экспозиции, четкий фокус, длительная выдержка, гладкая вода или облака
Портреты
Вариант использования Тип объектива Фокусные расстояния Дополнительные детали
Люди (портреты) Prime, Zoom 24-35 мм Черно-белая пленка, Фильм-нуар, Глубина резкости, Дуотон (укажите два цвета)

Используя несколько ключевых слов из таблицы, Imagen может сгенерировать следующие портреты:

пример портретной фотографиипример портретной фотографиипример портретной фотографиипример портретной фотографии

Подсказка: Женщина, портрет, 35 мм, синие и серые дуотоны
Модель: imagen-3.0-generate-002

пример портретной фотографиипример портретной фотографиипример портретной фотографиипример портретной фотографии

Подсказка: Женщина, 35-мм портрет, фильм-нуар
Модель: imagen-3.0-generate-002

Объекты
Вариант использования Тип объектива Фокусные расстояния Дополнительные детали
Еда, насекомые, растения (предметы, натюрморт) Макрос 60-105 мм Высокая детализация, точная фокусировка, контролируемое освещение

Используя несколько ключевых слов из таблицы, Imagen может генерировать следующие изображения объектов:

пример объектной фотографиипример объектной фотографиипример объектной фотографиипример объектной фотографии

Подсказка: лист молитвенного растения, макрообъектив, 60 мм
Модель: imagen-3.0-generate-002

пример объектной фотографиипример объектной фотографиипример объектной фотографиипример объектной фотографии

Подсказка: тарелка пасты, макрообъектив 100 мм.
Модель: imagen-3.0-generate-002

Движение
Вариант использования Тип объектива Фокусные расстояния Дополнительные детали
Спорт, дикая природа (движение) Телефото зум 100-400 мм Короткая выдержка, отслеживание действий или движения

Используя несколько ключевых слов из таблицы, Imagen может генерировать следующие движущиеся изображения:

пример фотографии движенияпример фотографии движенияпример фотографии движенияпример фотографии движения

Подсказка: победный тачдаун, быстрая выдержка, отслеживание движения
Модель: imagen-3.0-generate-002

пример фотографии движенияпример фотографии движенияпример фотографии движенияпример фотографии движения

Подсказка: Олень бежит по лесу, короткая выдержка, отслеживание движения.
Модель: imagen-3.0-generate-002

Широкоугольный
Вариант использования Тип объектива Фокусные расстояния Дополнительные детали
Астрономический, пейзажный (широкоугольный) Широкоугольный 10-24 мм Длительное время экспозиции, четкий фокус, длительная выдержка, гладкая вода или облака

Используя несколько ключевых слов из таблицы, Imagen может генерировать следующие широкоугольные изображения:

пример широкоугольной фотографиипример широкоугольной фотографиипример широкоугольной фотографиипример широкоугольной фотографии

Подсказка: обширный горный хребет, пейзаж, широкоугольный объектив 10 мм
Модель: imagen-3.0-generate-002

пример широкоугольной фотографиипример широкоугольной фотографиипример широкоугольной фотографиипример широкоугольной фотографии

Подсказка: фотография Луны, астрофотография, широкоугольный объектив 10 мм.
Модель: imagen-3.0-generate-002

Версии модели

Имидж 4

Свойство Описание
Код модели

API Близнецов

imagen-4.0-generate-001
imagen-4.0-ultra-generate-001
imagen-4.0-fast-generate-001

Поддерживаемые типы данных

Вход

Текст

Выход

Изображения

Лимиты токенов [*]

Лимит входных токенов

480 токенов (текст)

Выходные изображения

От 1 до 4 (Ультра/Стандарт/Быстро)

Последнее обновление Июнь 2025 г.

Имидж 3

Свойство Описание
Код модели

API Близнецов

imagen-3.0-generate-002

Поддерживаемые типы данных

Вход

Текст

Выход

Изображения

Лимиты токенов [*]

Лимит входных токенов

Н/Д

Выходные изображения

До 4

Последнее обновление Февраль 2025 г.