Генерируйте изображения с помощью Imagen

Imagen — это высокоточная модель генерации изображений от Google, способная создавать реалистичные и высококачественные изображения на основе текстовых запросов. Все сгенерированные изображения содержат водяной знак SynthID. Подробнее о доступных вариантах модели Imagen см. в разделе « Версии модели» .

Создавайте изображения, используя модели Imagen.

Этот пример демонстрирует генерацию изображений с помощью модели Imagen :

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

response = client.models.generate_images(
    model='imagen-4.0-generate-001',
    prompt='Robot holding a red skateboard',
    config=types.GenerateImagesConfig(
        number_of_images= 4,
    )
)
for generated_image in response.generated_images:
  generated_image.image.show()

JavaScript

import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({});

  const response = await ai.models.generateImages({
    model: 'imagen-4.0-generate-001',
    prompt: 'Robot holding a red skateboard',
    config: {
      numberOfImages: 4,
    },
  });

  let idx = 1;
  for (const generatedImage of response.generatedImages) {
    let imgBytes = generatedImage.image.imageBytes;
    const buffer = Buffer.from(imgBytes, "base64");
    fs.writeFileSync(`imagen-${idx}.png`, buffer);
    idx++;
  }
}

main();

Идти

package main

import (
  "context"
  "fmt"
  "os"
  "google.golang.org/genai"
)

func main() {

  ctx := context.Background()
  client, err := genai.NewClient(ctx, nil)
  if err != nil {
      log.Fatal(err)
  }

  config := &genai.GenerateImagesConfig{
      NumberOfImages: 4,
  }

  response, _ := client.Models.GenerateImages(
      ctx,
      "imagen-4.0-generate-001",
      "Robot holding a red skateboard",
      config,
  )

  for n, image := range response.GeneratedImages {
      fname := fmt.Sprintf("imagen-%d.png", n)
          _ = os.WriteFile(fname, image.Image.ImageBytes, 0644)
  }
}

ОТДЫХ

curl -X POST \
    "https://generativelanguage.googleapis.com/v1beta/models/imagen-4.0-generate-001:predict" \
    -H "x-goog-api-key: $GEMINI_API_KEY" \
    -H "Content-Type: application/json" \
    -d '{
        "instances": [
          {
            "prompt": "Robot holding a red skateboard"
          }
        ],
        "parameters": {
          "sampleCount": 4
        }
      }'
Изображение робота, держащего красный скейтборд, созданное с помощью ИИ.
Изображение робота, держащего красный скейтборд, созданное с помощью ИИ.

Конфигурация изображения

В настоящее время Imagen поддерживает только подсказки на английском языке и следующие параметры:

  • numberOfImages : Количество изображений для генерации, от 1 до 4 (включительно). Значение по умолчанию — 4.
  • imageSize : Размер создаваемого изображения. Поддерживается только для моделей Standard и Ultra. Поддерживаемые значения: 1K и 2K . Значение по умолчанию: 1K .
  • aspectRatio : Изменяет соотношение сторон создаваемого изображения. Поддерживаемые значения: "1:1" , "3:4" , "4:3" , "9:16" и "16:9" . Значение по умолчанию — "1:1" .
  • personGeneration : Разрешить модели генерировать изображения людей. Поддерживаются следующие значения:

    • "dont_allow" : Блокировать генерацию изображений людей.
    • "allow_adult" : Генерировать изображения взрослых, но не детей. Это значение по умолчанию.
    • "allow_all" : Создавать изображения, включающие взрослых и детей.

Руководство по использованию изображений

В этом разделе руководства по Imagen показано, как изменение запроса на преобразование текста в изображение может привести к различным результатам, а также приведены примеры изображений, которые вы можете создать.

Основы написания текстов по заданным темам

Хороший запрос должен быть описательным и ясным, а также содержать значимые ключевые слова и определения. Начните с обдумывания темы , контекста и стиля .

Задание с акцентом на тему, контекст и стиль.
Текст изображения: Эскиз ( стиль ) современного многоквартирного дома ( тема ), окруженного небоскребами ( контекст и фон ).
  1. Тема : Первое, о чем следует подумать, выбирая любое задание, — это тема : предмет, человек, животное или пейзаж, изображение которого вы хотите получить.

  2. Контекст и фон: Не менее важен фон или контекст, в котором будет размещен объект съемки. Попробуйте разместить объект на разных фонах. Например, в студии на белом фоне, на открытом воздухе или в помещении.

  3. Стиль: Наконец, добавьте желаемый стиль изображения. Стили могут быть общими (живопись, фотография, эскизы) или очень специфическими (пастельная живопись, рисунок углем, изометрическая 3D-модель). Вы также можете комбинировать стили.

После того, как вы напишете первый вариант своего задания, доработайте его, добавив больше деталей, пока не получите желаемый образ. Итерация важна. Начните с определения основной идеи, а затем дорабатывайте и расширяйте её, пока полученный образ не будет близок к вашему видению.

фотореалистичное изображение-образец 1
Задание: Весенний парк у озера.
фотореалистичное изображение-образец 2
Задание: Весенний парк у озера, закат над озером, золотой час.
фотореалистичное изображение-образец 3
Задание: Весенний парк у озера, закат над озером, золотой час, красные полевые цветы.

Модели изображений могут превратить ваши идеи в детальные изображения, независимо от того, короткие или длинные и подробные ваши запросы. Уточняйте свое видение с помощью итеративных запросов, добавляя детали, пока не добьетесь идеального результата.

Короткие подсказки позволяют быстро создать изображение.

Пример короткой подсказки Imagen 3
Задание: крупный план женщины в возрасте около 20 лет, уличная фотография, кадр из фильма, приглушенные оранжевые теплые тона.

Более длинные подсказки позволяют добавить конкретные детали и сформировать свой образ.

Пример длинного запроса Imagen 3
Задание: захватывающая фотография женщины в возрасте около 20 лет, выполненная в стиле уличной фотографии. Изображение должно выглядеть как кадр из фильма с приглушенными теплыми оранжевыми тонами.

Дополнительные советы по написанию текстов по заданию Imagen:

  • Используйте описательный язык : применяйте подробные прилагательные и наречия, чтобы создать четкую картину для Imagen.
  • Предоставьте контекст : при необходимости включите справочную информацию, которая поможет ИИ понять материал.
  • Упоминайте конкретных художников или стили : если у вас есть определенное эстетическое видение, полезно будет обратиться к работам конкретных художников или художественным направлениям.
  • Используйте инструменты для оптимизации подсказок : Рассмотрите возможность изучения инструментов или ресурсов для оптимизации подсказок, которые помогут вам улучшить ваши подсказки и добиться оптимальных результатов.
  • Улучшение детализации лиц на ваших личных и групповых фотографиях : Укажите детали лица как основной акцент фотографии (например, используйте слово «портрет» в задании).

Создание текста на изображениях

Модели изображений позволяют добавлять текст в изображения, открывая новые возможности для креативного создания картинок. Воспользуйтесь приведенными ниже рекомендациями, чтобы максимально эффективно использовать эту функцию:

  • Не бойтесь экспериментировать : возможно, вам придётся перегенерировать изображения, пока вы не добьётесь желаемого результата. Интеграция текста в Imagen всё ещё находится в стадии развития, и иногда несколько попыток дают наилучшие результаты.
  • Краткость : для оптимальной генерации текста ограничьте его 25 символами или меньше.
  • Использование нескольких фраз : поэкспериментируйте с двумя или тремя различными фразами, чтобы добавить дополнительную информацию. Избегайте использования более трех фраз для более лаконичного изложения.

    Пример генерации текста в Imagen 3
    Задание: Плакат с заголовком, написанным жирным шрифтом «Летняя страна», под которым расположен слоган «Лето еще никогда не было таким прекрасным».
  • Направляющие для размещения текста : Хотя Imagen может попытаться расположить текст в соответствии с указаниями, возможны occasional отклонения. Эта функция постоянно совершенствуется.

  • Задайте стиль шрифта : укажите общий стиль шрифта, чтобы незаметно повлиять на выбор шрифтов Imagen. Не полагайтесь на точное воспроизведение шрифта, но ожидайте творческих интерпретаций.

  • Размер шрифта : Укажите размер шрифта или общее обозначение размера (например, маленький , средний , большой ), чтобы повлиять на генерацию размера шрифта.

Параметризация подсказок

Для более точного контроля результатов может быть полезно параметризовать входные данные в Imagen. Например, предположим, вы хотите, чтобы ваши клиенты могли создавать логотипы для своего бизнеса, и вы хотите убедиться, что логотипы всегда создаются на однотонном фоне. Вы также хотите ограничить выбор параметров, которые клиент может выбрать из меню.

В этом примере вы можете создать параметризованную подсказку, аналогичную следующей:

A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.

В вашем пользовательском интерфейсе клиент может ввести параметры с помощью меню, и выбранное им значение будет отображаться в подсказке, которую получит Imagen.

Например:

  1. Задание: A minimalist logo for a health care company on a solid color background. Include the text Journey .

    Пример параметризации запроса Imagen 3 (пример 1)

  2. Задание: A modern logo for a software company on a solid color background. Include the text Silo .

    Пример параметризации запроса Imagen 3, пример 2.

  3. Задание: A traditional logo for a baking company on a solid color background. Include the text Seed .

    Пример параметризации запроса Imagen 3, пример 3.

Продвинутые методы написания заданий

Используйте следующие примеры для создания более конкретных запросов на основе таких атрибутов, как описание фотографии, формы и материалы, исторические направления в искусстве и модификаторы качества изображения.

Фотография

  • Задание включает в себя: «Фотография...»

Чтобы использовать этот стиль, начните с ключевых слов, которые четко указывают Imagen, что вы ищете фотографию. Начинайте свои запросы со слов «Фотография...» . Например:

фотореалистичное изображение-образец 1
Задание: Фотография кофейных зерен на деревянной поверхности на кухне.
фотореалистичное изображение-образец 2
Задание: Фотография шоколадного батончика на кухонном столе.
фотореалистичное изображение-образец 3
Задание: Фотография современного здания с водой на заднем плане.

Источник изображений: Каждое изображение было сгенерировано с использованием соответствующего текстового запроса с помощью модели Imagen 3.

Фотомодификаторы

В приведенных ниже примерах вы можете увидеть несколько модификаторов и параметров, специфичных для фотографии. Вы можете комбинировать несколько модификаторов для более точного управления.

  1. Съемка крупным планом, с большого расстояния.

    Пример изображения крупным планом с камеры
    Задание: Фотография кофейных зерен крупным планом.
    образец изображения с камеры, снятого с уменьшенным масштабом
    Задание: Фотография небольшого пакета, сделанная с большого расстояния .
    кофейные зерна на грязной кухне

  2. Ракурс камерывид сверху, снизу.

    образец аэрофотоснимка
    Задание: аэрофотоснимок городского пейзажа с небоскребами.
    образец изображения, вид снизу
    Задание: Фотография лесного полога на фоне голубого неба, сделанная снизу.
  3. Освещениеестественное, драматическое, тёплое, холодное

    образец изображения при естественном освещении
    Задание: студийная фотография современного кресла при естественном освещении.
    Образец изображения с эффектным освещением
    Задание: студийная фотография современного кресла, эффектное освещение.
  4. Настройки камеры - размытие в движении, мягкая фокусировка, боке, портрет.

    Образец изображения с эффектом размытия в движении
    Задание: фотография города с небоскребами, сделанная из салона автомобиля, с эффектом размытия движения.
    образец изображения с мягким фокусом
    Задание: фотография моста в ночном городском пейзаже с мягким фокусом .
  5. Типы объективов : 35 мм, 50 мм, «рыбий глаз», широкоугольный, макро.

    Пример изображения, полученного с помощью макрообъектива.
    Задание: фотография листа, макрообъектив
    образец изображения, полученного с помощью объектива «рыбий глаз».
    Задание: уличная фотография, Нью-Йорк, объектив «рыбий глаз».
  6. Типы плёнкичёрно-белая, полароидная

    Пример изображения фотографии Polaroid.
    Задание: полароидный портрет собаки в солнцезащитных очках.
    образец черно-белой фотографии
    Задание: черно-белая фотография собаки в солнцезащитных очках.

Источник изображений: Каждое изображение было сгенерировано с использованием соответствующего текстового запроса с помощью модели Imagen 3.

Иллюстрация и искусство

  • Задание включает в себя: « painting с изображением...» , « sketch с изображением...».

Художественные стили варьируются от монохромных, таких как карандашные наброски, до гиперреалистичного цифрового искусства. Например, следующие изображения используют одно и то же задание, но в разных стилях:

« [art style or creation technique] угловатого спортивного электроседана на фоне небоскребов»

примеры изображений произведений искусства
Задание: Технический эскиз угловатого... карандашом.
примеры изображений произведений искусства
Задание: Рисунок углем угловатого...
примеры изображений произведений искусства
Задание: Рисунок угловатого объекта, выполненный цветными карандашами ...
примеры изображений произведений искусства
Задание: Пастельная картина с угловатым изображением...
примеры изображений произведений искусства
Задание: Цифровое произведение искусства в угловатом стиле...
примеры изображений произведений искусства
Задание: Плакат в стиле ар-деко с угловатым изображением...

Источник изображений: Каждое изображение было сгенерировано с использованием соответствующего текстового запроса с помощью модели Imagen 2.

Формы и материалы
  • В задании используются слова: "...сделано из..." , "...в форме...".

Одно из преимуществ этой технологии заключается в возможности создания изображений, которые другими способами сложно или невозможно получить. Например, можно воссоздать логотип вашей компании, используя различные материалы и текстуры.

Пример изображений форм и материалов (см. рис. 1)
Задание: спортивная сумка из сыра
Пример изображений 2: формы и материалы.
Задание: неоновые трубки в форме птицы
Пример изображений форм и материалов (см. рис. 3)
Задание: кресло из бумаги , студийное фото, стиль оригами.

Источник изображений: Каждое изображение было сгенерировано с использованием соответствующего текстового запроса с помощью модели Imagen 3.

Исторические отсылки к искусству

  • Задание включает в себя: "...в стиле..."

Некоторые стили со временем стали культовыми. Ниже представлены несколько идей исторических стилей живописи или искусства, которые вы можете попробовать.

"Создать изображение в стиле [art period or movement] : ветряная электростанция"

пример изображения в стиле импрессионизма
Задание: создайте изображение в стиле импрессионистской живописи : ветряная электростанция.
пример изображения эпохи Возрождения
Задание: создайте изображение в стиле живописи эпохи Возрождения : ветряная электростанция.
пример изображения в стиле поп-арт
Задание: создайте изображение в стиле поп-арт : ветряная электростанция.

Источник изображений: Каждое изображение было сгенерировано с использованием соответствующего текстового запроса с помощью модели Imagen 3.

Модификаторы качества изображения

Определенные ключевые слова могут дать модели понять, что вы ищете высококачественный ресурс. Примеры модификаторов качества включают следующее:

  • Общие модификаторы - высококачественные, красивые, стилизованные
  • Фотографии - 4K, HDR, студийная фотосъемка
  • Искусство, иллюстрацияот профессионала, с вниманием к деталям.

Ниже приведены несколько примеров подсказок без уточнений качества и той же подсказки с уточнениями качества.

Пример изображения кукурузы без модификаторов
Задание (без уточнений качества): фотография кукурузного стебля.
Пример изображения кукурузы с модификаторами
Подсказка (с модификаторами качества): 4k HDR красиво
фотография кукурузного стебля , сделанная
профессиональный фотограф

Источник изображений: Каждое изображение было сгенерировано с использованием соответствующего текстового запроса с помощью модели Imagen 3.

Соотношение сторон

Функция генерации изображений позволяет задавать пять различных соотношений сторон изображения.

  1. Квадратное (1:1, по умолчанию) — стандартное квадратное фото. Часто такое соотношение сторон используется для публикаций в социальных сетях.
  2. Полноэкранный режим (4:3) — это соотношение сторон, широко используемое в медиа и кино. Оно также соответствует размерам большинства старых (не широкоэкранных) телевизоров и среднеформатных камер. Оно захватывает большую часть сцены по горизонтали (по сравнению с 1:1), что делает его предпочтительным соотношением сторон для фотографии.

    пример соотношения сторон
    Задание: крупный план пальцев музыканта, играющего на пианино, черно-белый фильм, винтажный (соотношение сторон 4:3).
    пример соотношения сторон
    Задание: Профессиональная студийная фотография картофеля фри для элитного ресторана в стиле кулинарного журнала (соотношение сторон 4:3).
  3. Портретный полноэкранный режим (3:4) — это полноэкранное соотношение сторон, повернутое на 90 градусов. Это позволяет захватывать большую часть сцены по вертикали по сравнению с соотношением сторон 1:1.

    пример соотношения сторон
    Задание: женщина, идущая в поход, отражение её ботинок в луже, на заднем плане высокие горы, в стиле рекламы, эффектные ракурсы (соотношение сторон 3:4).
    пример соотношения сторон
    Задание: аэрофотосъемка реки, текущей по мистической долине (соотношение сторон 3:4).
  4. Широкоэкранный формат (16:9) — это соотношение сторон, заменившее 4:3, и в настоящее время является наиболее распространенным для телевизоров, мониторов и экранов мобильных телефонов (альбомная ориентация). Используйте это соотношение сторон, когда хотите охватить большую часть фона (например, живописные пейзажи).

    пример соотношения сторон
    Задание: мужчина в белой одежде сидит на пляже, крупный план, освещение в «золотой час» (соотношение сторон 16:9).
  5. Портретный формат (9:16) — это широкоэкранный формат, но с поворотом. Это относительно новое соотношение сторон, получившее популярность благодаря приложениям для коротких видеороликов (например, YouTube Shorts). Используйте его для высоких объектов с выраженной вертикальной ориентацией, таких как здания, деревья, водопады или другие подобные объекты.

    пример соотношения сторон
    Задание: цифровая визуализация массивного небоскреба, современного, величественного, грандиозного, с прекрасным закатом на заднем плане (соотношение сторон 9:16).

Фотореалистичные изображения

Различные версии модели генерации изображений могут предлагать сочетание художественного и фотореалистичного результата. Используйте следующие формулировки в подсказках, чтобы получить более фотореалистичный результат в зависимости от желаемой тематики.

Вариант использования Тип линзы Фокусные расстояния Дополнительные сведения
Люди (портреты) Прайм, зум 24-35 мм Черно-белая пленка, фильм нуар, глубина резкости, двухцветная съемка (укажите два цвета)
Еда, насекомые, растения (предметы, натюрморты) Макро 60-105 мм Высокая детализация, точная фокусировка, контролируемое освещение.
Спорт, дикая природа (в движении) Телеобъектив с зумом 100-400 мм Короткая выдержка, отслеживание движения или действия
Астрономическая, пейзажная (широкоугольная) фотография Широкоугольный 10-24 мм Длительная выдержка, резкая фокусировка, длительная выдержка, гладкая вода или облака
Портреты
Вариант использования Тип линзы Фокусные расстояния Дополнительные сведения
Люди (портреты) Прайм, зум 24-35 мм Черно-белая пленка, фильм нуар, глубина резкости, двухцветная съемка (укажите два цвета)

Используя несколько ключевых слов из таблицы, Imagen может сгенерировать следующие портреты:

пример портретной фотографиипример портретной фотографиипример портретной фотографиипример портретной фотографии

Задание: Женщина, портрет, 35 мм, двухцветная сине-серая гамма.
Модель: imagen-3.0-generate-002

пример портретной фотографиипример портретной фотографиипример портретной фотографиипример портретной фотографии

Задание: Женщина, портрет, 35 мм, фильм нуар.
Модель: imagen-3.0-generate-002

Объекты
Вариант использования Тип линзы Фокусные расстояния Дополнительные сведения
Еда, насекомые, растения (предметы, натюрморты) Макро 60-105 мм Высокая детализация, точная фокусировка, контролируемое освещение.

Используя несколько ключевых слов из таблицы, Imagen может сгенерировать следующие изображения объектов:

пример предметной фотографиипример предметной фотографиипример предметной фотографиипример предметной фотографии

Задание: лист молитвенного растения, макрообъектив, 60 мм
Модель: imagen-3.0-generate-002

пример предметной фотографиипример предметной фотографиипример предметной фотографиипример предметной фотографии

Задание: тарелка пасты, макрообъектив 100 мм.
Модель: imagen-3.0-generate-002

Движение
Вариант использования Тип линзы Фокусные расстояния Дополнительные сведения
Спорт, дикая природа (в движении) Телеобъектив с зумом 100-400 мм Короткая выдержка, отслеживание движения или действия

Используя несколько ключевых слов из таблицы, Imagen может сгенерировать следующие видеоролики:

пример видеосъемкипример видеосъемкипример видеосъемкипример видеосъемки

Подсказка: победный тачдаун, быстрая выдержка, отслеживание движения.
Модель: imagen-3.0-generate-002

пример видеосъемкипример видеосъемкипример видеосъемкипример видеосъемки

Задание: Олень бежит в лесу, быстрая выдержка, слежение за движением.
Модель: imagen-3.0-generate-002

Широкоугольный
Вариант использования Тип линзы Фокусные расстояния Дополнительные сведения
Астрономическая, пейзажная (широкоугольная) фотография Широкоугольный 10-24 мм Длительная выдержка, резкая фокусировка, длительная выдержка, гладкая вода или облака

Используя несколько ключевых слов из таблицы, Imagen может сгенерировать следующие широкоугольные изображения:

пример широкоугольной фотографиипример широкоугольной фотографиипример широкоугольной фотографиипример широкоугольной фотографии

Подсказка: обширный горный хребет, пейзаж, широкоугольный объектив 10 мм.
Модель: imagen-3.0-generate-002

пример широкоугольной фотографиипример широкоугольной фотографиипример широкоугольной фотографиипример широкоугольной фотографии

Задание: фотография Луны, астрофотография, широкоугольный объектив 10 мм.
Модель: imagen-3.0-generate-002

Версии моделей

Изображение 4

Свойство Описание
Код модели

API Gemini

imagen-4.0-generate-001
imagen-4.0-ultra-generate-001
imagen-4.0-fast-generate-001

Поддерживаемые типы данных

Вход

Текст

Выход

Изображения

Ограничения на количество токенов [*]

Ограничение на количество введенных токенов

480 токенов (текст)

Выходные изображения

1–4 (Ультра/Стандарт/Быстрый)

Последнее обновление Июнь 2025 г.

Изображение 3

Свойство Описание
Код модели

API Gemini

imagen-3.0-generate-002

Поддерживаемые типы данных

Вход

Текст

Выход

Изображения

Ограничения на количество токенов [*]

Ограничение на количество введенных токенов

Н/Д

Выходные изображения

До 4

Последнее обновление Февраль 2025 г.