Эта страница переведена с помощью Cloud Translation API.

Генерация изображения

Вы можете генерировать изображения с помощью API Gemini либо со встроенными мультимодальными возможностями Gemini, либо с Imagen, специализированной моделью генерации изображений от Google. Для большинства случаев использования начните с Gemini . Выберите Imagen для специализированных задач, где качество изображения имеет решающее значение. Дополнительные рекомендации см. в разделе Выбор правильной модели .

Все сгенерированные изображения содержат водяной знак SynthID .

Прежде чем начать

Убедитесь, что вы используете поддерживаемую модель и версию для генерации изображения:

Для Gemini используйте Gemini 2.0 Flash Preview Image Generation.
Для Imagen используйте Imagen 3. Обратите внимание, что эта модель доступна только на платном уровне .

Вы можете получить доступ к Gemini и Imagen 3, используя одни и те же библиотеки.

Генерация изображений с помощью Gemini

Gemini может генерировать и обрабатывать изображения в разговорном режиме. Вы можете подсказывать Gemini текст, изображения или их комбинацию для выполнения различных задач, связанных с изображениями, таких как генерация и редактирование изображений.

Вы должны включить responseModalities : ["TEXT", "IMAGE"] в вашу конфигурацию. Вывод только изображений не поддерживается этими моделями.

Генерация изображений (текст-изображение)

Следующий код демонстрирует, как создать изображение на основе описательной подсказки:

Питон JavaScript Идти ОТДЫХ

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import base64

client = genai.Client()

contents = ('Hi, can you create a 3d rendered image of a pig '
            'with wings and a top hat flying over a happy '
            'futuristic scifi city with lots of greenery?')

response = client.models.generate_content(
    model="gemini-2.0-flash-preview-image-generation",
    contents=contents,
    config=types.GenerateContentConfig(
      response_modalities=['TEXT', 'IMAGE']
    )
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO((part.inline_data.data)))
    image.save('gemini-native-image.png')
    image.show()

import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  const contents =
    "Hi, can you create a 3d rendered image of a pig " +
    "with wings and a top hat flying over a happy " +
    "futuristic scifi city with lots of greenery?";

  // Set responseModalities to include "Image" so the model can generate  an image
  const response = await ai.models.generateContent({
    model: "gemini-2.0-flash-preview-image-generation",
    contents: contents,
    config: {
      responseModalities: [Modality.TEXT, Modality.IMAGE],
    },
  });
  for (const part of response.candidates[0].content.parts) {
    // Based on the part type, either show the text or save the image
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageData = part.inlineData.data;
      const buffer = Buffer.from(imageData, "base64");
      fs.writeFileSync("gemini-native-image.png", buffer);
      console.log("Image saved as gemini-native-image.png");
    }
  }
}

main();

package main

import (
  "context"
  "fmt"
  "os"
  "google.golang.org/genai"
)

func main() {

  ctx := context.Background()
  client, _ := genai.NewClient(ctx, &genai.ClientConfig{
      APIKey:  os.Getenv("GEMINI_API_KEY"),
      Backend: genai.BackendGeminiAPI,
  })

  config := &genai.GenerateContentConfig{
      ResponseModalities: []string{"TEXT", "IMAGE"},
  }

  result, _ := client.Models.GenerateContent(
      ctx,
      "gemini-2.0-flash-preview-image-generation",
      genai.Text("Hi, can you create a 3d rendered image of a pig " +
                 "with wings and a top hat flying over a happy " +
                 "futuristic scifi city with lots of greenery?"),
      config,
  )

  for _, part := range result.Candidates[0].Content.Parts {
      if part.Text != "" {
          fmt.Println(part.Text)
      } else if part.InlineData != nil {
          imageBytes := part.InlineData.Data
          outputFilename := "gemini_generated_image.png"
          _ = os.WriteFile(outputFilename, imageBytes, 0644)
      }
  }
}

curl -s -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-preview-image-generation:generateContent?key=$GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [
        {"text": "Hi, can you create a 3d rendered image of a pig with wings and a top hat flying over a happy futuristic scifi city with lots of greenery?"}
      ]
    }],
    "generationConfig":{"responseModalities":["TEXT","IMAGE"]}
  }' \
  | grep -o '"data": "[^"]*"' \
  | cut -d'"' -f4 \
  | base64 --decode > gemini-native-image.png

Изображение фантастической летающей свиньи, созданное искусственным интеллектом

Редактирование изображений (текст и изображение в изображение)

Чтобы выполнить редактирование изображения, добавьте изображение в качестве входных данных. Следующий пример демонстрирует загрузку изображений в кодировке base64. Для нескольких изображений и больших полезных нагрузок проверьте раздел ввода изображений .

Питон JavaScript Идти ОТДЫХ

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

import PIL.Image

image = PIL.Image.open('/path/to/image.png')

client = genai.Client()

text_input = ('Hi, This is a picture of me.'
            'Can you add a llama next to me?',)

response = client.models.generate_content(
    model="gemini-2.0-flash-preview-image-generation",
    contents=[text_input, image],
    config=types.GenerateContentConfig(
      response_modalities=['TEXT', 'IMAGE']
    )
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO(part.inline_data.data))
    image.show()

import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  // Load the image from the local file system
  const imagePath = "path/to/image.png";
  const imageData = fs.readFileSync(imagePath);
  const base64Image = imageData.toString("base64");

  // Prepare the content parts
  const contents = [
    { text: "Can you add a llama next to the image?" },
    {
      inlineData: {
        mimeType: "image/png",
        data: base64Image,
      },
    },
  ];

  // Set responseModalities to include "Image" so the model can generate an image
  const response = await ai.models.generateContent({
    model: "gemini-2.0-flash-preview-image-generation",
    contents: contents,
    config: {
      responseModalities: [Modality.TEXT, Modality.IMAGE],
    },
  });
  for (const part of response.candidates[0].content.parts) {
    // Based on the part type, either show the text or save the image
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageData = part.inlineData.data;
      const buffer = Buffer.from(imageData, "base64");
      fs.writeFileSync("gemini-native-image.png", buffer);
      console.log("Image saved as gemini-native-image.png");
    }
  }
}

main();

package main

import (
 "context"
 "fmt"
 "os"
 "google.golang.org/genai"
)

func main() {

 ctx := context.Background()
 client, _ := genai.NewClient(ctx, &genai.ClientConfig{
     APIKey:  os.Getenv("GEMINI_API_KEY"),
     Backend: genai.BackendGeminiAPI,
 })

 imagePath := "/path/to/image.png"
 imgData, _ := os.ReadFile(imagePath)

 parts := []*genai.Part{
   genai.NewPartFromText("Hi, This is a picture of me. Can you add a llama next to me?"),
   &genai.Part{
     InlineData: &genai.Blob{
       MIMEType: "image/png",
       Data:     imgData,
     },
   },
 }

 contents := []*genai.Content{
   genai.NewContentFromParts(parts, genai.RoleUser),
 }

 config := &genai.GenerateContentConfig{
     ResponseModalities: []string{"TEXT", "IMAGE"},
 }

 result, _ := client.Models.GenerateContent(
     ctx,
     "gemini-2.0-flash-preview-image-generation",
     contents,
     config,
 )

 for _, part := range result.Candidates[0].Content.Parts {
     if part.Text != "" {
         fmt.Println(part.Text)
     } else if part.InlineData != nil {
         imageBytes := part.InlineData.Data
         outputFilename := "gemini_generated_image.png"
         _ = os.WriteFile(outputFilename, imageBytes, 0644)
     }
 }
}

IMG_PATH=/path/to/your/image1.jpeg

if [[ "$(base64 --version 2>&1)" = *"FreeBSD"* ]]; then
  B64FLAGS="--input"
else
  B64FLAGS="-w0"
fi

IMG_BASE64=$(base64 "$B64FLAGS" "$IMG_PATH" 2>&1)

curl -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-preview-image-generation:generateContent?key=$GEMINI_API_KEY" \
    -H 'Content-Type: application/json' \
    -d "{
      \"contents\": [{
        \"parts\":[
            {\"text\": \"'Hi, This is a picture of me. Can you add a llama next to me\"},
            {
              \"inline_data\": {
                \"mime_type\":\"image/jpeg\",
                \"data\": \"$IMG_BASE64\"
              }
            }
        ]
      }],
      \"generationConfig\": {\"responseModalities\": [\"TEXT\", \"IMAGE\"]}
    }"  \
  | grep -o '"data": "[^"]*"' \
  | cut -d'"' -f4 \
  | base64 --decode > gemini-edited-image.png

Другие режимы генерации изображений

Gemini поддерживает другие режимы взаимодействия с изображениями на основе структуры подсказок и контекста, в том числе:

Текст с изображением(ями) и текстом (чередование): выводит изображения с соответствующим текстом.
- Пример подсказки: «Создайте иллюстрированный рецепт паэльи».
Изображение(я) и текст в изображение(я) и текст (чередование) : использует входные изображения и текст для создания новых связанных изображений и текста.
- Пример подсказки: (С изображением меблированной комнаты) «Какие еще цвета диванов подойдут для моего помещения? Можете ли вы обновить изображение?»
Многопоточное редактирование изображений (чат): продолжайте создавать/редактировать изображения в режиме диалога.
- Примеры подсказок: [загрузите изображение синего автомобиля.], «Превратите этот автомобиль в кабриолет.», «Теперь измените цвет на желтый».

Ограничения

Для лучшей производительности используйте следующие языки: EN, es-MX, ja-JP, zh-CN, hi-IN.
Генерация изображений не поддерживает аудио- и видеовходы.
Генерация изображения не всегда может вызвать:
- Модель может выводить только текст. Попробуйте явно запросить вывод изображений (например, «сгенерировать изображение», «предоставить изображения по мере продвижения», «обновить изображение»).
- Модель может перестать генерировать на полпути. Попробуйте еще раз или попробуйте другую подсказку.
При генерации текста для изображения Gemini работает лучше всего, если вы сначала генерируете текст, а затем запрашиваете изображение с текстом.
Есть некоторые регионы/страны, где генерация изображений недоступна. См. Модели для получения дополнительной информации.

Генерация изображений с помощью Imagen 3

В этом примере демонстрируется создание изображений с помощью Imagen 3 :

Питон JavaScript Идти ОТДЫХ

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client(api_key='GEMINI_API_KEY')

response = client.models.generate_images(
    model='imagen-3.0-generate-002',
    prompt='Robot holding a red skateboard',
    config=types.GenerateImagesConfig(
        number_of_images= 4,
    )
)
for generated_image in response.generated_images:
  image = Image.open(BytesIO(generated_image.image.image_bytes))
  image.show()

import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  const response = await ai.models.generateImages({
    model: 'imagen-3.0-generate-002',
    prompt: 'Robot holding a red skateboard',
    config: {
      numberOfImages: 4,
    },
  });

  let idx = 1;
  for (const generatedImage of response.generatedImages) {
    let imgBytes = generatedImage.image.imageBytes;
    const buffer = Buffer.from(imgBytes, "base64");
    fs.writeFileSync(`imagen-${idx}.png`, buffer);
    idx++;
  }
}

main();

package main

import (
  "context"
  "fmt"
  "os"
  "google.golang.org/genai"
)

func main() {

  ctx := context.Background()
  client, _ := genai.NewClient(ctx, &genai.ClientConfig{
      APIKey:  os.Getenv("GEMINI_API_KEY"),
      Backend: genai.BackendGeminiAPI,
  })

  config := &genai.GenerateImagesConfig{
      NumberOfImages: 4,
  }

  response, _ := client.Models.GenerateImages(
      ctx,
      "imagen-3.0-generate-002",
      "Robot holding a red skateboard",
      config,
  )

  for n, image := range response.GeneratedImages {
      fname := fmt.Sprintf("imagen-%d.png", n)
          _ = os.WriteFile(fname, image.Image.ImageBytes, 0644)
  }
}

curl -X POST \
    "https://generativelanguage.googleapis.com/v1beta/models/imagen-3.0-generate-002:predict?key=GEMINI_API_KEY" \
    -H "Content-Type: application/json" \
    -d '{
        "instances": [
          {
            "prompt": "Robot holding a red skateboard"
          }
        ],
        "parameters": {
          "sampleCount": 4
        }
      }'

Сгенерированное искусственным интеллектом изображение робота, держащего красный скейтборд

Параметры модели Imagen

В настоящее время Imagen поддерживает только подсказки на английском языке и следующие параметры:

numberOfImages : Количество изображений для генерации, от 1 до 4 (включительно). Значение по умолчанию — 4.
aspectRatio : Изменяет соотношение сторон сгенерированного изображения. Поддерживаемые значения: "1:1" , "3:4" , "4:3" , "9:16" и "16:9" . Значение по умолчанию: "1:1" .
personGeneration : Разрешить модели генерировать изображения людей. Поддерживаются следующие значения:
- "dont_allow" : Блокировать генерацию изображений людей.
- "allow_adult" : Генерировать изображения взрослых, но не детей. Это значение по умолчанию.
- "allow_all" : создание изображений, включающих взрослых и детей.
Примечание: значение параметра «allow_all» не допускается в странах ЕС, Великобритании, Швейцарии, Ближнего Востока и Северной Африки.

Выбор правильной модели

Выбирайте Близнецов, когда:

Вам нужны контекстно-релевантные изображения, которые задействуют знания и рассуждения о мире.
Важно обеспечить плавное сочетание текста и изображений.
Вам нужны точные визуальные эффекты, встроенные в длинные текстовые последовательности.
Вы хотите редактировать изображения в диалоговом режиме, сохраняя при этом контекст.

Выбирайте Imagen 3, когда:

Главными приоритетами являются качество изображения, фотореализм, художественная детализация или определенные стили (например, импрессионизм, аниме).
Выполнение специализированных задач по редактированию, таких как обновление фона продукта или масштабирование изображений.
Внедрение брендинга, стиля или создание логотипов и дизайнов продукции.

Руководство по подсказкам Imagen

В этом разделе руководства Imagen показано, как изменение запроса на преобразование текста в изображение может привести к различным результатам, а также приведены примеры изображений, которые вы можете создать.

Основы письма в режиме онлайн

Хорошее предложение является описательным и ясным, и использует значимые ключевые слова и модификаторы. Начните с размышлений о предмете , контексте и стиле .

Подсказка с акцентом на тему, контекст и стиль — Текст изображения: *Эскиз* ( **стиль** ) *современного многоквартирного дома* ( **предмет** ), окруженного *небоскребами* ( **контекст и фон** ).

Тема : Первое, о чем следует подумать при создании любой подсказки, — это тема : объект, человек, животное или пейзаж, изображение которого вы хотите получить.
Контекст и фон: Не менее важен фон или контекст , в котором будет размещен объект. Попробуйте разместить объект на разных фонах. Например, студия с белым фоном, на открытом воздухе или в помещении.
Стиль: Наконец, добавьте желаемый стиль изображения. Стили могут быть общими (живопись, фотография, эскизы) или очень конкретными (живопись пастелью, рисунок углем, изометрическое 3D). Вы также можете комбинировать стили.

После того, как вы напишете первую версию вашего запроса, усовершенствуйте его, добавляя больше деталей, пока не получите желаемое изображение. Итерация важна. Начните с определения вашей основной идеи, а затем усовершенствуйте и расширьте эту основную идею, пока сгенерированное изображение не будет близко к вашему видению.

фотореалистичное изображение образца 1 — Подсказка: Парк весной рядом с озером.

фотореалистичное изображение образца 2 — Подсказка: Весенний парк рядом с озером, **солнце садится за озером, золотой час.**

фотореалистичное изображение образца 3 — Подсказка: Весенний парк рядом с озером, **солнце садится за озером, золотой час, красные полевые цветы.**

Imagen 3 может преобразовать ваши идеи в подробные изображения, независимо от того, короткие ли у вас подсказки или длинные и подробные. Уточняйте свое видение с помощью итеративных подсказок, добавляя детали, пока не достигнете идеального результата.

Короткие подсказки позволят вам быстро создать изображение.

Пример краткой подсказки Imagen 3 — Подсказка: фотография крупным планом женщины в возрасте 20 лет, уличная фотография, кадр из фильма, приглушенные оранжевые теплые тона.

Более длинные подсказки позволяют вам добавлять конкретные детали и создавать свой образ.

Пример длинной подсказки Imagen 3 — Подсказка: захватывающее фото женщины в возрасте 20 лет в стиле уличной фотографии. Изображение должно выглядеть как кадр из фильма с приглушенными оранжевыми теплыми тонами.

Дополнительные советы по написанию подсказок Imagen:

Используйте описательный язык : используйте подробные прилагательные и наречия, чтобы нарисовать ясную картину для Imagen 3.
Предоставьте контекст : при необходимости включите справочную информацию, которая поможет ИИ понять ситуацию.
Ссылайтесь на конкретных художников или стили : если вы придерживаетесь определенной эстетики, ссылки на конкретных художников или художественные течения могут быть полезны.
Используйте инструменты проектирования подсказок : рассмотрите возможность изучения инструментов или ресурсов проектирования подсказок, которые помогут вам усовершенствовать подсказки и достичь оптимальных результатов.
Улучшение деталей лица на личных и групповых снимках : укажите детали лица в качестве фокуса фотографии (например, используйте слово «портрет» в подсказке).

Генерация текста на изображениях

Imagen может добавлять текст в изображения, открывая более творческие возможности создания изображений. Используйте следующие рекомендации, чтобы максимально использовать эту функцию:

Повторяйте с уверенностью : вам, возможно, придется перегенерировать изображения, пока вы не достигнете желаемого вида. Интеграция текста в Imagen все еще развивается, и иногда несколько попыток дают наилучшие результаты.
Сокращайте текст: для оптимальной генерации ограничьте его длиной не более 25 символов.
Несколько фраз : Экспериментируйте с двумя или тремя отдельными фразами, чтобы предоставить дополнительную информацию. Избегайте использования более трех фраз для более чистых композиций.
Подсказка: Плакат с текстом «Summerland» жирным шрифтом в качестве заголовка, под этим текстом находится слоган «Лето никогда не было таким прекрасным».
Размещение руководства : хотя Imagen может попытаться расположить текст в соответствии с указаниями, ожидайте случайных изменений. Эта функция постоянно совершенствуется.
Вдохновляйте стиль шрифта : укажите общий стиль шрифта, чтобы тонко повлиять на выбор Imagen. Не полагайтесь на точное копирование шрифта, но ожидайте творческих интерпретаций.
Размер шрифта : укажите размер шрифта или общее указание размера (например, маленький , средний , большой ), чтобы повлиять на генерацию размера шрифта.

Быстрая параметризация

Для лучшего контроля результатов вывода вам может быть полезно параметризовать входные данные в Imagen. Например, предположим, что вы хотите, чтобы ваши клиенты могли генерировать логотипы для своего бизнеса, и вы хотите убедиться, что логотипы всегда генерируются на сплошном цветном фоне. Вы также хотите ограничить опции, которые клиент может выбрать из меню.

В этом примере вы можете создать параметризованное приглашение, подобное следующему:

A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.

В вашем пользовательском интерфейсе клиент может вводить параметры с помощью меню, а выбранное им значение заполняет подсказку, которую получает Imagen.

Например:

Подсказка: A minimalist logo for a health care company on a solid color background. Include the text Journey .
Подсказка: A modern logo for a software company on a solid color background. Include the text Silo .
Подсказка: A traditional logo for a baking company on a solid color background. Include the text Seed .

Продвинутые методы письма в сжатом виде

Используйте следующие примеры для создания более конкретных подсказок на основе таких атрибутов, как описания фотографий, формы и материалы, исторические направления в искусстве и модификаторы качества изображения.

Фотография

Подсказка включает: «Фотография...»

Чтобы использовать этот стиль, начните с ключевых слов, которые четко сообщат Imagen, что вы ищете фотографию. Начните свои подсказки с "Фото..." . Например:

^{Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 3.}

Модификаторы фотографии

В следующих примерах вы можете увидеть несколько модификаторов и параметров, специфичных для фотографии. Вы можете комбинировать несколько модификаторов для более точного управления.

Приближение камеры — крупный план, снято издалека

пример изображения с камеры крупным планом — Подсказка: фотография кофейных зерен **крупным планом.**

увеличенное изображение образца камеры — Подсказка: **Уменьшенное** фото небольшого пакета
кофейные зерна на грязной кухне

Положение камеры - вид сверху, снизу
Подсказка: аэрофотоснимок города с небоскребами
Подсказка: Фотография полога леса с голубым небом снизу.

Освещение - естественное, драматическое, теплое, холодное

образец изображения естественного освещения — Подсказка: студийное фото современного кресла, **естественное освещение.**

Образец изображения драматического освещения — Подсказка: студийное фото современного кресла, **эффектное освещение.**

Настройки камеры — размытие движения, мягкий фокус, боке, портрет

пример изображения размытия движения — Подсказка: фотография города с небоскребами из салона автомобиля с **размытием движения**

образец изображения с мягким фокусом — Подсказка: фотография моста в городе ночью **с мягким фокусом.**

Типы объективов - 35 мм, 50 мм, «рыбий глаз», широкоугольный, макро
Подсказка: фотография листа, макрообъектив
Подсказка: уличная фотография, Нью-Йорк, объектив «рыбий глаз»

Типы пленки - черно-белая, поляроид

образец фотографии Polaroid — Подсказка: **полароидный портрет** собаки в солнцезащитных очках.

черно-белое фото образец изображения — Подсказка: **черно-белое фото** собаки в солнцезащитных очках.

Иллюстрация и искусство

В подсказку включены: « painting с изображением...» , « sketch ...».

Художественные стили варьируются от монохромных стилей, таких как карандашные наброски, до гиперреалистичного цифрового искусства. Например, следующие изображения используют одну и ту же подсказку с разными стилями:

« [art style or creation technique] угловатого спортивного электрического седана на фоне небоскребов»

образцы художественных изображений — Подсказка: **Технический карандашный рисунок** угловатого...

^{Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 2.}

Формы и материалы

Подсказка включает: «...изготовлен из...» , «...в форме...»

Одной из сильных сторон этой технологии является то, что вы можете создавать изображения, которые в противном случае было бы трудно или невозможно создать. Например, вы можете воссоздать логотип своей компании в разных материалах и текстурах.

Пример формы и материала изображение 1 — Подсказка: дорожная сумка из сыра.

Пример формы и материала изображение 2 — Подсказка: неоновые трубки **в форме** птицы

Пример формы и материала изображение 3 — Подсказка: кресло **из бумаги** , студийное фото, стиль оригами

Исторические ссылки на искусство

Подсказка включает: «...в стиле...»

Определенные стили стали культовыми на протяжении многих лет. Ниже приведены некоторые идеи исторической живописи или художественных стилей, которые вы можете попробовать.

"создать изображение в стиле [art period or movement] : ветряная электростанция"

импрессионизм пример изображения — Подсказка: создать изображение в стиле *импрессионистской картины* : ветряная электростанция.

пример изображения эпохи возрождения — Подсказка: создать изображение в стиле *живописи эпохи Возрождения* : ветряная электростанция.

поп-арт пример изображения — Подсказка: сгенерировать изображение в стиле *поп-арт* : ветряная электростанция

Модификаторы качества изображения

Определенные ключевые слова могут дать модели понять, что вы ищете высококачественный актив. Примеры модификаторов качества включают следующее:

Общие модификаторы - качественные, красивые, стилизованные
Фото - 4K, HDR, студийное фото
Искусство, Иллюстрация - профессиональная, подробная

Ниже приведены несколько примеров подсказок без модификаторов качества и тех же подсказок с модификаторами качества.

пример изображения кукурузы без модификаторов — Подсказка (без модификаторов качества): фотография стебля кукурузы

пример изображения кукурузы с модификаторами — Подсказка (с модификаторами качества): **4k HDR прекрасно**
фотография стебля кукурузы , сделанная
профессиональный фотограф

Соотношения сторон

Генератор изображений Imagen 3 позволяет вам задать пять различных соотношений сторон изображения.

Квадрат (1:1, по умолчанию) — стандартное квадратное фото. Обычное использование этого соотношения сторон включает публикации в социальных сетях.

Полный экран (4:3) — это соотношение сторон обычно используется в медиа или кино. Это также размеры большинства старых (не широкоэкранных) телевизоров и среднеформатных камер. Оно захватывает большую часть сцены по горизонтали (по сравнению с 1:1), что делает его предпочтительным соотношением сторон для фотографии.

пример соотношения сторон — Подсказка: крупный план пальцев музыканта, играющего на пианино, черно-белая пленка, винтаж (соотношение сторон 4:3)

Портретный полноэкранный (3:4) — это полноэкранное соотношение сторон, повернутое на 90 градусов. Это позволяет захватить больше сцены по вертикали по сравнению с соотношением сторон 1:1.

Широкоэкранный (16:9) — это соотношение заменило 4:3 и теперь является наиболее распространенным соотношением сторон для телевизоров, мониторов и экранов мобильных телефонов (альбомная ориентация). Используйте это соотношение сторон, когда хотите захватить больше фона (например, живописные пейзажи).
Подсказка: мужчина в белой одежде сидит на пляже, крупный план, освещение «золотого часа» (соотношение сторон 16:9)
Портрет (9:16) — это широкоэкранное соотношение, но повернутое. Это относительно новое соотношение сторон, которое стало популярным благодаря приложениям для коротких видео (например, YouTube shorts). Используйте его для высоких объектов с четкой вертикальной ориентацией, таких как здания, деревья, водопады или другие подобные объекты.
Подсказка: цифровая визуализация огромного небоскреба, современного, грандиозного, эпического с красивым закатом на заднем плане (соотношение сторон 9:16)

Фотореалистичные изображения

Различные версии модели генерации изображений могут предлагать смесь художественного и фотореалистичного вывода. Используйте следующую формулировку в подсказках для создания более фотореалистичного вывода, основанного на объекте, который вы хотите создать.

Вариант использования	Тип линзы	Фокусные расстояния	Дополнительные подробности
Люди (портреты)	Prime, зум	24-35мм	черно-белая пленка, фильм нуар, глубина резкости, дуотон (укажите два цвета)
Еда, насекомые, растения (предметы, натюрморт)	Макро	60-105мм	Высокая детализация, точная фокусировка, контролируемое освещение
Спорт, дикая природа (движение)	Телефото зум	100-400мм	Короткая выдержка, отслеживание действий или движения
Астрономический, пейзажный (широкоугольный)	Широкоугольный	10-24мм	Длительное время экспозиции, четкий фокус, длительная выдержка, гладкая вода или облака

Портреты

Вариант использования	Тип линзы	Фокусные расстояния	Дополнительные подробности
Люди (портреты)	Prime, зум	24-35мм	черно-белая пленка, фильм нуар, глубина резкости, дуотон (укажите два цвета)

Используя несколько ключевых слов из таблицы, Imagen может сгенерировать следующие портреты:

Подсказка: Женщина, портрет, 35 мм, синие и серые дуотона.
Модель: imagen-3.0-generate-002

Подсказка: Женщина, 35-мм портрет, фильм-нуар
Модель: imagen-3.0-generate-002

Объекты

Вариант использования	Тип линзы	Фокусные расстояния	Дополнительные подробности
Еда, насекомые, растения (предметы, натюрморт)	Макро	60-105мм	Высокая детализация, точная фокусировка, контролируемое освещение

Используя несколько ключевых слов из таблицы, Imagen может генерировать следующие изображения объектов:

Подсказка: лист молитвенного растения, макрообъектив, 60 мм.
Модель: imagen-3.0-generate-002

Подсказка: тарелка пасты, макрообъектив 100 мм.
Модель: imagen-3.0-generate-002

Движение

Вариант использования	Тип линзы	Фокусные расстояния	Дополнительные подробности
Спорт, дикая природа (движение)	Телефото зум	100-400мм	Короткая выдержка, отслеживание действий или движения

Используя несколько ключевых слов из таблицы, Imagen может генерировать следующие движущиеся изображения:

Подсказка: победный тачдаун, быстрая выдержка, отслеживание движения
Модель: imagen-3.0-generate-002

Подсказка: Олень бежит по лесу, короткая выдержка, отслеживание движения.
Модель: imagen-3.0-generate-002

Широкоугольный

Вариант использования	Тип линзы	Фокусные расстояния	Дополнительные подробности
Астрономический, пейзажный (широкоугольный)	Широкоугольный	10-24мм	Длительное время экспозиции, четкий фокус, длительная выдержка, гладкая вода или облака

Используя несколько ключевых слов из таблицы, Imagen может генерировать следующие широкоугольные изображения:

Подсказка: обширный горный хребет, пейзаж, широкоугольный объектив 10 мм
Модель: imagen-3.0-generate-002

Подсказка: фотография Луны, астрофотография, широкоугольный объектив 10 мм.
Модель: imagen-3.0-generate-002

Что дальше?

Ознакомьтесь с руководством Veo , чтобы узнать, как создавать видео с помощью API Gemini.
Дополнительную информацию о моделях Gemini 2.0 см. в разделах Модели Gemini и Экспериментальные модели .