Вы можете генерировать изображения с помощью API Gemini либо со встроенными мультимодальными возможностями Gemini, либо с Imagen, специализированной моделью генерации изображений от Google. Для большинства случаев использования начните с Gemini . Выберите Imagen для специализированных задач, где качество изображения имеет решающее значение. Дополнительные рекомендации см. в разделе Выбор правильной модели .
Все сгенерированные изображения содержат водяной знак SynthID .
Прежде чем начать
Убедитесь, что вы используете поддерживаемую модель и версию для генерации изображения:
Для Gemini используйте Gemini 2.0 Flash Preview Image Generation.
Для Imagen используйте Imagen 3. Обратите внимание, что эта модель доступна только на платном уровне .
Вы можете получить доступ к Gemini и Imagen 3, используя одни и те же библиотеки.
Генерация изображений с помощью Gemini
Gemini может генерировать и обрабатывать изображения в разговорном режиме. Вы можете подсказывать Gemini текст, изображения или их комбинацию для выполнения различных задач, связанных с изображениями, таких как генерация и редактирование изображений.
Вы должны включить responseModalities
: ["TEXT", "IMAGE"]
в вашу конфигурацию. Вывод только изображений не поддерживается этими моделями.
Генерация изображений (текст-изображение)
Следующий код демонстрирует, как создать изображение на основе описательной подсказки:
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import base64
client = genai.Client()
contents = ('Hi, can you create a 3d rendered image of a pig '
'with wings and a top hat flying over a happy '
'futuristic scifi city with lots of greenery?')
response = client.models.generate_content(
model="gemini-2.0-flash-preview-image-generation",
contents=contents,
config=types.GenerateContentConfig(
response_modalities=['TEXT', 'IMAGE']
)
)
for part in response.candidates[0].content.parts:
if part.text is not None:
print(part.text)
elif part.inline_data is not None:
image = Image.open(BytesIO((part.inline_data.data)))
image.save('gemini-native-image.png')
image.show()
import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";
async function main() {
const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });
const contents =
"Hi, can you create a 3d rendered image of a pig " +
"with wings and a top hat flying over a happy " +
"futuristic scifi city with lots of greenery?";
// Set responseModalities to include "Image" so the model can generate an image
const response = await ai.models.generateContent({
model: "gemini-2.0-flash-preview-image-generation",
contents: contents,
config: {
responseModalities: [Modality.TEXT, Modality.IMAGE],
},
});
for (const part of response.candidates[0].content.parts) {
// Based on the part type, either show the text or save the image
if (part.text) {
console.log(part.text);
} else if (part.inlineData) {
const imageData = part.inlineData.data;
const buffer = Buffer.from(imageData, "base64");
fs.writeFileSync("gemini-native-image.png", buffer);
console.log("Image saved as gemini-native-image.png");
}
}
}
main();
package main
import (
"context"
"fmt"
"os"
"google.golang.org/genai"
)
func main() {
ctx := context.Background()
client, _ := genai.NewClient(ctx, &genai.ClientConfig{
APIKey: os.Getenv("GEMINI_API_KEY"),
Backend: genai.BackendGeminiAPI,
})
config := &genai.GenerateContentConfig{
ResponseModalities: []string{"TEXT", "IMAGE"},
}
result, _ := client.Models.GenerateContent(
ctx,
"gemini-2.0-flash-preview-image-generation",
genai.Text("Hi, can you create a 3d rendered image of a pig " +
"with wings and a top hat flying over a happy " +
"futuristic scifi city with lots of greenery?"),
config,
)
for _, part := range result.Candidates[0].Content.Parts {
if part.Text != "" {
fmt.Println(part.Text)
} else if part.InlineData != nil {
imageBytes := part.InlineData.Data
outputFilename := "gemini_generated_image.png"
_ = os.WriteFile(outputFilename, imageBytes, 0644)
}
}
}
curl -s -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-preview-image-generation:generateContent?key=$GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"contents": [{
"parts": [
{"text": "Hi, can you create a 3d rendered image of a pig with wings and a top hat flying over a happy futuristic scifi city with lots of greenery?"}
]
}],
"generationConfig":{"responseModalities":["TEXT","IMAGE"]}
}' \
| grep -o '"data": "[^"]*"' \
| cut -d'"' -f4 \
| base64 --decode > gemini-native-image.png

Редактирование изображений (текст и изображение в изображение)
Чтобы выполнить редактирование изображения, добавьте изображение в качестве входных данных. Следующий пример демонстрирует загрузку изображений в кодировке base64. Для нескольких изображений и больших полезных нагрузок проверьте раздел ввода изображений .
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import PIL.Image
image = PIL.Image.open('/path/to/image.png')
client = genai.Client()
text_input = ('Hi, This is a picture of me.'
'Can you add a llama next to me?',)
response = client.models.generate_content(
model="gemini-2.0-flash-preview-image-generation",
contents=[text_input, image],
config=types.GenerateContentConfig(
response_modalities=['TEXT', 'IMAGE']
)
)
for part in response.candidates[0].content.parts:
if part.text is not None:
print(part.text)
elif part.inline_data is not None:
image = Image.open(BytesIO(part.inline_data.data))
image.show()
import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";
async function main() {
const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });
// Load the image from the local file system
const imagePath = "path/to/image.png";
const imageData = fs.readFileSync(imagePath);
const base64Image = imageData.toString("base64");
// Prepare the content parts
const contents = [
{ text: "Can you add a llama next to the image?" },
{
inlineData: {
mimeType: "image/png",
data: base64Image,
},
},
];
// Set responseModalities to include "Image" so the model can generate an image
const response = await ai.models.generateContent({
model: "gemini-2.0-flash-preview-image-generation",
contents: contents,
config: {
responseModalities: [Modality.TEXT, Modality.IMAGE],
},
});
for (const part of response.candidates[0].content.parts) {
// Based on the part type, either show the text or save the image
if (part.text) {
console.log(part.text);
} else if (part.inlineData) {
const imageData = part.inlineData.data;
const buffer = Buffer.from(imageData, "base64");
fs.writeFileSync("gemini-native-image.png", buffer);
console.log("Image saved as gemini-native-image.png");
}
}
}
main();
package main
import (
"context"
"fmt"
"os"
"google.golang.org/genai"
)
func main() {
ctx := context.Background()
client, _ := genai.NewClient(ctx, &genai.ClientConfig{
APIKey: os.Getenv("GEMINI_API_KEY"),
Backend: genai.BackendGeminiAPI,
})
imagePath := "/path/to/image.png"
imgData, _ := os.ReadFile(imagePath)
parts := []*genai.Part{
genai.NewPartFromText("Hi, This is a picture of me. Can you add a llama next to me?"),
&genai.Part{
InlineData: &genai.Blob{
MIMEType: "image/png",
Data: imgData,
},
},
}
contents := []*genai.Content{
genai.NewContentFromParts(parts, genai.RoleUser),
}
config := &genai.GenerateContentConfig{
ResponseModalities: []string{"TEXT", "IMAGE"},
}
result, _ := client.Models.GenerateContent(
ctx,
"gemini-2.0-flash-preview-image-generation",
contents,
config,
)
for _, part := range result.Candidates[0].Content.Parts {
if part.Text != "" {
fmt.Println(part.Text)
} else if part.InlineData != nil {
imageBytes := part.InlineData.Data
outputFilename := "gemini_generated_image.png"
_ = os.WriteFile(outputFilename, imageBytes, 0644)
}
}
}
IMG_PATH=/path/to/your/image1.jpeg
if [[ "$(base64 --version 2>&1)" = *"FreeBSD"* ]]; then
B64FLAGS="--input"
else
B64FLAGS="-w0"
fi
IMG_BASE64=$(base64 "$B64FLAGS" "$IMG_PATH" 2>&1)
curl -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-preview-image-generation:generateContent?key=$GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d "{
\"contents\": [{
\"parts\":[
{\"text\": \"'Hi, This is a picture of me. Can you add a llama next to me\"},
{
\"inline_data\": {
\"mime_type\":\"image/jpeg\",
\"data\": \"$IMG_BASE64\"
}
}
]
}],
\"generationConfig\": {\"responseModalities\": [\"TEXT\", \"IMAGE\"]}
}" \
| grep -o '"data": "[^"]*"' \
| cut -d'"' -f4 \
| base64 --decode > gemini-edited-image.png
Другие режимы генерации изображений
Gemini поддерживает другие режимы взаимодействия с изображениями на основе структуры подсказок и контекста, в том числе:
- Текст с изображением(ями) и текстом (чередование): выводит изображения с соответствующим текстом.
- Пример подсказки: «Создайте иллюстрированный рецепт паэльи».
- Изображение(я) и текст в изображение(я) и текст (чередование) : использует входные изображения и текст для создания новых связанных изображений и текста.
- Пример подсказки: (С изображением меблированной комнаты) «Какие еще цвета диванов подойдут для моего помещения? Можете ли вы обновить изображение?»
- Многопоточное редактирование изображений (чат): продолжайте создавать/редактировать изображения в режиме диалога.
- Примеры подсказок: [загрузите изображение синего автомобиля.], «Превратите этот автомобиль в кабриолет.», «Теперь измените цвет на желтый».
Ограничения
- Для лучшей производительности используйте следующие языки: EN, es-MX, ja-JP, zh-CN, hi-IN.
- Генерация изображений не поддерживает аудио- и видеовходы.
- Генерация изображения не всегда может вызвать:
- Модель может выводить только текст. Попробуйте явно запросить вывод изображений (например, «сгенерировать изображение», «предоставить изображения по мере продвижения», «обновить изображение»).
- Модель может перестать генерировать на полпути. Попробуйте еще раз или попробуйте другую подсказку.
- При генерации текста для изображения Gemini работает лучше всего, если вы сначала генерируете текст, а затем запрашиваете изображение с текстом.
- Есть некоторые регионы/страны, где генерация изображений недоступна. См. Модели для получения дополнительной информации.
Генерация изображений с помощью Imagen 3
В этом примере демонстрируется создание изображений с помощью Imagen 3 :
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
client = genai.Client(api_key='GEMINI_API_KEY')
response = client.models.generate_images(
model='imagen-3.0-generate-002',
prompt='Robot holding a red skateboard',
config=types.GenerateImagesConfig(
number_of_images= 4,
)
)
for generated_image in response.generated_images:
image = Image.open(BytesIO(generated_image.image.image_bytes))
image.show()
import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";
async function main() {
const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });
const response = await ai.models.generateImages({
model: 'imagen-3.0-generate-002',
prompt: 'Robot holding a red skateboard',
config: {
numberOfImages: 4,
},
});
let idx = 1;
for (const generatedImage of response.generatedImages) {
let imgBytes = generatedImage.image.imageBytes;
const buffer = Buffer.from(imgBytes, "base64");
fs.writeFileSync(`imagen-${idx}.png`, buffer);
idx++;
}
}
main();
package main
import (
"context"
"fmt"
"os"
"google.golang.org/genai"
)
func main() {
ctx := context.Background()
client, _ := genai.NewClient(ctx, &genai.ClientConfig{
APIKey: os.Getenv("GEMINI_API_KEY"),
Backend: genai.BackendGeminiAPI,
})
config := &genai.GenerateImagesConfig{
NumberOfImages: 4,
}
response, _ := client.Models.GenerateImages(
ctx,
"imagen-3.0-generate-002",
"Robot holding a red skateboard",
config,
)
for n, image := range response.GeneratedImages {
fname := fmt.Sprintf("imagen-%d.png", n)
_ = os.WriteFile(fname, image.Image.ImageBytes, 0644)
}
}
curl -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/imagen-3.0-generate-002:predict?key=GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"instances": [
{
"prompt": "Robot holding a red skateboard"
}
],
"parameters": {
"sampleCount": 4
}
}'

Параметры модели Imagen
В настоящее время Imagen поддерживает только подсказки на английском языке и следующие параметры:
-
numberOfImages
: Количество изображений для генерации, от 1 до 4 (включительно). Значение по умолчанию — 4. -
aspectRatio
: Изменяет соотношение сторон сгенерированного изображения. Поддерживаемые значения:"1:1"
,"3:4"
,"4:3"
,"9:16"
и"16:9"
. Значение по умолчанию:"1:1"
. personGeneration
: Разрешить модели генерировать изображения людей. Поддерживаются следующие значения:-
"dont_allow"
: Блокировать генерацию изображений людей. -
"allow_adult"
: Генерировать изображения взрослых, но не детей. Это значение по умолчанию. -
"allow_all"
: создание изображений, включающих взрослых и детей.
-
Выбор правильной модели
Выбирайте Близнецов, когда:
- Вам нужны контекстно-релевантные изображения, которые задействуют знания и рассуждения о мире.
- Важно обеспечить плавное сочетание текста и изображений.
- Вам нужны точные визуальные эффекты, встроенные в длинные текстовые последовательности.
- Вы хотите редактировать изображения в диалоговом режиме, сохраняя при этом контекст.
Выбирайте Imagen 3, когда:
- Главными приоритетами являются качество изображения, фотореализм, художественная детализация или определенные стили (например, импрессионизм, аниме).
- Выполнение специализированных задач по редактированию, таких как обновление фона продукта или масштабирование изображений.
- Внедрение брендинга, стиля или создание логотипов и дизайнов продукции.
Руководство по подсказкам Imagen
В этом разделе руководства Imagen показано, как изменение запроса на преобразование текста в изображение может привести к различным результатам, а также приведены примеры изображений, которые вы можете создать.
Основы письма в режиме онлайн
Хорошее предложение является описательным и ясным, и использует значимые ключевые слова и модификаторы. Начните с размышлений о предмете , контексте и стиле .

Тема : Первое, о чем следует подумать при создании любой подсказки, — это тема : объект, человек, животное или пейзаж, изображение которого вы хотите получить.
Контекст и фон: Не менее важен фон или контекст , в котором будет размещен объект. Попробуйте разместить объект на разных фонах. Например, студия с белым фоном, на открытом воздухе или в помещении.
Стиль: Наконец, добавьте желаемый стиль изображения. Стили могут быть общими (живопись, фотография, эскизы) или очень конкретными (живопись пастелью, рисунок углем, изометрическое 3D). Вы также можете комбинировать стили.
После того, как вы напишете первую версию вашего запроса, усовершенствуйте его, добавляя больше деталей, пока не получите желаемое изображение. Итерация важна. Начните с определения вашей основной идеи, а затем усовершенствуйте и расширьте эту основную идею, пока сгенерированное изображение не будет близко к вашему видению.
![]() | ![]() | ![]() |
Imagen 3 может преобразовать ваши идеи в подробные изображения, независимо от того, короткие ли у вас подсказки или длинные и подробные. Уточняйте свое видение с помощью итеративных подсказок, добавляя детали, пока не достигнете идеального результата.
Короткие подсказки позволят вам быстро создать изображение. ![]() | Более длинные подсказки позволяют вам добавлять конкретные детали и создавать свой образ. ![]() |
Дополнительные советы по написанию подсказок Imagen:
- Используйте описательный язык : используйте подробные прилагательные и наречия, чтобы нарисовать ясную картину для Imagen 3.
- Предоставьте контекст : при необходимости включите справочную информацию, которая поможет ИИ понять ситуацию.
- Ссылайтесь на конкретных художников или стили : если вы придерживаетесь определенной эстетики, ссылки на конкретных художников или художественные течения могут быть полезны.
- Используйте инструменты проектирования подсказок : рассмотрите возможность изучения инструментов или ресурсов проектирования подсказок, которые помогут вам усовершенствовать подсказки и достичь оптимальных результатов.
- Улучшение деталей лица на личных и групповых снимках : укажите детали лица в качестве фокуса фотографии (например, используйте слово «портрет» в подсказке).
Генерация текста на изображениях
Imagen может добавлять текст в изображения, открывая более творческие возможности создания изображений. Используйте следующие рекомендации, чтобы максимально использовать эту функцию:
- Повторяйте с уверенностью : вам, возможно, придется перегенерировать изображения, пока вы не достигнете желаемого вида. Интеграция текста в Imagen все еще развивается, и иногда несколько попыток дают наилучшие результаты.
- Сокращайте текст: для оптимальной генерации ограничьте его длиной не более 25 символов.
Несколько фраз : Экспериментируйте с двумя или тремя отдельными фразами, чтобы предоставить дополнительную информацию. Избегайте использования более трех фраз для более чистых композиций.
Подсказка: Плакат с текстом «Summerland» жирным шрифтом в качестве заголовка, под этим текстом находится слоган «Лето никогда не было таким прекрасным». Размещение руководства : хотя Imagen может попытаться расположить текст в соответствии с указаниями, ожидайте случайных изменений. Эта функция постоянно совершенствуется.
Вдохновляйте стиль шрифта : укажите общий стиль шрифта, чтобы тонко повлиять на выбор Imagen. Не полагайтесь на точное копирование шрифта, но ожидайте творческих интерпретаций.
Размер шрифта : укажите размер шрифта или общее указание размера (например, маленький , средний , большой ), чтобы повлиять на генерацию размера шрифта.
Быстрая параметризация
Для лучшего контроля результатов вывода вам может быть полезно параметризовать входные данные в Imagen. Например, предположим, что вы хотите, чтобы ваши клиенты могли генерировать логотипы для своего бизнеса, и вы хотите убедиться, что логотипы всегда генерируются на сплошном цветном фоне. Вы также хотите ограничить опции, которые клиент может выбрать из меню.
В этом примере вы можете создать параметризованное приглашение, подобное следующему:
A{logo_style} logo for a{company_area} company on a solid color background. Include the text{company_name} .
В вашем пользовательском интерфейсе клиент может вводить параметры с помощью меню, а выбранное им значение заполняет подсказку, которую получает Imagen.
Например:
Подсказка:
A minimalist logo for a health care company on a solid color background. Include the text Journey .
Подсказка:
A modern logo for a software company on a solid color background. Include the text Silo .
Подсказка:
A traditional logo for a baking company on a solid color background. Include the text Seed .
Продвинутые методы письма в сжатом виде
Используйте следующие примеры для создания более конкретных подсказок на основе таких атрибутов, как описания фотографий, формы и материалы, исторические направления в искусстве и модификаторы качества изображения.
Фотография
- Подсказка включает: «Фотография...»
Чтобы использовать этот стиль, начните с ключевых слов, которые четко сообщат Imagen, что вы ищете фотографию. Начните свои подсказки с "Фото..." . Например:
![]() | ![]() | ![]() |
Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 3.
Модификаторы фотографии
В следующих примерах вы можете увидеть несколько модификаторов и параметров, специфичных для фотографии. Вы можете комбинировать несколько модификаторов для более точного управления.
Приближение камеры — крупный план, снято издалека
Подсказка: фотография кофейных зерен крупным планом. Подсказка: Уменьшенное фото небольшого пакета
кофейные зерна на грязной кухнеПоложение камеры - вид сверху, снизу
Подсказка: аэрофотоснимок города с небоскребами Подсказка: Фотография полога леса с голубым небом снизу. Освещение - естественное, драматическое, теплое, холодное
Подсказка: студийное фото современного кресла, естественное освещение. Подсказка: студийное фото современного кресла, эффектное освещение. Настройки камеры — размытие движения, мягкий фокус, боке, портрет
Подсказка: фотография города с небоскребами из салона автомобиля с размытием движения Подсказка: фотография моста в городе ночью с мягким фокусом. Типы объективов - 35 мм, 50 мм, «рыбий глаз», широкоугольный, макро
Подсказка: фотография листа, макрообъектив Подсказка: уличная фотография, Нью-Йорк, объектив «рыбий глаз» Типы пленки - черно-белая, поляроид
Подсказка: полароидный портрет собаки в солнцезащитных очках. Подсказка: черно-белое фото собаки в солнцезащитных очках.
Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 3.
Иллюстрация и искусство
- В подсказку включены: « painting с изображением...» , « sketch ...».
Художественные стили варьируются от монохромных стилей, таких как карандашные наброски, до гиперреалистичного цифрового искусства. Например, следующие изображения используют одну и ту же подсказку с разными стилями:
« [art style or creation technique] угловатого спортивного электрического седана на фоне небоскребов»
![]() | ![]() | ![]() |
![]() | ![]() | ![]() |
Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 2.
Формы и материалы
- Подсказка включает: «...изготовлен из...» , «...в форме...»
Одной из сильных сторон этой технологии является то, что вы можете создавать изображения, которые в противном случае было бы трудно или невозможно создать. Например, вы можете воссоздать логотип своей компании в разных материалах и текстурах.
![]() | ![]() | ![]() |
Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 3.
Исторические ссылки на искусство
- Подсказка включает: «...в стиле...»
Определенные стили стали культовыми на протяжении многих лет. Ниже приведены некоторые идеи исторической живописи или художественных стилей, которые вы можете попробовать.
"создать изображение в стиле [art period or movement] : ветряная электростанция"
![]() | ![]() | ![]() |
Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 3.
Модификаторы качества изображения
Определенные ключевые слова могут дать модели понять, что вы ищете высококачественный актив. Примеры модификаторов качества включают следующее:
- Общие модификаторы - качественные, красивые, стилизованные
- Фото - 4K, HDR, студийное фото
- Искусство, Иллюстрация - профессиональная, подробная
Ниже приведены несколько примеров подсказок без модификаторов качества и тех же подсказок с модификаторами качества.
![]() | ![]() фотография стебля кукурузы , сделанная профессиональный фотограф |
Источник изображения: каждое изображение было создано с использованием соответствующей текстовой подсказки с помощью модели Imagen 3.
Соотношения сторон
Генератор изображений Imagen 3 позволяет вам задать пять различных соотношений сторон изображения.
- Квадрат (1:1, по умолчанию) — стандартное квадратное фото. Обычное использование этого соотношения сторон включает публикации в социальных сетях.
Полный экран (4:3) — это соотношение сторон обычно используется в медиа или кино. Это также размеры большинства старых (не широкоэкранных) телевизоров и среднеформатных камер. Оно захватывает большую часть сцены по горизонтали (по сравнению с 1:1), что делает его предпочтительным соотношением сторон для фотографии.
Подсказка: крупный план пальцев музыканта, играющего на пианино, черно-белая пленка, винтаж (соотношение сторон 4:3) Подсказка: Профессиональная студийная фотография картофеля фри для элитного ресторана в стиле кулинарного журнала (соотношение сторон 4:3) Портретный полноэкранный (3:4) — это полноэкранное соотношение сторон, повернутое на 90 градусов. Это позволяет захватить больше сцены по вертикали по сравнению с соотношением сторон 1:1.
Подсказка: женщина на прогулке, ее ботинки отражаются в луже, на заднем плане большие горы, в рекламном стиле, драматичные ракурсы (соотношение сторон 3:4) Подсказка: аэрофотоснимок реки, текущей вверх по мистической долине (соотношение сторон 3:4) Широкоэкранный (16:9) — это соотношение заменило 4:3 и теперь является наиболее распространенным соотношением сторон для телевизоров, мониторов и экранов мобильных телефонов (альбомная ориентация). Используйте это соотношение сторон, когда хотите захватить больше фона (например, живописные пейзажи).
Подсказка: мужчина в белой одежде сидит на пляже, крупный план, освещение «золотого часа» (соотношение сторон 16:9) Портрет (9:16) — это широкоэкранное соотношение, но повернутое. Это относительно новое соотношение сторон, которое стало популярным благодаря приложениям для коротких видео (например, YouTube shorts). Используйте его для высоких объектов с четкой вертикальной ориентацией, таких как здания, деревья, водопады или другие подобные объекты.
Подсказка: цифровая визуализация огромного небоскреба, современного, грандиозного, эпического с красивым закатом на заднем плане (соотношение сторон 9:16)
Фотореалистичные изображения
Различные версии модели генерации изображений могут предлагать смесь художественного и фотореалистичного вывода. Используйте следующую формулировку в подсказках для создания более фотореалистичного вывода, основанного на объекте, который вы хотите создать.
Вариант использования | Тип линзы | Фокусные расстояния | Дополнительные подробности |
---|---|---|---|
Люди (портреты) | Prime, зум | 24-35мм | черно-белая пленка, фильм нуар, глубина резкости, дуотон (укажите два цвета) |
Еда, насекомые, растения (предметы, натюрморт) | Макро | 60-105мм | Высокая детализация, точная фокусировка, контролируемое освещение |
Спорт, дикая природа (движение) | Телефото зум | 100-400мм | Короткая выдержка, отслеживание действий или движения |
Астрономический, пейзажный (широкоугольный) | Широкоугольный | 10-24мм | Длительное время экспозиции, четкий фокус, длительная выдержка, гладкая вода или облака |
Портреты
Вариант использования | Тип линзы | Фокусные расстояния | Дополнительные подробности |
---|---|---|---|
Люди (портреты) | Prime, зум | 24-35мм | черно-белая пленка, фильм нуар, глубина резкости, дуотон (укажите два цвета) |
Используя несколько ключевых слов из таблицы, Imagen может сгенерировать следующие портреты:
![]() | ![]() | ![]() | ![]() |
Подсказка: Женщина, портрет, 35 мм, синие и серые дуотона.
Модель: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
Подсказка: Женщина, 35-мм портрет, фильм-нуар
Модель: imagen-3.0-generate-002
Объекты
Вариант использования | Тип линзы | Фокусные расстояния | Дополнительные подробности |
---|---|---|---|
Еда, насекомые, растения (предметы, натюрморт) | Макро | 60-105мм | Высокая детализация, точная фокусировка, контролируемое освещение |
Используя несколько ключевых слов из таблицы, Imagen может генерировать следующие изображения объектов:
![]() | ![]() | ![]() | ![]() |
Подсказка: лист молитвенного растения, макрообъектив, 60 мм.
Модель: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
Подсказка: тарелка пасты, макрообъектив 100 мм.
Модель: imagen-3.0-generate-002
Движение
Вариант использования | Тип линзы | Фокусные расстояния | Дополнительные подробности |
---|---|---|---|
Спорт, дикая природа (движение) | Телефото зум | 100-400мм | Короткая выдержка, отслеживание действий или движения |
Используя несколько ключевых слов из таблицы, Imagen может генерировать следующие движущиеся изображения:
![]() | ![]() | ![]() | ![]() |
Подсказка: победный тачдаун, быстрая выдержка, отслеживание движения
Модель: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
Подсказка: Олень бежит по лесу, короткая выдержка, отслеживание движения.
Модель: imagen-3.0-generate-002
Широкоугольный
Вариант использования | Тип линзы | Фокусные расстояния | Дополнительные подробности |
---|---|---|---|
Астрономический, пейзажный (широкоугольный) | Широкоугольный | 10-24мм | Длительное время экспозиции, четкий фокус, длительная выдержка, гладкая вода или облака |
Используя несколько ключевых слов из таблицы, Imagen может генерировать следующие широкоугольные изображения:
![]() | ![]() | ![]() | ![]() |
Подсказка: обширный горный хребет, пейзаж, широкоугольный объектив 10 мм
Модель: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
Подсказка: фотография Луны, астрофотография, широкоугольный объектив 10 мм.
Модель: imagen-3.0-generate-002
Что дальше?
- Ознакомьтесь с руководством Veo , чтобы узнать, как создавать видео с помощью API Gemini.
- Дополнительную информацию о моделях Gemini 2.0 см. в разделах Модели Gemini и Экспериментальные модели .