این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.

با استفاده از Imagen تصاویر تولید کنید

ایمیجن (Imagen) مدل تولید تصویر با کیفیت بالای گوگل است که قادر به تولید تصاویر واقعی و با کیفیت بالا از پیام‌های متنی است. همه تصاویر تولید شده شامل واترمارک SynthID هستند. برای کسب اطلاعات بیشتر در مورد انواع مدل ایمیجن موجود، به بخش نسخه‌های مدل مراجعه کنید.

تولید تصاویر با استفاده از مدل‌های Imagen

این مثال تولید تصاویر با مدل Imagen را نشان می‌دهد:

پایتون

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

response = client.models.generate_images(
    model='imagen-4.0-generate-001',
    prompt='Robot holding a red skateboard',
    config=types.GenerateImagesConfig(
        number_of_images= 4,
    )
)
for generated_image in response.generated_images:
  generated_image.image.show()

جاوا اسکریپت

import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({});

  const response = await ai.models.generateImages({
    model: 'imagen-4.0-generate-001',
    prompt: 'Robot holding a red skateboard',
    config: {
      numberOfImages: 4,
    },
  });

  let idx = 1;
  for (const generatedImage of response.generatedImages) {
    let imgBytes = generatedImage.image.imageBytes;
    const buffer = Buffer.from(imgBytes, "base64");
    fs.writeFileSync(`imagen-${idx}.png`, buffer);
    idx++;
  }
}

main();

برو

package main

import (
  "context"
  "fmt"
  "os"
  "google.golang.org/genai"
)

func main() {

  ctx := context.Background()
  client, err := genai.NewClient(ctx, nil)
  if err != nil {
      log.Fatal(err)
  }

  config := &genai.GenerateImagesConfig{
      NumberOfImages: 4,
  }

  response, _ := client.Models.GenerateImages(
      ctx,
      "imagen-4.0-generate-001",
      "Robot holding a red skateboard",
      config,
  )

  for n, image := range response.GeneratedImages {
      fname := fmt.Sprintf("imagen-%d.png", n)
          _ = os.WriteFile(fname, image.Image.ImageBytes, 0644)
  }
}

استراحت

curl -X POST \
    "https://generativelanguage.googleapis.com/v1beta/models/imagen-4.0-generate-001:predict" \
    -H "x-goog-api-key: $GEMINI_API_KEY" \
    -H "Content-Type: application/json" \
    -d '{
        "instances": [
          {
            "prompt": "Robot holding a red skateboard"
          }
        ],
        "parameters": {
          "sampleCount": 4
        }
      }'

تصویر تولید شده توسط هوش مصنوعی از رباتی که یک اسکیت‌بورد قرمز در دست دارد

پیکربندی ایمیجن

ایمیجن در حال حاضر فقط از زبان انگلیسی و پارامترهای زیر پشتیبانی می‌کند:

numberOfImages : تعداد تصاویری که باید تولید شوند، از ۱ تا ۴ (شامل). مقدار پیش‌فرض ۴ است.
imageSize : اندازه تصویر تولید شده. این فقط برای مدل‌های استاندارد و فوق العاده پشتیبانی می‌شود. مقادیر پشتیبانی شده 1K و 2K هستند. مقدار پیش‌فرض 1K است.
aspectRatio : نسبت ابعاد تصویر تولید شده را تغییر می‌دهد. مقادیر پشتیبانی شده عبارتند از "1:1" ، "3:4" ، "4:3" ، "9:16" و "16:9" . مقدار پیش‌فرض "1:1" است.
personGeneration : به مدل اجازه می‌دهد تصاویر افراد را تولید کند. مقادیر زیر پشتیبانی می‌شوند:
- "dont_allow" : جلوگیری از تولید تصاویر افراد.
- "allow_adult" : تصاویر بزرگسالان را تولید می‌کند، اما تصاویر کودکان را تولید نمی‌کند. این مقدار پیش‌فرض است.
- "allow_all" : تصاویری تولید می‌کند که شامل بزرگسالان و کودکان باشد.
توجه: مقدار پارامتر "allow_all" در کشورهای عضو اتحادیه اروپا، بریتانیا، جمهوری خلق چین و خاورمیانه و شمال آفریقا مجاز نیست.

راهنمای سریع Imagen

این بخش از راهنمای Imagen به شما نشان می‌دهد که چگونه تغییر یک درخواست تبدیل متن به تصویر می‌تواند نتایج متفاوتی ایجاد کند، به همراه نمونه‌هایی از تصاویری که می‌توانید ایجاد کنید.

اصول اولیه نوشتن سریع

یک متن خوب، توصیفی و واضح است و از کلمات کلیدی و توصیف‌کننده‌های معنادار استفاده می‌کند. با در نظر گرفتن موضوع ، زمینه و سبک خود شروع کنید.

سوال با تأکید بر موضوع، زمینه و سبک — متن تصویر: *طرحی* ( **سبک** ) از یک *آپارتمان مدرن* ( **موضوع** ) که توسط *آسمان‌خراش‌ها* احاطه شده است ( **زمینه و پس‌زمینه** ).

موضوع : اولین چیزی که باید در مورد هر سوالی در نظر بگیرید، موضوع است: شیء، شخص، حیوان یا منظره‌ای که می‌خواهید از آن تصویر بگیرید.
زمینه و پس زمینه: به همان اندازه که زمینه یا بستری که سوژه در آن قرار خواهد گرفت مهم است، سوژه خود را در پس زمینه های متنوعی قرار دهید. به عنوان مثال، یک استودیو با پس زمینه سفید، فضای باز یا محیط های داخلی.
سبک: در نهایت، سبک تصویر مورد نظر خود را اضافه کنید. سبک‌ها می‌توانند عمومی (نقاشی، عکس، طرح‌های اولیه) یا بسیار خاص (نقاشی پاستل، طراحی با زغال، سه‌بعدی ایزومتریک) باشند. همچنین می‌توانید سبک‌ها را با هم ترکیب کنید.

بعد از اینکه اولین نسخه از ایده‌تان را نوشتید، با اضافه کردن جزئیات بیشتر، ایده‌تان را اصلاح کنید تا به تصویری که می‌خواهید برسید. تکرار مهم است. با مشخص کردن ایده اصلی خود شروع کنید و سپس آن ایده اصلی را اصلاح و گسترش دهید تا تصویر تولید شده به چشم‌انداز شما نزدیک شود.

تصویر نمونه واقع‌گرایانه ۱ — نکته: پارکی در بهار کنار دریاچه

تصویر نمونه واقع‌گرایانه ۲ — نکته: پارکی در بهار کنار دریاچه، **غروب خورشید در میان دریاچه، ساعت طلایی**

تصویر نمونه واقع‌گرایانه ۳ — راهنمایی: پارکی در بهار کنار دریاچه، **غروب خورشید در میان دریاچه، ساعت طلایی، گل‌های وحشی قرمز**

مدل‌های ایمجین می‌توانند ایده‌های شما را به تصاویر دقیق تبدیل کنند، چه درخواست‌های شما کوتاه باشند و چه طولانی و با جزئیات. چشم‌انداز خود را از طریق تکرار درخواست‌ها اصلاح کنید و جزئیات را تا رسیدن به نتیجه کامل اضافه کنید.

دستورالعمل‌های کوتاه به شما امکان می‌دهند به سرعت یک تصویر ایجاد کنید.

مثال کوتاه Imagen 4 — پیشنهاد: عکس کلوزآپ از زنی در دهه بیست زندگی‌اش، عکاسی خیابانی، عکس فیلم، تُن‌های گرم نارنجی ملایم

درخواست‌های طولانی‌تر به شما امکان می‌دهند جزئیات خاصی را اضافه کنید و تصویر خود را بسازید.

مثال دستور طولانی Imagen 4 — نکته: عکسی جذاب از زنی در دهه بیست زندگی‌اش با استفاده از سبک عکاسی خیابانی. تصویر باید مانند یک فیلم ثابت با تُن‌های گرم نارنجی ملایم به نظر برسد.

توصیه‌های اضافی برای نوشتن سریع Imagen:

از زبان توصیفی استفاده کنید : از صفت‌ها و قیدهای دقیق برای ترسیم تصویری واضح برای Imagen استفاده کنید.
زمینه را فراهم کنید : در صورت لزوم، اطلاعات پیش‌زمینه را برای کمک به درک هوش مصنوعی ارائه دهید.
ارجاع به هنرمندان یا سبک‌های خاص : اگر زیبایی‌شناسی خاصی را در ذهن دارید، ارجاع به هنرمندان یا جنبش‌های هنری خاص می‌تواند مفید باشد.
از ابزارهای مهندسی سریع استفاده کنید : برای کمک به اصلاح دستورالعمل‌های خود و دستیابی به نتایج بهینه، ابزارها یا منابع مهندسی سریع را بررسی کنید.
بهبود جزئیات چهره در تصاویر شخصی و گروهی : جزئیات چهره را به عنوان نقطه کانونی عکس مشخص کنید (برای مثال، از کلمه "پرتره" در سوال استفاده کنید).

تولید متن در تصاویر

مدل‌های Imagen می‌توانند متن را به تصاویر اضافه کنند و امکانات خلاقانه‌تری برای تولید تصویر فراهم کنند. برای بهره‌مندی هرچه بیشتر از این ویژگی، از راهنمایی‌های زیر استفاده کنید:

با اطمینان تکرار کنید : ممکن است مجبور شوید تصاویر را دوباره تولید کنید تا به ظاهر دلخواه خود برسید. ادغام متن Imagen هنوز در حال تکامل است و گاهی اوقات چندین تلاش بهترین نتایج را به همراه دارد.
کوتاه نگه دارید : برای تولید بهینه، متن را به ۲۵ کاراکتر یا کمتر محدود کنید.
عبارات چندگانه : برای ارائه اطلاعات بیشتر، با دو یا سه عبارت مجزا آزمایش کنید. برای نوشتن متن‌های تمیزتر، از بیش از سه عبارت استفاده نکنید.
نکته: پوستری با عنوان «سرزمین تابستان» با فونت پررنگ، که در زیر آن شعار «تابستان هیچ‌وقت اینقدر خوب نبوده» نوشته شده است.
قرار دادن متن در راهنما : اگرچه Imagen می‌تواند متن را طبق دستورالعمل قرار دهد، اما انتظار تغییرات گاه به گاه را داشته باشید. این ویژگی به طور مداوم در حال بهبود است.
الهام بخشیدن به سبک فونت : یک سبک فونت کلی را مشخص کنید تا به طور نامحسوس بر انتخاب‌های Imagen تأثیر بگذارد. به تکرار دقیق فونت تکیه نکنید، بلکه انتظار تفسیرهای خلاقانه را داشته باشید.
اندازه فونت : اندازه فونت یا یک شاخص کلی برای اندازه (مثلاً کوچک ، متوسط ، بزرگ ) را برای تأثیرگذاری بر تولید اندازه فونت مشخص کنید.

پارامتردهی سریع

برای کنترل بهتر نتایج خروجی، ممکن است پارامتری کردن ورودی‌ها در Imagen مفید باشد. برای مثال، فرض کنید می‌خواهید مشتریانتان بتوانند برای کسب و کار خود لوگو تولید کنند و می‌خواهید مطمئن شوید که لوگوها همیشه با پس‌زمینه‌ای تک رنگ تولید می‌شوند. همچنین می‌خواهید گزینه‌هایی را که مشتری می‌تواند از یک منو انتخاب کند، محدود کنید.

در این مثال، می‌توانید یک اعلان پارامتری مشابه زیر ایجاد کنید:

A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.

در رابط کاربری سفارشی شما، مشتری می‌تواند پارامترها را با استفاده از یک منو وارد کند و مقدار انتخابی او در اعلان دریافتی Imagen نمایش داده می‌شود.

برای مثال:

نکته: A minimalist logo for a health care company on a solid color background. Include the text Journey .
پیشنهاد: A modern logo for a software company on a solid color background. Include the text Silo .
نکته: A traditional logo for a baking company on a solid color background. Include the text Seed .

تکنیک‌های پیشرفته‌ی نگارش سریع

از مثال‌های زیر برای ایجاد دستورالعمل‌های خاص‌تر بر اساس ویژگی‌هایی مانند توصیف‌کننده‌های عکاسی، شکل‌ها و مواد، جنبش‌های هنری تاریخی و اصلاح‌کننده‌های کیفیت تصویر استفاده کنید.

عکاسی

این درخواست شامل موارد زیر است: «عکسی از...»

برای استفاده از این سبک، با استفاده از کلمات کلیدی که به وضوح به Imagen می‌گویند که شما به دنبال یک عکس هستید، شروع کنید. سوالات خود را با «عکسی از...» شروع کنید. به عنوان مثال:

^{منبع تصویر: هر تصویر با استفاده از متن مربوطه با مدل Imagen 4 تولید شده است.}

اصلاح‌کننده‌های عکاسی

در مثال‌های زیر، می‌توانید چندین اصلاح‌کننده و پارامتر مخصوص عکاسی را مشاهده کنید. می‌توانید برای کنترل دقیق‌تر، چندین اصلاح‌کننده را با هم ترکیب کنید.

نزدیکی دوربین - نمای نزدیک، گرفته شده از فاصله دور

نمونه تصویر دوربین از نمای نزدیک — پیشنهاد ویژه: عکسی **از نمای نزدیک** از دانه‌های قهوه

نمونه تصویر دوربین بزرگنمایی شده — نکته: عکس **کوچک‌شده** از یک کیسه کوچک
دانه‌های قهوه در آشپزخانه‌ای نامرتب

موقعیت دوربین - هوایی، از پایین
موضوع: عکس هوایی از شهر با آسمان‌خراش‌ها
نکته: عکسی از یک سایبان جنگلی با آسمان آبی از پایین

نورپردازی - طبیعی، دراماتیک، گرم، سرد

تصویر نمونه نورپردازی طبیعی — پیشنهاد ویژه: عکس استودیویی از یک صندلی راحتی مدرن، **با نورپردازی طبیعی**

تصویر نمونه نورپردازی دراماتیک — نکته: عکس استودیویی از یک صندلی راحتی مدرن، **نورپردازی دراماتیک**

تنظیمات دوربین - تاری حرکت، فوکوس نرم، بوکه، پرتره
سوال: عکسی از شهری با آسمان‌خراش‌ها از داخل ماشین با تاری حرکتی
نکته: عکس با فوکوس نرم از پلی در یک شهر در شب
انواع لنز - ۳۵ میلی‌متری، ۵۰ میلی‌متری، فیش‌آی، واید، ماکرو
سوال: عکس از یک برگ، لنز ماکرو
موضوع: عکاسی خیابانی، شهر نیویورک، لنز چشم ماهی
انواع فیلم - سیاه و سفید، پولاروید
موضوع: عکس پولاروید از سگی که عینک آفتابی زده است
موضوع: عکس سیاه و سفید از سگی که عینک آفتابی زده است

^{منبع تصویر: هر تصویر با استفاده از متن مربوطه با مدل Imagen 4 تولید شده است.}

تصویرسازی و هنر

این سوال شامل موارد زیر است: « painting از ...» ، « sketch از ...»

سبک‌های هنری از سبک‌های تک‌رنگ مانند طرح‌های مدادی تا هنر دیجیتال فوق واقع‌گرایانه متفاوت است. برای مثال، تصاویر زیر از یک دستورالعمل با سبک‌های مختلف استفاده می‌کنند:

«یک [art style or creation technique] از یک سدان برقی اسپرت زاویه‌دار با آسمان‌خراش‌ها در پس‌زمینه»

تصاویر نمونه هنری — نکته: **طراحی فنی با مداد** از یک جسم زاویه‌دار...

^{منبع تصویر: هر تصویر با استفاده از متن مربوطه با مدل Imagen 2 تولید شده است.}

اشکال و مواد

این سوال شامل موارد زیر است: «...ساخته شده از...» ، «...به شکل...»

یکی از نقاط قوت این فناوری این است که می‌توانید تصاویری خلق کنید که در غیر این صورت دشوار یا غیرممکن است. به عنوان مثال، می‌توانید لوگوی شرکت خود را با مواد و بافت‌های مختلف بازسازی کنید.

شکل‌ها و مواد، مثال تصویر ۱ — سوال: یک کیسه‌ی دوفل **ساخته شده از** پنیر

شکل‌ها و مواد، مثال تصویر ۲ — نکته: لامپ‌های نئونی **به شکل** پرنده

شکل‌ها و مواد، مثال تصویر ۳ — راهنمایی: یک صندلی راحتی **ساخته شده از کاغذ** ، عکس استودیویی، سبک اوریگامی

^{منبع تصویر: هر تصویر با استفاده از متن مربوطه با مدل Imagen 4 تولید شده است.}

منابع هنری تاریخی

این عبارت شامل موارد زیر است: «... به سبک ...»

سبک‌های خاصی در طول سال‌ها به سبک‌های نمادین تبدیل شده‌اند. در ادامه ایده‌هایی از نقاشی‌های تاریخی یا سبک‌های هنری ارائه شده است که می‌توانید امتحان کنید.

«ایجاد تصویری به سبک [art period or movement] : یک مزرعه بادی»

تصویر نمونه امپرسیونیسم — سوال: تصویری به سبک *نقاشی امپرسیونیست* بسازید: یک مزرعه بادی

تصویر نمونه رنسانس — سوال: تصویری به سبک *نقاشی‌های رنسانس* بسازید: یک مزرعه بادی

تصویر نمونه هنر پاپ — سوال: تصویری به سبک *پاپ آرت* بسازید: یک مزرعه بادی

^{منبع تصویر: هر تصویر با استفاده از متن مربوطه با مدل Imagen 4 تولید شده است.}

اصلاح‌کننده‌های کیفیت تصویر

کلمات کلیدی خاصی می‌توانند به مدل اطلاع دهند که شما به دنبال یک دارایی با کیفیت بالا هستید. نمونه‌هایی از اصلاح‌کننده‌های کیفیت شامل موارد زیر است:

اصلاح‌کننده‌های عمومی - با کیفیت بالا، زیبا، دارای سبک
عکس‌ها - 4K، HDR، عکس استودیویی
هنر، تصویرسازی - توسط یک متخصص، دقیق

در ادامه چند نمونه از سوالات بدون اصلاح‌کننده‌های کیفیت و همان سوال با اصلاح‌کننده‌های کیفیت آمده است.

تصویر نمونه ذرت بدون اصلاح‌کننده‌ها — سریع (بدون اصلاح کننده کیفیت): عکسی از ساقه ذرت

تصویر نمونه ذرت با اصلاح‌کننده‌ها — سریع (با اصلاح‌کننده‌های کیفیت): **4k HDR زیبا**
عکس ساقه ذرت گرفته شده توسط یک
عکاس حرفه‌ای

^{منبع تصویر: هر تصویر با استفاده از متن مربوطه با مدل Imagen 4 تولید شده است.}

نسبت‌های ابعاد

تولید تصویر Imagen به شما امکان می‌دهد پنج نسبت تصویر مجزا تنظیم کنید.

مربع (۱:۱، پیش‌فرض) - یک عکس مربع استاندارد. کاربردهای رایج این نسبت ابعاد شامل پست‌های رسانه‌های اجتماعی است.

تمام صفحه (4:3) - این نسبت ابعاد معمولاً در رسانه‌ها یا فیلم‌ها استفاده می‌شود. همچنین ابعاد اکثر تلویزیون‌های قدیمی (غیر عریض) و دوربین‌های قطع متوسط نیز همین است. این نسبت، صحنه بیشتری را به صورت افقی ثبت می‌کند (در مقایسه با 1:1)، و آن را به نسبت ابعادی ترجیحی برای عکاسی تبدیل می‌کند.

مثال نسبت ابعاد — نکته: نمای نزدیک از انگشتان یک نوازنده در حال نواختن پیانو، فیلم سیاه و سفید، قدیمی (نسبت تصویر ۴:۳)

حالت تمام صفحه عمودی (۳:۴) - این نسبت تصویر تمام صفحه با چرخش ۹۰ درجه است. این نسبت تصویر به شما امکان می‌دهد در مقایسه با نسبت تصویر ۱:۱، بخش بیشتری از صحنه را به صورت عمودی ثبت کنید.

صفحه عریض (۱۶:۹) - این نسبت تصویر جایگزین ۴:۳ شده و اکنون رایج‌ترین نسبت تصویر برای تلویزیون‌ها، مانیتورها و صفحه نمایش تلفن‌های همراه (افقی) است. وقتی می‌خواهید قسمت بیشتری از پس‌زمینه را ثبت کنید (مثلاً مناظر طبیعی)، از این نسبت تصویر استفاده کنید.
نکته: مردی با لباس‌های تماماً سفید که در ساحل نشسته است، نمای نزدیک، نورپردازی ساعت طلایی (نسبت تصویر ۱۶:۹)
عمودی (۹:۱۶) - این نسبت تصویر، صفحه عریض است اما چرخیده است. این نسبت تصویر، نسبت تصویر نسبتاً جدیدی است که توسط برنامه‌های ویدیویی کوتاه (مثلاً ویدیوهای کوتاه یوتیوب) رواج یافته است. از این نسبت تصویر برای اشیاء بلند با جهت‌گیری عمودی قوی مانند ساختمان‌ها، درختان، آبشارها یا سایر اشیاء مشابه استفاده کنید.
نکته: رندر دیجیتالی از یک آسمان‌خراش عظیم، مدرن، باشکوه، حماسی با غروب خورشید زیبا در پس‌زمینه (نسبت تصویر ۹:۱۶)

تصاویر واقع‌گرایانه

نسخه‌های مختلف مدل تولید تصویر ممکن است ترکیبی از خروجی هنری و واقع‌گرایانه ارائه دهند. از عبارت زیر در دستورالعمل‌ها برای تولید خروجی واقع‌گرایانه‌تر، بر اساس موضوعی که می‌خواهید تولید کنید، استفاده کنید.

مورد استفاده	نوع لنز	فواصل کانونی	جزئیات تکمیلی
مردم (پرتره)	پرایم، زوم	۲۴-۳۵ میلی‌متر	فیلم سیاه و سفید، فیلم نوآر، عمق میدان، دو رنگ (دو رنگ را ذکر کنید)
غذا، حشرات، گیاهان (اشیاء، طبیعت بی‌جان)	ماکرو	۶۰-۱۰۵ میلی‌متر	جزئیات بالا، فوکوس دقیق، نورپردازی کنترل‌شده
ورزش، حیات وحش (حرکت)	زوم تله فوتو	۱۰۰-۴۰۰ میلی‌متر	سرعت شاتر بالا، ردیابی حرکت یا اکشن
نجومی، منظره (زاویه باز)	زاویه دید عریض	۱۰-۲۴ میلی‌متر	زمان نوردهی طولانی، فوکوس دقیق، نوردهی طولانی، آب یا ابرهای نرم

پرتره‌ها

مورد استفاده	نوع لنز	فواصل کانونی	جزئیات تکمیلی
مردم (پرتره)	پرایم، زوم	۲۴-۳۵ میلی‌متر	فیلم سیاه و سفید، فیلم نوآر، عمق میدان، دو رنگ (دو رنگ را ذکر کنید)

با استفاده از چندین کلمه کلیدی از جدول، Imagen می‌تواند پرتره‌های زیر را تولید کند:

نکته: یک زن، پرتره ۳۵ میلی‌متری، دو رنگ آبی و خاکستری
مدل: imagen-4.0-generate-001

پیشنهاد: یک زن، پرتره ۳۵ میلی‌متری، فیلم نوآر
مدل: imagen-4.0-generate-001

اشیاء

مورد استفاده	نوع لنز	فواصل کانونی	جزئیات تکمیلی
غذا، حشرات، گیاهان (اشیاء، طبیعت بی‌جان)	ماکرو	۶۰-۱۰۵ میلی‌متر	جزئیات بالا، فوکوس دقیق، نورپردازی کنترل‌شده

با استفاده از چندین کلمه کلیدی از جدول، Imagen می‌تواند تصاویر شیء زیر را تولید کند:

نکته: برگ گیاه دعا، لنز ماکرو، ۶۰ میلی‌متری
مدل: imagen-4.0-generate-001

نکته: یک بشقاب پاستا، لنز ماکرو ۱۰۰ میلی‌متری
مدل: imagen-4.0-generate-001

حرکت

مورد استفاده	نوع لنز	فواصل کانونی	جزئیات تکمیلی
ورزش، حیات وحش (حرکت)	زوم تله فوتو	۱۰۰-۴۰۰ میلی‌متر	سرعت شاتر بالا، ردیابی حرکت یا اکشن

با استفاده از چندین کلمه کلیدی از جدول، Imagen می‌تواند تصاویر متحرک زیر را تولید کند:

نکته: یک فرود برنده، سرعت شاتر بالا، ردیابی حرکت
مدل: imagen-4.0-generate-001

نکته: دویدن یک گوزن در جنگل، سرعت شاتر بالا، ردیابی حرکت
مدل: imagen-4.0-generate-001

زاویه دید عریض

مورد استفاده	نوع لنز	فواصل کانونی	جزئیات تکمیلی
نجومی، منظره (زاویه باز)	زاویه دید عریض	۱۰-۲۴ میلی‌متر	زمان نوردهی طولانی، فوکوس دقیق، نوردهی طولانی، آب یا ابرهای نرم

با استفاده از چندین کلمه کلیدی از جدول، Imagen می‌تواند تصاویر زاویه باز زیر را تولید کند:

نکته: یک رشته کوه پهناور، منظره با زاویه دید عریض ۱۰ میلی‌متر
مدل: imagen-4.0-generate-001

نکته: عکسی از ماه، عکاسی نجومی، لنز واید ۱۰ میلی‌متری
مدل: imagen-4.0-generate-001

نسخه‌های مدل

تصویر ۴

ملک	توضیحات
کد مدل	رابط برنامه‌نویسی کاربردی Gemini `imagen-4.0-generate-001` `imagen-4.0-ultra-generate-001` `imagen-4.0-fast-generate-001`
انواع داده پشتیبانی شده را	ورودی متن خروجی تصاویر
محدودیت‌های توکن ^[*]	محدودیت توکن ورودی ۴۸۰ توکن (متن) تصاویر خروجی ۱ تا ۴ (فوق‌العاده/استاندارد/سریع)
آخرین به‌روزرسانی	ژوئن ۲۰۲۵

تصویر ۳

مدل Imagen 3 خاموش شده است (/gemini-api/docs/deprecations).