ایمیجن (Imagen) مدل تولید تصویر با کیفیت بالای گوگل است که قادر به تولید تصاویر واقعی و با کیفیت بالا از پیامهای متنی است. همه تصاویر تولید شده شامل واترمارک SynthID هستند. برای کسب اطلاعات بیشتر در مورد انواع مدل ایمیجن موجود، به بخش نسخههای مدل مراجعه کنید.
تولید تصاویر با استفاده از مدلهای Imagen
این مثال تولید تصاویر با مدل Imagen را نشان میدهد:
پایتون
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
client = genai.Client()
response = client.models.generate_images(
model='imagen-4.0-generate-001',
prompt='Robot holding a red skateboard',
config=types.GenerateImagesConfig(
number_of_images= 4,
)
)
for generated_image in response.generated_images:
generated_image.image.show()
جاوا اسکریپت
import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";
async function main() {
const ai = new GoogleGenAI({});
const response = await ai.models.generateImages({
model: 'imagen-4.0-generate-001',
prompt: 'Robot holding a red skateboard',
config: {
numberOfImages: 4,
},
});
let idx = 1;
for (const generatedImage of response.generatedImages) {
let imgBytes = generatedImage.image.imageBytes;
const buffer = Buffer.from(imgBytes, "base64");
fs.writeFileSync(`imagen-${idx}.png`, buffer);
idx++;
}
}
main();
برو
package main
import (
"context"
"fmt"
"os"
"google.golang.org/genai"
)
func main() {
ctx := context.Background()
client, err := genai.NewClient(ctx, nil)
if err != nil {
log.Fatal(err)
}
config := &genai.GenerateImagesConfig{
NumberOfImages: 4,
}
response, _ := client.Models.GenerateImages(
ctx,
"imagen-4.0-generate-001",
"Robot holding a red skateboard",
config,
)
for n, image := range response.GeneratedImages {
fname := fmt.Sprintf("imagen-%d.png", n)
_ = os.WriteFile(fname, image.Image.ImageBytes, 0644)
}
}
استراحت
curl -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/imagen-4.0-generate-001:predict" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"instances": [
{
"prompt": "Robot holding a red skateboard"
}
],
"parameters": {
"sampleCount": 4
}
}'

پیکربندی ایمیجن
ایمیجن در حال حاضر فقط از زبان انگلیسی و پارامترهای زیر پشتیبانی میکند:
-
numberOfImages: تعداد تصاویری که باید تولید شوند، از ۱ تا ۴ (شامل). مقدار پیشفرض ۴ است. -
imageSize: اندازه تصویر تولید شده. این فقط برای مدلهای استاندارد و فوق العاده پشتیبانی میشود. مقادیر پشتیبانی شده1Kو2Kهستند. مقدار پیشفرض1Kاست. -
aspectRatio: نسبت ابعاد تصویر تولید شده را تغییر میدهد. مقادیر پشتیبانی شده عبارتند از"1:1"،"3:4"،"4:3"،"9:16"و"16:9". مقدار پیشفرض"1:1"است. personGeneration: به مدل اجازه میدهد تصاویر افراد را تولید کند. مقادیر زیر پشتیبانی میشوند:-
"dont_allow": جلوگیری از تولید تصاویر افراد. -
"allow_adult": تصاویر بزرگسالان را تولید میکند، اما تصاویر کودکان را تولید نمیکند. این مقدار پیشفرض است. -
"allow_all": تصاویری تولید میکند که شامل بزرگسالان و کودکان باشد.
-
راهنمای سریع Imagen
این بخش از راهنمای Imagen به شما نشان میدهد که چگونه تغییر یک درخواست تبدیل متن به تصویر میتواند نتایج متفاوتی ایجاد کند، به همراه نمونههایی از تصاویری که میتوانید ایجاد کنید.
اصول اولیه نوشتن سریع
یک متن خوب، توصیفی و واضح است و از کلمات کلیدی و توصیفکنندههای معنادار استفاده میکند. با در نظر گرفتن موضوع ، زمینه و سبک خود شروع کنید.

موضوع : اولین چیزی که باید در مورد هر سوالی در نظر بگیرید، موضوع است: شیء، شخص، حیوان یا منظرهای که میخواهید از آن تصویر بگیرید.
زمینه و پس زمینه: به همان اندازه که زمینه یا بستری که سوژه در آن قرار خواهد گرفت مهم است، سوژه خود را در پس زمینه های متنوعی قرار دهید. به عنوان مثال، یک استودیو با پس زمینه سفید، فضای باز یا محیط های داخلی.
سبک: در نهایت، سبک تصویر مورد نظر خود را اضافه کنید. سبکها میتوانند عمومی (نقاشی، عکس، طرحهای اولیه) یا بسیار خاص (نقاشی پاستل، طراحی با زغال، سهبعدی ایزومتریک) باشند. همچنین میتوانید سبکها را با هم ترکیب کنید.
بعد از اینکه اولین نسخه از ایدهتان را نوشتید، با اضافه کردن جزئیات بیشتر، ایدهتان را اصلاح کنید تا به تصویری که میخواهید برسید. تکرار مهم است. با مشخص کردن ایده اصلی خود شروع کنید و سپس آن ایده اصلی را اصلاح و گسترش دهید تا تصویر تولید شده به چشمانداز شما نزدیک شود.
![]() | ![]() | ![]() |
مدلهای ایمجین میتوانند ایدههای شما را به تصاویر دقیق تبدیل کنند، چه درخواستهای شما کوتاه باشند و چه طولانی و با جزئیات. چشمانداز خود را از طریق تکرار درخواستها اصلاح کنید و جزئیات را تا رسیدن به نتیجه کامل اضافه کنید.
دستورالعملهای کوتاه به شما امکان میدهند به سرعت یک تصویر ایجاد کنید. ![]() | درخواستهای طولانیتر به شما امکان میدهند جزئیات خاصی را اضافه کنید و تصویر خود را بسازید. ![]() |
توصیههای اضافی برای نوشتن سریع Imagen:
- از زبان توصیفی استفاده کنید : از صفتها و قیدهای دقیق برای ترسیم تصویری واضح برای Imagen استفاده کنید.
- زمینه را فراهم کنید : در صورت لزوم، اطلاعات پیشزمینه را برای کمک به درک هوش مصنوعی ارائه دهید.
- ارجاع به هنرمندان یا سبکهای خاص : اگر زیباییشناسی خاصی را در ذهن دارید، ارجاع به هنرمندان یا جنبشهای هنری خاص میتواند مفید باشد.
- از ابزارهای مهندسی سریع استفاده کنید : برای کمک به اصلاح دستورالعملهای خود و دستیابی به نتایج بهینه، ابزارها یا منابع مهندسی سریع را بررسی کنید.
- بهبود جزئیات چهره در تصاویر شخصی و گروهی : جزئیات چهره را به عنوان نقطه کانونی عکس مشخص کنید (برای مثال، از کلمه "پرتره" در سوال استفاده کنید).
تولید متن در تصاویر
مدلهای Imagen میتوانند متن را به تصاویر اضافه کنند و امکانات خلاقانهتری برای تولید تصویر فراهم کنند. برای بهرهمندی هرچه بیشتر از این ویژگی، از راهنماییهای زیر استفاده کنید:
- با اطمینان تکرار کنید : ممکن است مجبور شوید تصاویر را دوباره تولید کنید تا به ظاهر دلخواه خود برسید. ادغام متن Imagen هنوز در حال تکامل است و گاهی اوقات چندین تلاش بهترین نتایج را به همراه دارد.
- کوتاه نگه دارید : برای تولید بهینه، متن را به ۲۵ کاراکتر یا کمتر محدود کنید.
عبارات چندگانه : برای ارائه اطلاعات بیشتر، با دو یا سه عبارت مجزا آزمایش کنید. برای نوشتن متنهای تمیزتر، از بیش از سه عبارت استفاده نکنید.

نکته: پوستری با عنوان «سرزمین تابستان» با فونت پررنگ، که در زیر آن شعار «تابستان هیچوقت اینقدر خوب نبوده» نوشته شده است. قرار دادن متن در راهنما : اگرچه Imagen میتواند متن را طبق دستورالعمل قرار دهد، اما انتظار تغییرات گاه به گاه را داشته باشید. این ویژگی به طور مداوم در حال بهبود است.
الهام بخشیدن به سبک فونت : یک سبک فونت کلی را مشخص کنید تا به طور نامحسوس بر انتخابهای Imagen تأثیر بگذارد. به تکرار دقیق فونت تکیه نکنید، بلکه انتظار تفسیرهای خلاقانه را داشته باشید.
اندازه فونت : اندازه فونت یا یک شاخص کلی برای اندازه (مثلاً کوچک ، متوسط ، بزرگ ) را برای تأثیرگذاری بر تولید اندازه فونت مشخص کنید.
پارامتردهی سریع
برای کنترل بهتر نتایج خروجی، ممکن است پارامتری کردن ورودیها در Imagen مفید باشد. برای مثال، فرض کنید میخواهید مشتریانتان بتوانند برای کسب و کار خود لوگو تولید کنند و میخواهید مطمئن شوید که لوگوها همیشه با پسزمینهای تک رنگ تولید میشوند. همچنین میخواهید گزینههایی را که مشتری میتواند از یک منو انتخاب کند، محدود کنید.
در این مثال، میتوانید یک اعلان پارامتری مشابه زیر ایجاد کنید:
A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.در رابط کاربری سفارشی شما، مشتری میتواند پارامترها را با استفاده از یک منو وارد کند و مقدار انتخابی او در اعلان دریافتی Imagen نمایش داده میشود.
برای مثال:
نکته:
A minimalist logo for a health care company on a solid color background. Include the text Journey .
پیشنهاد:
A modern logo for a software company on a solid color background. Include the text Silo .
نکته:
A traditional logo for a baking company on a solid color background. Include the text Seed .
تکنیکهای پیشرفتهی نگارش سریع
از مثالهای زیر برای ایجاد دستورالعملهای خاصتر بر اساس ویژگیهایی مانند توصیفکنندههای عکاسی، شکلها و مواد، جنبشهای هنری تاریخی و اصلاحکنندههای کیفیت تصویر استفاده کنید.
عکاسی
- این درخواست شامل موارد زیر است: «عکسی از...»
برای استفاده از این سبک، با استفاده از کلمات کلیدی که به وضوح به Imagen میگویند که شما به دنبال یک عکس هستید، شروع کنید. سوالات خود را با «عکسی از...» شروع کنید. به عنوان مثال:
![]() | ![]() | ![]() |
منبع تصویر: هر تصویر با استفاده از متن مربوطه با مدل Imagen 3 تولید شده است.
اصلاحکنندههای عکاسی
در مثالهای زیر، میتوانید چندین اصلاحکننده و پارامتر مخصوص عکاسی را مشاهده کنید. میتوانید برای کنترل دقیقتر، چندین اصلاحکننده را با هم ترکیب کنید.
نزدیکی دوربین - نمای نزدیک، گرفته شده از فاصله دور

پیشنهاد ویژه: عکسی از نمای نزدیک از دانههای قهوه 
نکته: عکس کوچکشده از یک کیسه کوچک
دانههای قهوه در آشپزخانهای نامرتبموقعیت دوربین - هوایی، از پایین

موضوع: عکس هوایی از شهر با آسمانخراشها 
نکته: عکسی از یک سایبان جنگلی با آسمان آبی از پایین نورپردازی - طبیعی، دراماتیک، گرم، سرد

پیشنهاد ویژه: عکس استودیویی از یک صندلی راحتی مدرن، با نورپردازی طبیعی 
نکته: عکس استودیویی از یک صندلی راحتی مدرن، نورپردازی دراماتیک تنظیمات دوربین - تاری حرکت، فوکوس نرم، بوکه، پرتره

سوال: عکسی از شهری با آسمانخراشها از داخل ماشین با تاری حرکتی 
نکته: عکس با فوکوس نرم از پلی در یک شهر در شب انواع لنز - ۳۵ میلیمتری، ۵۰ میلیمتری، فیشآی، واید، ماکرو

سوال: عکس از یک برگ، لنز ماکرو 
موضوع: عکاسی خیابانی، شهر نیویورک، لنز چشم ماهی انواع فیلم - سیاه و سفید، پولاروید

موضوع: عکس پولاروید از سگی که عینک آفتابی زده است 
موضوع: عکس سیاه و سفید از سگی که عینک آفتابی زده است
منبع تصویر: هر تصویر با استفاده از متن مربوطه با مدل Imagen 3 تولید شده است.
تصویرسازی و هنر
- این سوال شامل موارد زیر است: « painting از ...» ، « sketch از ...»
سبکهای هنری از سبکهای تکرنگ مانند طرحهای مدادی تا هنر دیجیتال فوق واقعگرایانه متفاوت است. برای مثال، تصاویر زیر از یک دستورالعمل با سبکهای مختلف استفاده میکنند:
«یک [art style or creation technique] از یک سدان برقی اسپرت زاویهدار با آسمانخراشها در پسزمینه»
![]() | ![]() | ![]() |
![]() | ![]() | ![]() |
منبع تصویر: هر تصویر با استفاده از متن مربوطه با مدل Imagen 2 تولید شده است.
اشکال و مواد
- این سوال شامل موارد زیر است: «...ساخته شده از...» ، «...به شکل...»
یکی از نقاط قوت این فناوری این است که میتوانید تصاویری خلق کنید که در غیر این صورت دشوار یا غیرممکن است. به عنوان مثال، میتوانید لوگوی شرکت خود را با مواد و بافتهای مختلف بازسازی کنید.
![]() | ![]() | ![]() |
منبع تصویر: هر تصویر با استفاده از متن مربوطه با مدل Imagen 3 تولید شده است.
منابع هنری تاریخی
- این عبارت شامل موارد زیر است: «... به سبک ...»
سبکهای خاصی در طول سالها به سبکهای نمادین تبدیل شدهاند. در ادامه ایدههایی از نقاشیهای تاریخی یا سبکهای هنری ارائه شده است که میتوانید امتحان کنید.
«ایجاد تصویری به سبک [art period or movement] : یک مزرعه بادی»
![]() | ![]() | ![]() |
منبع تصویر: هر تصویر با استفاده از متن مربوطه با مدل Imagen 3 تولید شده است.
اصلاحکنندههای کیفیت تصویر
کلمات کلیدی خاصی میتوانند به مدل اطلاع دهند که شما به دنبال یک دارایی با کیفیت بالا هستید. نمونههایی از اصلاحکنندههای کیفیت شامل موارد زیر است:
- اصلاحکنندههای عمومی - با کیفیت بالا، زیبا، دارای سبک
- عکسها - 4K، HDR، عکس استودیویی
- هنر، تصویرسازی - توسط یک متخصص، دقیق
در ادامه چند نمونه از سوالات بدون اصلاحکنندههای کیفیت و همان سوال با اصلاحکنندههای کیفیت آمده است.
![]() | ![]() عکس ساقه ذرت گرفته شده توسط یک عکاس حرفهای |
منبع تصویر: هر تصویر با استفاده از متن مربوطه با مدل Imagen 3 تولید شده است.
نسبتهای ابعاد
تولید تصویر Imagen به شما امکان میدهد پنج نسبت تصویر مجزا تنظیم کنید.
- مربع (۱:۱، پیشفرض) - یک عکس مربع استاندارد. کاربردهای رایج این نسبت ابعاد شامل پستهای رسانههای اجتماعی است.
تمام صفحه (4:3) - این نسبت ابعاد معمولاً در رسانهها یا فیلمها استفاده میشود. همچنین ابعاد اکثر تلویزیونهای قدیمی (غیر عریض) و دوربینهای قطع متوسط نیز همین است. این نسبت، صحنه بیشتری را به صورت افقی ثبت میکند (در مقایسه با 1:1)، و آن را به نسبت ابعادی ترجیحی برای عکاسی تبدیل میکند.

نکته: نمای نزدیک از انگشتان یک نوازنده در حال نواختن پیانو، فیلم سیاه و سفید، قدیمی (نسبت تصویر ۴:۳) 
پیشنهاد: یک عکس استودیویی حرفهای از سیبزمینی سرخکرده برای یک رستوران لوکس، به سبک مجله غذا (نسبت تصویر ۴:۳) حالت تمام صفحه عمودی (۳:۴) - این نسبت تصویر تمام صفحه با چرخش ۹۰ درجه است. این نسبت تصویر به شما امکان میدهد در مقایسه با نسبت تصویر ۱:۱، بخش بیشتری از صحنه را به صورت عمودی ثبت کنید.

نکته: زنی در حال پیادهروی، انعکاس تصویر نزدیک چکمههایش در گودال آب، کوههای بزرگ در پسزمینه، به سبک تبلیغات، زوایای دراماتیک (نسبت تصویر ۳:۴) 
نکته: نمای هوایی از رودخانهای که از درهای عرفانی بالا میرود (نسبت تصویر ۳:۴) صفحه عریض (۱۶:۹) - این نسبت تصویر جایگزین ۴:۳ شده و اکنون رایجترین نسبت تصویر برای تلویزیونها، مانیتورها و صفحه نمایش تلفنهای همراه (افقی) است. وقتی میخواهید قسمت بیشتری از پسزمینه را ثبت کنید (مثلاً مناظر طبیعی)، از این نسبت تصویر استفاده کنید.

نکته: مردی با لباسهای تماماً سفید که در ساحل نشسته است، نمای نزدیک، نورپردازی ساعت طلایی (نسبت تصویر ۱۶:۹) عمودی (۹:۱۶) - این نسبت تصویر، صفحه عریض است اما چرخیده است. این نسبت تصویر، نسبت تصویر نسبتاً جدیدی است که توسط برنامههای ویدیویی کوتاه (مثلاً ویدیوهای کوتاه یوتیوب) رواج یافته است. از این نسبت تصویر برای اشیاء بلند با جهتگیری عمودی قوی مانند ساختمانها، درختان، آبشارها یا سایر اشیاء مشابه استفاده کنید.

نکته: رندر دیجیتالی از یک آسمانخراش عظیم، مدرن، باشکوه، حماسی با غروب خورشید زیبا در پسزمینه (نسبت تصویر ۹:۱۶)
تصاویر واقعگرایانه
نسخههای مختلف مدل تولید تصویر ممکن است ترکیبی از خروجی هنری و واقعگرایانه ارائه دهند. از عبارت زیر در دستورالعملها برای تولید خروجی واقعگرایانهتر، بر اساس موضوعی که میخواهید تولید کنید، استفاده کنید.
| مورد استفاده | نوع لنز | فواصل کانونی | جزئیات تکمیلی |
|---|---|---|---|
| مردم (پرتره) | پرایم، زوم | ۲۴-۳۵ میلیمتر | فیلم سیاه و سفید، فیلم نوآر، عمق میدان، دو رنگ (دو رنگ را ذکر کنید) |
| غذا، حشرات، گیاهان (اشیاء، طبیعت بیجان) | ماکرو | ۶۰-۱۰۵ میلیمتر | جزئیات بالا، فوکوس دقیق، نورپردازی کنترلشده |
| ورزش، حیات وحش (حرکت) | زوم تله فوتو | ۱۰۰-۴۰۰ میلیمتر | سرعت شاتر بالا، ردیابی حرکت یا اکشن |
| نجومی، منظره (زاویه باز) | زاویه دید عریض | ۱۰-۲۴ میلیمتر | زمان نوردهی طولانی، فوکوس دقیق، نوردهی طولانی، آب یا ابرهای نرم |
پرترهها
| مورد استفاده | نوع لنز | فواصل کانونی | جزئیات تکمیلی |
|---|---|---|---|
| مردم (پرتره) | پرایم، زوم | ۲۴-۳۵ میلیمتر | فیلم سیاه و سفید، فیلم نوآر، عمق میدان، دو رنگ (دو رنگ را ذکر کنید) |
با استفاده از چندین کلمه کلیدی از جدول، Imagen میتواند پرترههای زیر را تولید کند:
![]() | ![]() | ![]() | ![]() |
نکته: یک زن، پرتره ۳۵ میلیمتری، دو رنگ آبی و خاکستری
مدل: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
پیشنهاد: یک زن، پرتره ۳۵ میلیمتری، فیلم نوآر
مدل: imagen-3.0-generate-002
اشیاء
| مورد استفاده | نوع لنز | فواصل کانونی | جزئیات تکمیلی |
|---|---|---|---|
| غذا، حشرات، گیاهان (اشیاء، طبیعت بیجان) | ماکرو | ۶۰-۱۰۵ میلیمتر | جزئیات بالا، فوکوس دقیق، نورپردازی کنترلشده |
با استفاده از چندین کلمه کلیدی از جدول، Imagen میتواند تصاویر شیء زیر را تولید کند:
![]() | ![]() | ![]() | ![]() |
نکته: برگ گیاه دعا، لنز ماکرو، ۶۰ میلیمتری
مدل: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
نکته: یک بشقاب پاستا، لنز ماکرو ۱۰۰ میلیمتری
مدل: imagen-3.0-generate-002
حرکت
| مورد استفاده | نوع لنز | فواصل کانونی | جزئیات تکمیلی |
|---|---|---|---|
| ورزش، حیات وحش (حرکت) | زوم تله فوتو | ۱۰۰-۴۰۰ میلیمتر | سرعت شاتر بالا، ردیابی حرکت یا اکشن |
با استفاده از چندین کلمه کلیدی از جدول، Imagen میتواند تصاویر متحرک زیر را تولید کند:
![]() | ![]() | ![]() | ![]() |
نکته: یک فرود برنده، سرعت شاتر بالا، ردیابی حرکت
مدل: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
نکته: دویدن یک گوزن در جنگل، سرعت شاتر بالا، ردیابی حرکت
مدل: imagen-3.0-generate-002
زاویه دید عریض
| مورد استفاده | نوع لنز | فواصل کانونی | جزئیات تکمیلی |
|---|---|---|---|
| نجومی، منظره (زاویه باز) | زاویه دید عریض | ۱۰-۲۴ میلیمتر | زمان نوردهی طولانی، فوکوس دقیق، نوردهی طولانی، آب یا ابرهای نرم |
با استفاده از چندین کلمه کلیدی از جدول، Imagen میتواند تصاویر زاویه باز زیر را تولید کند:
![]() | ![]() | ![]() | ![]() |
نکته: یک رشته کوه پهناور، منظره با زاویه دید عریض ۱۰ میلیمتر
مدل: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
نکته: عکسی از ماه، عکاسی نجومی، لنز واید ۱۰ میلیمتری
مدل: imagen-3.0-generate-002
نسخههای مدل
تصویر ۴
| ملک | توضیحات |
|---|---|
| کد مدل | رابط برنامهنویسی کاربردی Gemini |
| انواع داده پشتیبانی شده را | ورودی متن خروجی تصاویر |
| محدودیتهای توکن [*] | محدودیت توکن ورودی ۴۸۰ توکن (متن) تصاویر خروجی ۱ تا ۴ (فوقالعاده/استاندارد/سریع) |
| آخرین بهروزرسانی | ژوئن ۲۰۲۵ |
تصویر ۳
| ملک | توضیحات |
|---|---|
| کد مدل | رابط برنامهنویسی کاربردی Gemini |
| انواع داده پشتیبانی شده را | ورودی متن خروجی تصاویر |
| محدودیتهای توکن [*] | محدودیت توکن ورودی ناموجود تصاویر خروجی تا ۴ |
| آخرین بهروزرسانی | فوریه ۲۰۲۵ |





















































