برای استفاده از Imagen باید توضیح متنی از آنچه می خواهید تولید کنید ارائه دهید. به این توضیحات دستورات گفته می شود و این اعلان ها راه اصلی ارتباط شما با Imagen هستند.
این راهنما به شما نشان میدهد که چگونه اصلاح بخشهایی از دستور متن به تصویر میتواند نتایج متفاوتی ایجاد کند و نمونههایی از تصاویری را که میتوانید ایجاد کنید به شما ارائه میدهد.
اصول اولیه نوشتن سریع (موضوع، زمینه و سبک)
در حالی که راههای زیادی برای نوشتن یک درخواست خوب وجود دارد، افزودن برخی از کلیدواژهها و اصلاحکنندهها به شما کمک میکند به هدف نهایی خود نزدیکتر شوید. درخواستها نیازی به طولانی یا پیچیده بودن ندارند، اما بیشتر اعلانهای خوب توصیفی و واضح هستند.
یک نقطه شروع خوب می تواند فکر کردن به موضوع ، زمینه و سبک باشد.
![سریع با تاکید بر موضوع، زمینه و سبک](https://ai.google.dev/static/gemini-api/docs/images/imagen/style-subject-context.png?hl=fa)
موضوع : اولین چیزی که باید با هر درخواستی به آن فکر کنید، موضوع است: شی، شخص، حیوان یا مناظری که میخواهید تصویری از آن داشته باشید.
زمینه و پس زمینه: به همان اندازه مهم است که پس زمینه یا زمینه ای که موضوع در آن قرار می گیرد. سعی کنید سوژه خود را در پس زمینه های مختلف قرار دهید. به عنوان مثال، یک استودیو با پس زمینه سفید، در فضای باز یا محیط های داخلی.
Style: در نهایت سبک تصویر مورد نظر خود را اضافه کنید. سبک ها می توانند کلی باشند (نقاشی، عکس، طرح) یا بسیار خاص (نقاشی پاستل، طراحی زغال چوب، ایزومتریک سه بعدی). شما همچنین می توانید سبک ها را ترکیب کنید.
بعد از اینکه اولین نسخه درخواست خود را نوشتید، درخواست خود را با افزودن جزئیات بیشتر اصلاح کنید تا زمانی که به تصویر مورد نظر خود برسید. تکرار مهم است. با ایجاد ایده اصلی خود شروع کنید، و سپس آن ایده اصلی را اصلاح و گسترش دهید تا زمانی که تصویر تولید شده به دید شما نزدیک شود.
![]() | ![]() | ![]() |
نگارش سریع تصویر 3
Imagen 3 می تواند ایده های شما را به تصاویر دقیق تبدیل کند، خواه درخواست های شما کوتاه باشند یا طولانی و با جزئیات. دید خود را از طریق درخواست های تکراری اصلاح کنید، جزئیات را تا زمانی که به نتیجه عالی برسید اضافه کنید.
اعلان های کوتاه به شما امکان می دهد به سرعت یک تصویر ایجاد کنید. ![]() | درخواست های طولانی تر به شما امکان می دهد جزئیات خاصی را اضافه کنید و تصویر خود را بسازید. ![]() |
توصیه های اضافی برای نوشتن سریع Imagen 3:
- از زبان توصیفی استفاده کنید : از صفت ها و قیدهای دقیق برای ترسیم تصویر واضح برای Imagen 3 استفاده کنید.
- زمینه را ارائه دهید : در صورت لزوم، اطلاعات پس زمینه را برای کمک به درک هوش مصنوعی اضافه کنید.
- ارجاع به هنرمندان یا سبک های خاص : اگر زیبایی شناسی خاصی در ذهن دارید، ارجاع به هنرمندان یا جنبش های هنری خاص می تواند مفید باشد.
- از ابزارهای مهندسی سریع استفاده کنید : کاوش در ابزارها یا منابع مهندسی سریع را در نظر بگیرید تا به شما کمک کنند تا درخواست های خود را اصلاح کنید و به نتایج مطلوب برسید.
- بهبود جزئیات صورت در تصاویر شخصی و گروهی :
- جزئیات صورت را به عنوان فوکوس عکس مشخص کنید (به عنوان مثال، از کلمه "پرتره" در اعلان استفاده کنید).
تولید متن در تصاویر
توانایی Imagen 3 برای افزودن متن به تصاویر شما، امکان تولید تصویر خلاقانه را باز می کند. برای استفاده بیشتر از این ویژگی از راهنمایی زیر استفاده کنید:
- با اطمینان تکرار کنید : ممکن است مجبور شوید تصاویر را بازسازی کنید تا زمانی که به ظاهری که میخواهید برسید. ادغام متن Imagen هنوز در حال تکامل است و گاهی اوقات تلاش های متعدد بهترین نتایج را به همراه دارد.
- کوتاه نگه دارید : برای تولید بهینه، متن را به 25 کاراکتر یا کمتر محدود کنید.
عبارات چندگانه : برای ارائه اطلاعات اضافی، دو یا سه عبارت مجزا را آزمایش کنید. برای ترکیبات تمیزتر از بیش از سه عبارت خودداری کنید.
درخواست: پوستری با متن "Summerland" با فونت درشت به عنوان عنوان، زیر این متن شعار "تابستان هرگز احساس خوبی نداشت" است. قرار دادن راهنما : در حالی که Imagen می تواند سعی کند متن را مطابق دستور قرار دهد، شما باید انتظار تغییرات گاه به گاه را داشته باشید. این ویژگی به طور مداوم در حال بهبود است.
سبک قلم الهام بخش : یک سبک فونت کلی را مشخص کنید تا به طور نامحسوسی بر انتخاب های Imagen تأثیر بگذارد. به تکثیر دقیق فونت تکیه نکنید، بلکه انتظار تفسیرهای خلاقانه را داشته باشید.
اندازه قلم : اندازه قلم یا نشانه کلی اندازه (مثلاً کوچک ، متوسط ، بزرگ ) را برای تأثیرگذاری بر تولید اندازه قلم مشخص کنید.
پارامترسازی سریع
برای کنترل بهتر نتایج خروجی، ممکن است پارامترسازی ورودی ها در Imagen مفید باشد. برای مثال، فرض کنید میخواهید مشتریان شما بتوانند برای کسبوکار خود لوگو تولید کنند و میخواهید مطمئن شوید که آرمها همیشه روی یک پسزمینه تک رنگ تولید میشوند. همچنین میخواهید گزینههایی را که مشتری میتواند از یک منو انتخاب کند، محدود کنید.
در این مثال میتوانید یک اعلان پارامتری شبیه به زیر ایجاد کنید:
A{logo_style} logo for a{company_area} company on a solid color background. Include the text{company_name} .
در رابط کاربری سفارشی شما، مشتری میتواند پارامترها را با استفاده از یک منو وارد کند و مقدار انتخابی آنها، درخواستی را که Imagen دریافت میکند پر میکند.
به عنوان مثال:
Prompt:
A minimalist logo for a health care company on a solid color background. Include the text Journey .
Prompt:
A modern logo for a software company on a solid color background. Include the text Silo .
Prompt:
A traditional logo for a baking company on a solid color background. Include the text Seed .
سبک: عکاسی
- درخواست شامل: "یک عکس از..."
برای استفاده از این سبک، با استفاده از کلمات کلیدی که به وضوح به Imagen می گویند که به دنبال عکس هستید، شروع کنید. درخواست های خود را با "عکسی از ..." شروع کنید. . به عنوان مثال:
![]() | ![]() | ![]() |
منبع تصویر: هر تصویر با استفاده از متن متناظر با مدل Imagen 3 تولید شده است.
سبک: تصویرسازی و هنر
- درخواست شامل: "یک painting از..." ، "یک sketch از..."
سبکهای هنری از سبکهای تک رنگ مانند طرحهای مداد گرفته تا هنر دیجیتال فوقالعاده متفاوت است. به عنوان مثال، تصاویر زیر از همان دستور با سبک های مختلف استفاده می کنند:
"یک [art style or creation technique] یک سدان الکتریکی اسپرت زاویه دار با آسمان خراش ها در پس زمینه"
![]() | ![]() | ![]() |
![]() | ![]() | ![]() |
منبع تصویر: هر تصویر با استفاده از متن متناظر با مدل Imagen 2 تولید شده است.
تکنیک های پیشرفته نوشتن سریع
از مثالهای زیر برای ایجاد اعلانهای خاصتر بر اساس ویژگیها استفاده کنید: توصیفگرهای عکاسی، اشکال و مواد، حرکات هنری تاریخی، و اصلاحکنندههای کیفیت تصویر.
اصلاح کننده های عکاسی
در مثال های زیر می توانید چندین تغییر دهنده و پارامتر مخصوص عکاسی را مشاهده کنید. برای کنترل دقیق تر، می توانید چندین اصلاح کننده را ترکیب کنید.
نزدیکی دوربین - از نزدیک، از دور گرفته شده است
درخواست: عکسی از دانه های قهوه از نمای نزدیک درخواست: یک عکس کوچکنمایی شده از یک کیسه کوچک
دانه های قهوه در آشپزخانه ای نامرتبموقعیت دوربین - هوایی، از پایین
اعلان: عکس هوایی از شهر شهری با آسمان خراش ها اعلان: عکسی از سایه بان جنگل با آسمان آبی از پایین نورپردازی - طبیعی، دراماتیک، گرم، سرد
اعلان: عکس استودیویی از یک صندلی بازویی مدرن، نور طبیعی درخواست: عکس استودیویی از یک صندلی بازویی مدرن، نورپردازی چشمگیر تنظیمات دوربین - تاری حرکت، فوکوس نرم، بوکه، پرتره
اعلان: عکس شهری با آسمانخراشها از داخل خودرو با تاری حرکت درخواست: عکس با فوکوس نرم از یک پل در یک شهر شهری در شب انواع لنز - 35 میلی متر، 50 میلی متر، چشم ماهی، زاویه باز، ماکرو
درخواست: عکس یک برگ، لنز ماکرو درخواست: عکاسی خیابانی، شهر نیویورک، لنز چشم ماهی انواع فیلم - سیاه و سفید، پولاروید
اعلان: پرتره پلاروید از سگی که عینک آفتابی دارد اعلان: عکس سیاه و سفید سگی که عینک آفتابی زده است
منبع تصویر: هر تصویر با استفاده از متن متناظر با مدل Imagen 3 تولید شده است.
اشکال و مواد
- اعلان شامل: "...ساخته شده از..." ، "...به شکل..."
یکی از نقاط قوت این فناوری این است که می توانید تصاویری ایجاد کنید که در غیر این صورت دشوار یا غیرممکن است. به عنوان مثال، می توانید لوگوی شرکت خود را در مواد و بافت های مختلف بازسازی کنید.
![]() | ![]() | ![]() |
منبع تصویر: هر تصویر با استفاده از متن متناظر با مدل Imagen 3 تولید شده است.
ارجاعات هنر تاریخی
- اعلان شامل: "...به سبک..."
برخی از سبک ها در طول سال ها تبدیل به نماد شده اند. در زیر ایده هایی از نقاشی تاریخی یا سبک های هنری وجود دارد که می توانید آنها را امتحان کنید.
"تصویر را به سبک [art period or movement] ایجاد کنید: مزرعه بادی"
![]() | ![]() | ![]() |
منبع تصویر: هر تصویر با استفاده از متن متناظر با مدل Imagen 3 تولید شده است.
اصلاح کننده های کیفیت تصویر
برخی از کلمات کلیدی می توانند به مدل بفهمانند که شما به دنبال دارایی با کیفیت بالا هستید. نمونه هایی از اصلاح کننده های کیفیت عبارتند از:
- اصلاح کننده های عمومی - با کیفیت بالا، زیبا، شیک
- عکس - 4K، HDR، عکس استودیو
- هنر، تصویرسازی - توسط یک حرفه ای، دقیق
در زیر چند نمونه از اعلانهای بدون تعدیلکننده کیفیت و همان اعلان با اصلاحکنندههای کیفیت آورده شده است.
![]() | ![]() عکس ساقه ذرت که توسط a عکاس حرفه ای |
منبع تصویر: هر تصویر با استفاده از متن متناظر با مدل Imagen 3 تولید شده است.
نسبت ابعاد
تولید تصویر Imagen 3 به شما امکان می دهد پنج نسبت تصویر متمایز را تنظیم کنید.
- مربع (1:1، پیش فرض) - یک عکس مربع استاندارد. استفاده های رایج برای این نسبت ابعاد شامل پست های رسانه های اجتماعی است.
تمام صفحه (4:3) - این نسبت تصویر معمولاً در رسانه یا فیلم استفاده می شود. همچنین ابعاد اکثر تلویزیون های قدیمی (غیر عریض) و دوربین های مدیوم فرمت است. بیشتر صحنه را به صورت افقی می گیرد (در مقایسه با 1:1) که آن را به نسبت تصویر ترجیحی برای عکاسی تبدیل می کند.
درخواست: از نزدیک انگشتان یک نوازنده در حال نواختن پیانو، فیلم سیاه و سفید، قدیمی (نسبت تصویر 4:3) درخواست: یک عکس آتلیه ای حرفه ای از سیب زمینی سرخ کرده برای یک رستوران سطح بالا، به سبک مجله غذایی (نسبت تصویر 4:3) تمام صفحه پرتره (3:4) - این نسبت تصویر تمام صفحه است که 90 درجه چرخیده است. این اجازه می دهد تا در مقایسه با نسبت تصویر 1:1، صحنه بیشتری را به صورت عمودی ثبت کنید.
اعلان: زنی در حال پیادهروی، بستن چکمههایش در گودال، کوههای بزرگ در پسزمینه، به سبک تبلیغات، زوایای دراماتیک (نسبت تصویر 3:4) درخواست: عکس هوایی از رودخانه ای که از دره عرفانی جاری می شود (نسبت تصویر 3:4) صفحه عریض (16:9) - این نسبت جایگزین 4:3 شده است و اکنون رایج ترین نسبت تصویر برای تلویزیون ها، مانیتورها و صفحه نمایش تلفن های همراه (منظره) است. زمانی که می خواهید بیشتر پس زمینه را ثبت کنید (مثلاً مناظر منظره) از این نسبت تصویر استفاده کنید.
اعلان: مردی با لباس های تمام سفید در ساحل نشسته، از نزدیک، نور ساعت طلایی (نسبت تصویر 16:9) پرتره (9:16) - این نسبت صفحه عریض است اما چرخشی است. این نسبت ابعاد نسبتاً جدیدی است که توسط برنامههای ویدیویی کوتاه (مثلاً شورتهای یوتیوب) رایج شده است. از این برای اجسام بلند با جهت های عمودی قوی مانند ساختمان ها، درختان، آبشارها یا سایر اشیاء مشابه استفاده کنید.
Prompt: رندر دیجیتالی از یک آسمان خراش عظیم، مدرن، بزرگ، حماسی با غروب زیبا در پس زمینه (نسبت تصویر 9:16)
تصاویر فوتورئالیستی
نسخه های مختلف مدل تولید تصویر ممکن است ترکیبی از خروجی هنری و فوتورئالیستی را ارائه دهند. برای ایجاد خروجی واقعی تری بر اساس موضوعی که می خواهید ایجاد کنید، از عبارت زیر در دستورات استفاده کنید.
مورد استفاده | نوع لنز | فواصل کانونی | جزئیات اضافی |
---|---|---|---|
مردم (پرتره) | پرایم، بزرگنمایی | 24-35 میلی متر | فیلم سیاه و سفید، فیلم نوآر، عمق میدان، دو رنگ (ذکر دو رنگ) |
غذا، حشرات، گیاهان (اشیاء، طبیعت بی جان) | ماکرو | 60-105 میلی متر | جزئیات بالا، فوکوس دقیق، نور کنترل شده |
ورزش، حیات وحش (حرکت) | زوم تله فوتو | 100-400 میلی متر | سرعت شاتر سریع، ردیابی حرکت یا حرکت |
نجومی، منظره (زاویه باز) | زاویه باز | 10-24 میلی متر | زمان نوردهی طولانی، فوکوس واضح، نوردهی طولانی، آب صاف یا ابر |
پرتره ها
مورد استفاده | نوع لنز | فواصل کانونی | جزئیات اضافی |
---|---|---|---|
افراد (پرتره) | پرایم، بزرگنمایی | 24-35 میلی متر | فیلم سیاه و سفید، فیلم نوآر، عمق میدان، دو رنگ (ذکر دو رنگ) |
Imagen با استفاده از چندین کلمه کلیدی از جدول می تواند پرتره های زیر را ایجاد کند.
![]() | ![]() | ![]() | ![]() |
اعلان: یک زن، پرتره 35 میلی متری، دوتونی آبی و خاکستری
مدل: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
درخواست: یک زن، پرتره 35 میلی متری، فیلم نوآر
مدل: imagen-3.0-generate-002
اشیاء
مورد استفاده | نوع لنز | فواصل کانونی | جزئیات اضافی |
---|---|---|---|
غذا، حشرات، گیاهان (اشیاء، طبیعت بی جان) | ماکرو | 60-105 میلی متر | جزئیات بالا، فوکوس دقیق، نور کنترل شده |
Imagen با استفاده از چندین کلمه کلیدی از جدول می تواند تصاویر شیء زیر را ایجاد کند.
![]() | ![]() | ![]() | ![]() |
اعلان: برگ گیاه دعا، لنز ماکرو، 60 میلی متر
مدل: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
درخواست: یک بشقاب پاستا، لنز ماکرو 100 میلیمتری
مدل: imagen-3.0-generate-002
حرکت
مورد استفاده | نوع لنز | فواصل کانونی | جزئیات اضافی |
---|---|---|---|
ورزش، حیات وحش (حرکت) | زوم تله فوتو | 100-400 میلی متر | سرعت شاتر سریع، ردیابی حرکت یا حرکت |
Imagen با استفاده از چندین کلمه کلیدی از جدول می تواند تصاویر متحرک زیر را تولید کند.
![]() | ![]() | ![]() | ![]() |
اعلان: تاچ داون برنده، سرعت شاتر سریع، ردیابی حرکت
مدل: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
اعلان: آهویی که در جنگل می دود، سرعت شاتر سریع، ردیابی حرکت
مدل: imagen-3.0-generate-002
زاویه باز
مورد استفاده | نوع لنز | فواصل کانونی | جزئیات اضافی |
---|---|---|---|
نجومی، منظره (زاویه باز) | زاویه باز | 10-24 میلی متر | زمان نوردهی طولانی، فوکوس واضح، نوردهی طولانی، آب صاف یا ابر |
با استفاده از چندین کلمه کلیدی از جدول، Imagen می تواند تصاویر زاویه باز زیر را ایجاد کند.
![]() | ![]() | ![]() | ![]() |
اعلان: یک رشته کوه گسترده، چشم انداز با زاویه وسیع 10 میلی متر
مدل: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
اعلان: عکسی از ماه، عکاسی نجومی، زاویه باز 10 میلی متر
مدل: imagen-3.0-generate-002