Për të përdorur Imagen duhet të jepni një përshkrim teksti të asaj që dëshironi të gjeneroni. Këto përshkrime quhen kërkesa , dhe këto kërkesa janë mënyra kryesore e komunikimit me Imagen.
Ky udhëzues ju tregon se si modifikimi i pjesëve të një mesazhi tekst-në-imazh mund të prodhojë rezultate të ndryshme dhe ju jep shembuj të imazheve që mund të krijoni.
Bazat e shkrimit të menjëhershëm (subjekti, konteksti dhe stili)
Ndërsa ka shumë mënyra për të shkruar një kërkesë të mirë, duke shtuar disa fjalë kyçe dhe modifikues do t'ju ndihmojë t'i afroheni qëllimit tuaj përfundimtar. Kërkesat nuk duhet të jenë të gjata ose komplekse, por shumica e kërkesave të mira janë përshkruese dhe të qarta.
Një pikënisje e mirë mund të jetë të mendosh për temën , kontekstin dhe stilin .
![Njoftoni me temën, kontekstin dhe stilin e theksuar](https://ai.google.dev/static/gemini-api/docs/images/imagen/style-subject-context.png?hl=sq)
Tema : Gjëja e parë për të cilën duhet të mendoni me çdo kërkesë është tema : objekti, personi, kafsha ose peizazhi që dëshironi një imazh.
Konteksti dhe sfondi: Po aq i rëndësishëm është sfondi ose konteksti në të cilin do të vendoset subjekti. Provoni ta vendosni subjektin tuaj në sfonde të ndryshme. Për shembull, një studio me sfond të bardhë, në ambiente të jashtme ose të brendshme.
Stili: Së fundi, shtoni stilin e imazhit që dëshironi. Stilet mund të jenë të përgjithshme (pikturë, fotografi, skica) ose shumë specifike (pikturë pastel, vizatim me qymyr, izometrik 3D). Ju gjithashtu mund të kombinoni stilet.
Pasi të shkruani një version të parë të kërkesës suaj, rafinoni kërkesën tuaj duke shtuar më shumë detaje derisa të arrini te imazhi që dëshironi. Përsëritja është e rëndësishme. Filloni duke krijuar idenë tuaj bazë, dhe më pas përsojeni dhe zgjeroni atë ide thelbësore derisa imazhi i krijuar të jetë afër vizionit tuaj.
![]() | ![]() | ![]() |
Shkrimi i shpejtë i imazhit 3
Imagen 3 mund t'i transformojë idetë tuaja në imazhe të detajuara, pavarësisht nëse kërkesat tuaja janë të shkurtra apo të gjata dhe të detajuara. Përsosni vizionin tuaj nëpërmjet nxitjes përsëritëse, duke shtuar detaje derisa të arrini rezultatin perfekt.
Kërkesat e shkurtra ju lejojnë të krijoni një imazh shpejt. ![]() | Kërkesat më të gjata ju lejojnë të shtoni detaje specifike dhe të ndërtoni imazhin tuaj. ![]() |
Këshilla shtesë për shkrimin e shpejtë të Imagen 3:
- Përdorni gjuhën përshkruese : Përdorni mbiemra dhe ndajfolje të detajuara për të dhënë një pamje të qartë për Imagen 3.
- Jepni kontekstin : Nëse është e nevojshme, përfshini informacione bazë për të ndihmuar të kuptuarit e AI.
- Referojuni artistëve ose stileve specifike : Nëse keni një estetikë të veçantë në mendje, referimi i artistëve ose lëvizjeve të veçanta të artit mund të jetë i dobishëm.
- Përdorni mjete të menjëhershme inxhinierike : Merrni parasysh eksplorimin e mjeteve ose burimeve të shpejta inxhinierike për t'ju ndihmuar të rafinoni kërkesat tuaja dhe të arrini rezultate optimale.
- Përmirësimi i detajeve të fytyrës në imazhet tuaja personale dhe grupore :
- Specifikoni detajet e fytyrës si fokus të fotografisë (për shembull, përdorni fjalën "portret" në kërkesë).
Gjeneroni tekst në imazhe
Aftësia e Imagen 3 për të shtuar tekst në imazhet tuaja hap mundësi krijuese të krijimit të imazheve. Përdorni udhëzimet e mëposhtme për të përfituar sa më shumë nga kjo veçori:
- Përsëriteni me besim : Mund t'ju duhet të rigjeneroni imazhet derisa të arrini pamjen që dëshironi. Integrimi i tekstit të Imagen është ende në zhvillim, dhe nganjëherë përpjekjet e shumta japin rezultatet më të mira.
- Mbajeni të shkurtër : Kufizoni tekstin në 25 karaktere ose më pak për gjenerim optimal.
Fraza të shumta : Eksperimentoni me dy ose tre fraza të ndryshme për të dhënë informacion shtesë. Shmangni tejkalimin e tre frazave për kompozime më të pastra.
Prompt: Një poster me tekstin "Summerland" me shkronja të zeza si titull, poshtë këtij teksti është slogani "Summer never ndjerë kaq mirë" Vendosja e udhëzuesit : Ndërsa Imagen mund të përpiqet të pozicionojë tekstin sipas udhëzimeve, ju duhet të prisni ndryshime të herëpashershme. Kjo veçori po përmirësohet vazhdimisht.
Frymëzoni stilin e shkronjave : Specifikoni një stil të përgjithshëm fonti për të ndikuar në mënyrë delikate në zgjedhjet e Imagen. Mos u mbështetni në përsëritjen e saktë të shkronjave, por prisni interpretime krijuese.
Madhësia e shkronjave : Specifikoni një madhësi fonti ose një tregues të përgjithshëm të madhësisë (për shembull, i vogël , i mesëm , i madh ) për të ndikuar në gjenerimin e madhësisë së shkronjave.
Parametrizim i menjëhershëm
Për të kontrolluar më mirë rezultatet e daljes, mund të jetë e dobishme të parametrizoni hyrjet në Imagen. Për shembull, supozoni se dëshironi që klientët tuaj të jenë në gjendje të gjenerojnë logo për biznesin e tyre dhe dëshironi të siguroheni që logot të krijohen gjithmonë në një sfond me ngjyra të forta. Ju gjithashtu dëshironi të kufizoni opsionet që klienti mund të zgjedhë nga një menu.
Në këtë shembull, ju mund të krijoni një kërkesë të parametrizuar të ngjashme me sa vijon:
A{logo_style} logo for a{company_area} company on a solid color background. Include the text{company_name} .
Në ndërfaqen tuaj të personalizuar të përdoruesit, klienti mund të futë parametrat duke përdorur një meny dhe vlera e tyre e zgjedhur plotëson kërkesën që merr Imagen.
Për shembull:
Prompt:
A minimalist logo for a health care company on a solid color background. Include the text Journey .
Prompt:
A modern logo for a software company on a solid color background. Include the text Silo .
Prompt:
A traditional logo for a baking company on a solid color background. Include the text Seed .
Stili: fotografi
- Prompti përfshin: "Një foto e..."
Për të përdorur këtë stil, filloni me përdorimin e fjalëve kyçe që i tregojnë qartë Imagen se po kërkoni një fotografi. Filloni kërkesat tuaja me "Një foto e ...." . Për shembull:
![]() | ![]() | ![]() |
Burimi i imazhit: Çdo imazh u krijua duke përdorur kërkesën përkatëse të tekstit me modelin Imagen 3.
Stili: ilustrim dhe art
- Prompti përfshin: "Një painting e..." , "Një sketch e..."
Stilet e artit ndryshojnë nga stilet njëngjyrëshe si skicat me laps, deri te arti dixhital hiper-realist. Për shembull, imazhet e mëposhtme përdorin të njëjtën kërkesë me stile të ndryshme:
"Një [art style or creation technique] i një sedani elektrik sportiv këndor me rrokaqiejt në sfond"
![]() | ![]() | ![]() |
![]() | ![]() | ![]() |
Burimi i imazhit: Çdo imazh u krijua duke përdorur kërkesën përkatëse të tekstit me modelin Imagen 2.
Teknika të avancuara të shkrimit të shpejtë
Përdorni shembujt e mëposhtëm për të krijuar kërkesa më specifike bazuar në atributet: përshkruesit e fotografisë, format dhe materialet, lëvizjet e artit historik dhe modifikuesit e cilësisë së imazhit.
Modifikuesit e fotografisë
Në shembujt e mëposhtëm, mund të shihni disa modifikues dhe parametra specifikë të fotografisë. Ju mund të kombinoni modifikues të shumtë për kontroll më të saktë.
Afërsia me kamerën - nga afër, e marrë nga larg
Prompt: Një foto nga afër e kokrrave të kafesë Prompt: Një foto e zmadhuar e një çantë të vogël të
kokrra kafeje në një kuzhinë të çrregulltPozicioni i kamerës - ajrore, nga poshtë
Prompt: foto ajrore e qytetit urban me rrokaqiejt Prompt: Një foto e një tende pylli me qiell blu nga poshtë Ndriçimi - natyral, dramatik, i ngrohtë, i ftohtë
Prompt: foto në studio e një karrige moderne, ndriçim natyral Prompt: foto në studio e një karrige moderne, ndriçim dramatik Cilësimet e kamerës - turbullim i lëvizjes, fokus i butë, bokeh, portret
Prompt: foto e një qyteti me rrokaqiej nga pjesa e brendshme e një makine me turbullim lëvizjeje Prompt: fotografi me fokus të butë të një ure në një qytet urban gjatë natës Llojet e lenteve - 35mm, 50mm, fisheye, kënd të gjerë, makro
Prompt: foto e një gjetheje, lente makro Prompt: fotografi në rrugë, New York City, lente fisheye Llojet e filmit - bardh e zi, polaroid
Prompt: një portret polaroid i një qeni që mban syze dielli Prompt: foto bardh e zi e një qeni me syze dielli
Burimi i imazhit: Çdo imazh u krijua duke përdorur kërkesën përkatëse të tekstit me modelin Imagen 3.
Format dhe materialet
- Prompti përfshin: "...i bërë nga..." , "...në formën e..."
Një nga pikat e forta të kësaj teknologjie është se ju mund të krijoni imazhe që përndryshe janë të vështira ose të pamundura. Për shembull, ju mund të rikrijoni logon e kompanisë tuaj në materiale dhe tekstura të ndryshme.
![]() | ![]() | ![]() |
Burimi i imazhit: Çdo imazh u krijua duke përdorur kërkesën përkatëse të tekstit me modelin Imagen 3.
Referencat e artit historik
- Prompti përfshin: "...në stilin e..."
Disa stile janë bërë ikonë me kalimin e viteve. Më poshtë janë disa ide të pikturës historike ose stileve të artit që mund të provoni.
"gjeneroni një imazh në stilin e [art period or movement] : një fermë me erë"
![]() | ![]() | ![]() |
Burimi i imazhit: Çdo imazh u krijua duke përdorur kërkesën përkatëse të tekstit me modelin Imagen 3.
Modifikuesit e cilësisë së imazhit
Disa fjalë kyçe mund t'i bëjnë të ditur modelit se po kërkoni një aset me cilësi të lartë. Shembuj të modifikuesve të cilësisë përfshijnë si më poshtë:
- Modifikues të përgjithshëm - me cilësi të lartë, të bukur, të stilizuar
- Fotografitë - 4K, HDR, Studio Foto
- Art, Ilustrim - nga një profesionist, i detajuar
Më poshtë janë disa shembuj të kërkesave pa modifikues të cilësisë dhe e njëjta kërkesë me modifikues të cilësisë.
![]() | ![]() foto e një kërcell misri të marrë nga një fotograf profesionist |
Burimi i imazhit: Çdo imazh u krijua duke përdorur kërkesën përkatëse të tekstit me modelin Imagen 3.
Raportet e aspektit
Gjenerimi i imazhit Imagen 3 ju lejon të vendosni pesë raporte të dallueshme të pamjes së imazhit.
- Sheshi (1:1, i paracaktuar) - Një foto standarde katrore. Përdorimet e zakonshme për këtë raport aspekti përfshijnë postimet në mediat sociale.
Ekrani i plotë (4:3) - Ky raport i pamjes përdoret zakonisht në media ose film. Janë gjithashtu dimensionet e shumicës së televizorëve të vjetër (jo me ekran të gjerë) dhe kamerave me format të mesëm. Ai kap më shumë nga skena horizontalisht (krahasuar me 1:1), duke e bërë atë një raport të preferuar të pamjes për fotografimin.
Kërkim: nga afër gishtat e një muzikanti që luan në piano, film bardh e zi, vintage (raporti i pamjes 4:3) Prompt: Një foto profesionale në studio e patate të skuqura për një restorant të nivelit të lartë, në stilin e një reviste ushqimore (raporti i pamjes 4:3) Portret në ekran të plotë (3:4) - Ky është raporti i pamjes së ekranit të plotë i rrotulluar 90 gradë. Kjo ju lejon të kapni më shumë skenë vertikalisht në krahasim me raportin e pamjes 1:1.
Njoftim: një grua në shëtitje, mbyllja e çizmeve të saj të pasqyruara në një pellg, male të mëdha në sfond, në stilin e një reklame, kënde dramatike (raporti i pamjes 3:4) Kërkesa: shkrepje ajrore e një lumi që rrjedh në një luginë mistike (raporti i pamjes 3:4) Ekrani i gjerë (16:9) - Ky raport ka zëvendësuar 4:3 dhe tani është raporti më i zakonshëm i pamjes për televizorët, monitorët dhe ekranet e telefonave celularë (peizazh). Përdorni këtë raport të pamjes kur dëshironi të kapni më shumë sfond (për shembull, peizazhe piktoreske).
Njoftim: një burrë i veshur me rroba të bardha, ulur në plazh, nga afër, ndriçim i orës së artë (raporti i pamjes 16:9) Portret (9:16) - Ky raport është me ekran të gjerë, por i rrotulluar. Ky është një raport relativisht i ri i aspektit që është popullarizuar nga aplikacionet e videove në formë të shkurtër (për shembull, pantallonat e shkurtra në YouTube). Përdoreni këtë për objekte të larta me orientime të forta vertikale si ndërtesa, pemë, ujëvara ose objekte të tjera të ngjashme.
Prompt: një paraqitje dixhitale e një rrokaqiell masiv, modern, madhështor, epik me një muzg të bukur në sfond (raporti i pamjes 9:16)
Imazhe fotorealiste
Versione të ndryshme të modelit të gjenerimit të imazhit mund të ofrojnë një përzierje të prodhimit artistik dhe fotorealist. Përdorni formulimin e mëposhtëm në kërkesat për të gjeneruar rezultate më fotorealiste, bazuar në subjektin që dëshironi të gjeneroni.
Rasti i përdorimit | Lloji i lenteve | Gjatësitë fokale | Detaje shtesë |
---|---|---|---|
Njerëzit (portrete) | Kryeni, zmadhoni | 24-35 mm | film bardh e zi, Film noir, Thellësia e fushës, duoton (përmend dy ngjyra) |
Ushqimi, insektet, bimët (objektet, natyra e qetë) | Makro | 60-105 mm | Detaje të larta, fokusim i saktë, ndriçim i kontrolluar |
Sport, kafshë të egra (lëvizje) | Zmadhimi i telefotos | 100-400 mm | Shpejtësia e shpejtë e diafragmës, ndjekja e veprimit ose lëvizjes |
Astronomike, peizazhore (me kënd të gjerë) | Me kënd të gjerë | 10-24 mm | Kohë të gjata ekspozimi, fokus i mprehtë, ekspozim i gjatë, ujë i qetë ose re |
Portrete
Rasti i përdorimit | Lloji i lenteve | Gjatësitë fokale | Detaje shtesë |
---|---|---|---|
Njerëzit (portrete) | Kryeni, zmadhoni | 24-35 mm | film bardh e zi, Film noir, Thellësia e fushës, duoton (përmend dy ngjyra) |
Duke përdorur disa fjalë kyçe nga tabela, Imagen mund të gjenerojë portretet e mëposhtme.
![]() | ![]() | ![]() | ![]() |
Kërkesa: Një grua, portret 35 mm, duoton blu dhe gri
Modeli: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
Prompt: Një grua, portret 35 mm, film noir
Modeli: imagen-3.0-generate-002
Objektet
Rasti i përdorimit | Lloji i lenteve | Gjatësitë fokale | Detaje shtesë |
---|---|---|---|
Ushqimi, insektet, bimët (objektet, natyra e qetë) | Makro | 60-105 mm | Detaje të larta, fokusim i saktë, ndriçim i kontrolluar |
Duke përdorur disa fjalë kyçe nga tabela, Imagen mund të gjenerojë imazhet e mëposhtme të objekteve.
![]() | ![]() | ![]() | ![]() |
Prompt: fletë e një bime lutjeje, makro lente, 60 mm
Modeli: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
Prompt: një pjatë me makarona, lente makro 100 mm
Modeli: imagen-3.0-generate-002
Lëvizja
Rasti i përdorimit | Lloji i lenteve | Gjatësitë fokale | Detaje shtesë |
---|---|---|---|
Sport, kafshë të egra (lëvizje) | Zmadhimi i telefotos | 100-400 mm | Shpejtësia e shpejtë e diafragmës, ndjekja e veprimit ose lëvizjes |
Duke përdorur disa fjalë kyçe nga tabela, Imagen mund të gjenerojë imazhet e mëposhtme të lëvizjes.
![]() | ![]() | ![]() | ![]() |
Prompt: një goditje fituese, shpejtësi e shpejtë e diafragmës, gjurmim i lëvizjes
Modeli: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
Prompt: Një dre që vrapon në pyll, shpejtësi e shpejtë e diafragmës, gjurmim i lëvizjes
Modeli: imagen-3.0-generate-002
Me kënd të gjerë
Rasti i përdorimit | Lloji i lenteve | Gjatësitë fokale | Detaje shtesë |
---|---|---|---|
Astronomike, peizazhore (me kënd të gjerë) | Me kënd të gjerë | 10-24 mm | Kohë të gjata ekspozimi, fokus i mprehtë, ekspozim i gjatë, ujë i qetë ose re |
Duke përdorur disa fjalë kyçe nga tabela, Imagen mund të gjenerojë imazhet e mëposhtme me kënd të gjerë.
![]() | ![]() | ![]() | ![]() |
Prompt: një varg malor i gjerë, peizazh me kënd të gjerë 10 mm
Modeli: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
Prompt: një foto e hënës, fotografi astro, kënd i gjerë 10 mm
Modeli: imagen-3.0-generate-002