Gemini API mbështet gjenerimin e imazheve duke përdorur Gemini 2.0 Flash Experimental dhe duke përdorur Imagen 3 . Ky udhëzues ju ndihmon të filloni me të dy modelet.
Për udhëzime për nxitjen e imazheve, shikoni seksionin e udhëzuesit të shpejtë të Imagen .
Para se të filloni
Përpara se të telefononi Gemini API, sigurohuni që keni të instaluar SDK-në tuaj të zgjedhur dhe një çelës Gemini API të konfiguruar dhe gati për t'u përdorur.
Gjeneroni imazhe duke përdorur Gemini
Gemini 2.0 Flash Experimental mbështet aftësinë për të nxjerrë tekst dhe imazhe inline. Kjo ju lejon të përdorni Binjakët për të modifikuar në mënyrë bisedore imazhe ose për të gjeneruar rezultate me tekst të ndërthurur (për shembull, duke krijuar një postim në blog me tekst dhe imazhe në një kthesë të vetme). Të gjitha imazhet e krijuara përfshijnë një filigran SynthID dhe imazhet në Google AI Studio përfshijnë gjithashtu një filigran të dukshëm.
Shembulli i mëposhtëm tregon se si të përdorni Gemini 2.0 për të gjeneruar dalje teksti dhe imazhi:
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import base64
client = genai.Client()
contents = ('Hi, can you create a 3d rendered image of a pig '
'with wings and a top hat flying over a happy '
'futuristic scifi city with lots of greenery?')
response = client.models.generate_content(
model="gemini-2.0-flash-exp-image-generation",
contents=contents,
config=types.GenerateContentConfig(
response_modalities=['TEXT', 'IMAGE']
)
)
for part in response.candidates[0].content.parts:
if part.text is not None:
print(part.text)
elif part.inline_data is not None:
image = Image.open(BytesIO((part.inline_data.data)))
image.save('gemini-native-image.png')
image.show()
import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";
async function main() {
const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });
const contents =
"Hi, can you create a 3d rendered image of a pig " +
"with wings and a top hat flying over a happy " +
"futuristic scifi city with lots of greenery?";
// Set responseModalities to include "Image" so the model can generate an image
const response = await ai.models.generateContent({
model: "gemini-2.0-flash-exp-image-generation",
contents: contents,
config: {
responseModalities: [Modality.TEXT, Modality.IMAGE],
},
});
for (const part of response.candidates[0].content.parts) {
// Based on the part type, either show the text or save the image
if (part.text) {
console.log(part.text);
} else if (part.inlineData) {
const imageData = part.inlineData.data;
const buffer = Buffer.from(imageData, "base64");
fs.writeFileSync("gemini-native-image.png", buffer);
console.log("Image saved as gemini-native-image.png");
}
}
}
main();
curl -s -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp-image-generation:generateContent?key=$GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"contents": [{
"parts": [
{"text": "Hi, can you create a 3d rendered image of a pig with wings and a top hat flying over a happy futuristic scifi city with lots of greenery?"}
]
}],
"generationConfig":{"responseModalities":["TEXT","IMAGE"]}
}' \
| grep -o '"data": "[^"]*"' \
| cut -d'"' -f4 \
| base64 --decode > gemini-native-image.png

Në varësi të kërkesës dhe kontekstit, Binjakët do të gjenerojnë përmbajtje në mënyra të ndryshme (tekst në imazh, tekst në imazh dhe tekst, etj.). Këtu janë disa shembuj:
- Teksti në imazh
- Shembull i kërkesës: "Gjeneroni një imazh të kullës Eifel me fishekzjarre në sfond."
- Teksti në imazh(et) dhe teksti (i ndërthurur)
- Shembull i kërkesës: "Krijoni një recetë të ilustruar për një paella."
- Imazhi(et) dhe teksti në imazh(et) dhe teksti (i ndërthurur)
- Shembull i kërkesës: (Me një imazh të një dhome të mobiluar) "Cila divane me ngjyra të tjera do të funksiononin në hapësirën time? a mund ta përditësoni imazhin?"
- Redaktimi i imazhit (tekst dhe imazh në imazh)
- Shembull i kërkesës: "Ndrysho këtë imazh që të duket si një film vizatimor"
- Shembull i kërkesës: [imazhi i një mace] + [imazhi i një jastëku] + "Krijo një qepje tërthore të maces sime në këtë jastëk."
- Redaktimi i imazhit me shumë kthesa (chat)
- Shembull kërkon: [ngarkoni një imazh të një makine blu.] "Kthejeni këtë makinë në një makinë të konvertueshme." "Tani ndryshoni ngjyrën në të verdhë."
Redaktimi i imazhit me Binjakët
Për të kryer redaktimin e imazhit, shtoni një imazh si hyrje. Shembulli i mëposhtëm tregon ngarkimin e imazheve të koduara bazë64. Për imazhe të shumta dhe ngarkesa më të mëdha, kontrolloni seksionin e futjes së imazhit .
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import PIL.Image
image = PIL.Image.open('/path/to/image.png')
client = genai.Client()
text_input = ('Hi, This is a picture of me.'
'Can you add a llama next to me?',)
response = client.models.generate_content(
model="gemini-2.0-flash-exp-image-generation",
contents=[text_input, image],
config=types.GenerateContentConfig(
response_modalities=['TEXT', 'IMAGE']
)
)
for part in response.candidates[0].content.parts:
if part.text is not None:
print(part.text)
elif part.inline_data is not None:
image = Image.open(BytesIO(part.inline_data.data))
image.show()
import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";
async function main() {
const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });
// Load the image from the local file system
const imagePath = "path/to/image.png";
const imageData = fs.readFileSync(imagePath);
const base64Image = imageData.toString("base64");
// Prepare the content parts
const contents = [
{ text: "Can you add a llama next to the image?" },
{
inlineData: {
mimeType: "image/png",
data: base64Image,
},
},
];
// Set responseModalities to include "Image" so the model can generate an image
const response = await ai.models.generateContent({
model: "gemini-2.0-flash-exp-image-generation",
contents: contents,
config: {
responseModalities: [Modality.TEXT, Modality.IMAGE],
},
});
for (const part of response.candidates[0].content.parts) {
// Based on the part type, either show the text or save the image
if (part.text) {
console.log(part.text);
} else if (part.inlineData) {
const imageData = part.inlineData.data;
const buffer = Buffer.from(imageData, "base64");
fs.writeFileSync("gemini-native-image.png", buffer);
console.log("Image saved as gemini-native-image.png");
}
}
}
main();
IMG_PATH=/path/to/your/image1.jpeg
if [[ "$(base64 --version 2>&1)" = *"FreeBSD"* ]]; then
B64FLAGS="--input"
else
B64FLAGS="-w0"
fi
IMG_BASE64=$(base64 "$B64FLAGS" "$IMG_PATH" 2>&1)
curl -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp-image-generation:generateContent?key=$GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d "{
\"contents\": [{
\"parts\":[
{\"text\": \"'Hi, This is a picture of me. Can you add a llama next to me\"},
{
\"inline_data\": {
\"mime_type\":\"image/jpeg\",
\"data\": \"$IMG_BASE64\"
}
}
]
}],
\"generationConfig\": {\"responseModalities\": [\"TEXT\", \"IMAGE\"]}
}" \
| grep -o '"data": "[^"]*"' \
| cut -d'"' -f4 \
| base64 --decode > gemini-edited-image.png
Kufizimet
- Për performancën më të mirë, përdorni gjuhët e mëposhtme: EN, es-MX, ja-JP, zh-CN, hi-IN.
- Gjenerimi i imazhit nuk mbështet hyrjet audio ose video.
- Gjenerimi i imazhit mund të mos shkaktojë gjithmonë:
- Modeli mund të nxjerrë vetëm tekst. Provoni të kërkoni në mënyrë eksplicite rezultatet e imazhit (p.sh. "gjeneroni një imazh", "siguroni imazhe ndërsa vazhdoni", "përditësoni imazhin").
- Modeli mund të ndalojë së prodhuari pjesërisht. Provo sërish ose provo një kërkesë tjetër.
- Kur krijoni tekst për një imazh, Binjakët funksionojnë më mirë nëse së pari krijoni tekstin dhe më pas kërkoni një imazh me tekstin.
Zgjidhni një model
Cilin model duhet të përdorni për të krijuar imazhe? Kjo varet nga rasti i përdorimit tuaj.
Gemini 2.0 është më i miri për prodhimin e imazheve përkatëse në kontekst, përzierjen e tekstit + imazhet, përfshirjen e njohurive botërore dhe arsyetimin rreth imazheve. Ju mund ta përdorni atë për të krijuar pamje të sakta, përkatëse kontekstuale, të ngulitura në sekuenca të gjata teksti. Ju gjithashtu mund t'i modifikoni imazhet në bisedë, duke përdorur gjuhën natyrore, duke ruajtur kontekstin gjatë gjithë bisedës.
Nëse cilësia e imazhit është prioriteti juaj kryesor, atëherë Imagen 3 është një zgjedhje më e mirë. Imagen 3 shkëlqen në fotorealizëm, detaje artistike dhe stile specifike artistike si impresionizmi ose anime. Imagen 3 është gjithashtu një zgjedhje e mirë për detyra të specializuara të redaktimit të imazheve si përditësimi i sfondeve të produkteve, përmirësimi i imazheve dhe futja e markës dhe stilit në pamjet vizuale. Ju mund të përdorni Imagen 3 për të krijuar logo ose modele të tjera produktesh të markës.
Gjeneroni imazhe duke përdorur Imagen 3
Gemini API ofron akses në Imagen 3 , modeli tekst-në-imazh i cilësisë më të lartë të Google, duke shfaqur një sërë aftësish të reja dhe të përmirësuara. Imazhi 3 mund të bëjë sa më poshtë:
- Gjeneroni imazhe me detaje më të mira, ndriçim më të pasur dhe më pak objekte shpërqendruese sesa modelet e mëparshme
- Kuptoni udhëzimet e shkruara në gjuhë natyrore
- Gjeneroni imazhe në një gamë të gjerë formatesh dhe stilesh
- Paraqitni tekstin në mënyrë më efektive se modelet e mëparshme
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
client = genai.Client(api_key='GEMINI_API_KEY')
response = client.models.generate_images(
model='imagen-3.0-generate-002',
prompt='Robot holding a red skateboard',
config=types.GenerateImagesConfig(
number_of_images= 4,
)
)
for generated_image in response.generated_images:
image = Image.open(BytesIO(generated_image.image.image_bytes))
image.show()
import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";
async function main() {
const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });
const response = await ai.models.generateImages({
model: 'imagen-3.0-generate-002',
prompt: 'Robot holding a red skateboard',
config: {
numberOfImages: 4,
},
});
let idx = 1;
for (const generatedImage of response.generatedImages) {
let imgBytes = generatedImage.image.imageBytes;
const buffer = Buffer.from(imgBytes, "base64");
fs.writeFileSync(`imagen-${idx}.png`, buffer);
idx++;
}
}
main();
curl -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/imagen-3.0-generate-002:predict?key=GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"instances": [
{
"prompt": "Robot holding a red skateboard"
}
],
"parameters": {
"sampleCount": 4
}
}'

Imagen mbështet kërkesat vetëm në anglisht në këtë moment dhe parametrat e mëposhtëm:
Parametrat e modelit të imazhit
(Konventat e emërtimit ndryshojnë sipas gjuhës së programimit.)
-
numberOfImages
: Numri i imazheve për të gjeneruar, nga 1 në 4 (përfshirë). Parazgjedhja është 4. -
aspectRatio
: Ndryshon raportin e pamjes së imazhit të krijuar. Vlerat e mbështetura janë"1:1"
,"3:4"
,"4:3"
,"9:16"
dhe"16:9"
. Parazgjedhja është"1:1"
. -
personGeneration
: Lejo modelin të gjenerojë imazhe të njerëzve. Vlerat e mëposhtme mbështeten:-
"DONT_ALLOW"
: Blloko gjenerimin e imazheve të njerëzve. -
"ALLOW_ADULT"
: Krijo imazhe të të rriturve, por jo të fëmijëve. Ky është standardi.
-
Udhëzues i shpejtë i imazhit
Ky seksion i udhëzuesit Imagen ju tregon se si modifikimi i një kërkese tekst-në-imazh mund të prodhojë rezultate të ndryshme, së bashku me shembuj të imazheve që mund të krijoni.
Bazat e menjëhershme të shkrimit
Një kërkesë e mirë është përshkruese dhe e qartë, dhe përdor fjalë kyçe dhe modifikues kuptimplotë. Filloni duke menduar për temën , kontekstin dhe stilin tuaj.

Tema : Gjëja e parë për të cilën duhet të mendoni me çdo kërkesë është tema : objekti, personi, kafsha ose peizazhi që dëshironi një imazh.
Konteksti dhe sfondi: Po aq i rëndësishëm është sfondi ose konteksti në të cilin do të vendoset subjekti. Provoni ta vendosni subjektin tuaj në sfonde të ndryshme. Për shembull, një studio me sfond të bardhë, në ambiente të jashtme ose të brendshme.
Stili: Së fundi, shtoni stilin e imazhit që dëshironi. Stilet mund të jenë të përgjithshme (pikturë, fotografi, skica) ose shumë specifike (pikturë pastel, vizatim me qymyr, izometrik 3D). Ju gjithashtu mund të kombinoni stilet.
Pasi të shkruani një version të parë të kërkesës suaj, rafinoni kërkesën tuaj duke shtuar më shumë detaje derisa të arrini te imazhi që dëshironi. Përsëritja është e rëndësishme. Filloni duke krijuar idenë tuaj bazë, dhe më pas përsojeni dhe zgjeroni atë ide thelbësore derisa imazhi i krijuar të jetë afër vizionit tuaj.
![]() | ![]() | ![]() |
Imagen 3 mund t'i transformojë idetë tuaja në imazhe të detajuara, pavarësisht nëse kërkesat tuaja janë të shkurtra apo të gjata dhe të detajuara. Përsosni vizionin tuaj nëpërmjet nxitjes përsëritëse, duke shtuar detaje derisa të arrini rezultatin perfekt.
Kërkesat e shkurtra ju lejojnë të krijoni një imazh shpejt. ![]() | Kërkesat më të gjata ju lejojnë të shtoni detaje specifike dhe të ndërtoni imazhin tuaj. ![]() |
Këshilla shtesë për shkrimin e shpejtë të Imagen:
- Përdorni gjuhën përshkruese : Përdorni mbiemra dhe ndajfolje të detajuara për të dhënë një pamje të qartë për Imagen 3.
- Jepni kontekstin : Nëse është e nevojshme, përfshini informacione bazë për të ndihmuar të kuptuarit e AI.
- Referojuni artistëve ose stileve specifike : Nëse keni një estetikë të veçantë në mendje, referimi i artistëve ose lëvizjeve të veçanta të artit mund të jetë i dobishëm.
- Përdorni mjete të menjëhershme inxhinierike : Merrni parasysh eksplorimin e mjeteve ose burimeve të shpejta inxhinierike për t'ju ndihmuar të rafinoni kërkesat tuaja dhe të arrini rezultate optimale.
- Përmirësimi i detajeve të fytyrës në imazhet tuaja personale dhe grupore :
- Specifikoni detajet e fytyrës si fokus të fotografisë (për shembull, përdorni fjalën "portret" në kërkesë).
Gjeneroni tekst në imazhe
Imagen mund të shtojë tekst në imazhe, duke hapur më shumë mundësi krijuese të krijimit të imazheve. Përdorni udhëzimet e mëposhtme për të përfituar sa më shumë nga kjo veçori:
- Përsëriteni me besim : Mund t'ju duhet të rigjeneroni imazhet derisa të arrini pamjen që dëshironi. Integrimi i tekstit të Imagen është ende në zhvillim, dhe nganjëherë përpjekjet e shumta japin rezultatet më të mira.
- Mbajeni të shkurtër : Kufizoni tekstin në 25 karaktere ose më pak për gjenerim optimal.
Fraza të shumta : Eksperimentoni me dy ose tre fraza të ndryshme për të dhënë informacion shtesë. Shmangni tejkalimin e tre frazave për kompozime më të pastra.
Prompt: Një poster me tekstin "Summerland" me shkronja të zeza si titull, poshtë këtij teksti është slogani "Summer never ndjerë kaq mirë" Vendosja e udhëzuesit : Ndërsa Imagen mund të përpiqet të pozicionojë tekstin sipas udhëzimeve, prisni ndryshime të herëpashershme. Kjo veçori po përmirësohet vazhdimisht.
Frymëzoni stilin e shkronjave : Specifikoni një stil të përgjithshëm fonti për të ndikuar në mënyrë delikate në zgjedhjet e Imagen. Mos u mbështetni në përsëritjen e saktë të shkronjave, por prisni interpretime krijuese.
Madhësia e shkronjave : Specifikoni një madhësi fonti ose një tregues të përgjithshëm të madhësisë (për shembull, i vogël , i mesëm , i madh ) për të ndikuar në gjenerimin e madhësisë së shkronjave.
Parametrizim i menjëhershëm
Për të kontrolluar më mirë rezultatet e daljes, mund të jetë e dobishme të parametrizoni hyrjet në Imagen. Për shembull, supozoni se dëshironi që klientët tuaj të jenë në gjendje të gjenerojnë logo për biznesin e tyre dhe dëshironi të siguroheni që logot të krijohen gjithmonë në një sfond me ngjyra të forta. Ju gjithashtu dëshironi të kufizoni opsionet që klienti mund të zgjedhë nga një menu.
Në këtë shembull, ju mund të krijoni një kërkesë të parametrizuar të ngjashme me sa vijon:
A{logo_style} logo for a{company_area} company on a solid color background. Include the text{company_name} .
Në ndërfaqen tuaj të personalizuar të përdoruesit, klienti mund të futë parametrat duke përdorur një meny dhe vlera e tyre e zgjedhur plotëson kërkesën që merr Imagen.
Për shembull:
Prompt:
A minimalist logo for a health care company on a solid color background. Include the text Journey .
Prompt:
A modern logo for a software company on a solid color background. Include the text Silo .
Prompt:
A traditional logo for a baking company on a solid color background. Include the text Seed .
Teknika të avancuara të shkrimit të shpejtë
Përdorni shembujt e mëposhtëm për të krijuar kërkesa më specifike bazuar në atribute si përshkruesit e fotografisë, format dhe materialet, lëvizjet e artit historik dhe modifikuesit e cilësisë së imazhit.
Fotografia
- Prompti përfshin: "Një foto e..."
Për të përdorur këtë stil, filloni me përdorimin e fjalëve kyçe që i tregojnë qartë Imagen se po kërkoni një fotografi. Filloni kërkesat tuaja me "Një foto e ...." . Për shembull:
![]() | ![]() | ![]() |
Burimi i imazhit: Çdo imazh u krijua duke përdorur kërkesën përkatëse të tekstit me modelin Imagen 3.
Modifikuesit e fotografisë
Në shembujt e mëposhtëm, mund të shihni disa modifikues dhe parametra specifikë të fotografisë. Ju mund të kombinoni modifikues të shumtë për kontroll më të saktë.
Afërsia me kamerën - nga afër, e marrë nga larg
Prompt: Një foto nga afër e kokrrave të kafesë Prompt: Një foto e zmadhuar e një çantë të vogël të
kokrra kafeje në një kuzhinë të çrregulltPozicioni i kamerës - ajrore, nga poshtë
Prompt: foto ajrore e qytetit urban me rrokaqiejt Prompt: Një foto e një tende pylli me qiell blu nga poshtë Ndriçimi - natyral, dramatik, i ngrohtë, i ftohtë
Prompt: foto në studio e një karrige moderne, ndriçim natyral Prompt: foto në studio e një karrige moderne, ndriçim dramatik Cilësimet e kamerës - turbullim i lëvizjes, fokus i butë, bokeh, portret
Prompt: foto e një qyteti me rrokaqiej nga pjesa e brendshme e një makine me turbullim lëvizjeje Prompt: fotografi me fokus të butë të një ure në një qytet urban gjatë natës Llojet e lenteve - 35mm, 50mm, fisheye, kënd të gjerë, makro
Prompt: foto e një gjetheje, lente makro Prompt: fotografi në rrugë, New York City, lente fisheye Llojet e filmit - bardh e zi, polaroid
Prompt: një portret polaroid i një qeni që mban syze dielli Prompt: foto bardh e zi e një qeni me syze dielli
Burimi i imazhit: Çdo imazh u krijua duke përdorur kërkesën përkatëse të tekstit me modelin Imagen 3.
Ilustrimi dhe arti
- Prompti përfshin: "Një painting e..." , "Një sketch e..."
Stilet e artit ndryshojnë nga stilet njëngjyrëshe si skicat me laps, deri te arti dixhital hiper-realist. Për shembull, imazhet e mëposhtme përdorin të njëjtën kërkesë me stile të ndryshme:
"Një [art style or creation technique] i një sedani elektrik sportiv këndor me rrokaqiejt në sfond"
![]() | ![]() | ![]() |
![]() | ![]() | ![]() |
Burimi i imazhit: Çdo imazh u krijua duke përdorur kërkesën përkatëse të tekstit me modelin Imagen 2.
Format dhe materialet
- Prompti përfshin: "...i bërë nga..." , "...në formën e..."
Një nga pikat e forta të kësaj teknologjie është se ju mund të krijoni imazhe që përndryshe janë të vështira ose të pamundura. Për shembull, ju mund të rikrijoni logon e kompanisë tuaj në materiale dhe tekstura të ndryshme.
![]() | ![]() | ![]() |
Burimi i imazhit: Çdo imazh u krijua duke përdorur kërkesën përkatëse të tekstit me modelin Imagen 3.
Referencat e artit historik
- Prompti përfshin: "...në stilin e..."
Disa stile janë bërë ikonë me kalimin e viteve. Më poshtë janë disa ide të pikturës historike ose stileve të artit që mund të provoni.
"gjeneroni një imazh në stilin e [art period or movement] : një fermë me erë"
![]() | ![]() | ![]() |
Burimi i imazhit: Çdo imazh u krijua duke përdorur kërkesën përkatëse të tekstit me modelin Imagen 3.
Modifikuesit e cilësisë së imazhit
Disa fjalë kyçe mund t'i bëjnë të ditur modelit se po kërkoni një aset me cilësi të lartë. Shembuj të modifikuesve të cilësisë përfshijnë si më poshtë:
- Modifikues të përgjithshëm - me cilësi të lartë, të bukur, të stilizuar
- Fotografitë - 4K, HDR, Studio Foto
- Art, Ilustrim - nga një profesionist, i detajuar
Më poshtë janë disa shembuj të kërkesave pa modifikues të cilësisë dhe e njëjta kërkesë me modifikues të cilësisë.
![]() | ![]() foto e një kërcell misri të marrë nga një fotograf profesionist |
Burimi i imazhit: Çdo imazh u krijua duke përdorur kërkesën përkatëse të tekstit me modelin Imagen 3.
Raportet e aspektit
Gjenerimi i imazhit Imagen 3 ju lejon të vendosni pesë raporte të dallueshme të pamjes së imazhit.
- Sheshi (1:1, i paracaktuar) - Një foto standarde katrore. Përdorimet e zakonshme për këtë raport aspekti përfshijnë postimet në mediat sociale.
Ekrani i plotë (4:3) - Ky raport i pamjes përdoret zakonisht në media ose film. Janë gjithashtu dimensionet e shumicës së televizorëve të vjetër (jo me ekran të gjerë) dhe kamerave me format të mesëm. Ai kap më shumë nga skena horizontalisht (krahasuar me 1:1), duke e bërë atë një raport të preferuar të pamjes për fotografimin.
Kërkim: nga afër gishtat e një muzikanti që luan në piano, film bardh e zi, vintage (raporti i pamjes 4:3) Prompt: Një foto profesionale në studio e patate të skuqura për një restorant të nivelit të lartë, në stilin e një reviste ushqimore (raporti i pamjes 4:3) Portret në ekran të plotë (3:4) - Ky është raporti i pamjes së ekranit të plotë i rrotulluar 90 gradë. Kjo ju lejon të kapni më shumë skenë vertikalisht në krahasim me raportin e pamjes 1:1.
Njoftim: një grua në shëtitje, mbyllja e çizmeve të saj të pasqyruara në një pellg, male të mëdha në sfond, në stilin e një reklame, kënde dramatike (raporti i pamjes 3:4) Kërkesa: shkrepje ajrore e një lumi që rrjedh në një luginë mistike (raporti i pamjes 3:4) Ekrani i gjerë (16:9) - Ky raport ka zëvendësuar 4:3 dhe tani është raporti më i zakonshëm i pamjes për televizorët, monitorët dhe ekranet e telefonave celularë (peizazh). Përdorni këtë raport të pamjes kur dëshironi të kapni më shumë sfond (për shembull, peizazhe piktoreske).
Njoftim: një burrë i veshur me rroba të bardha, ulur në plazh, nga afër, ndriçim i orës së artë (raporti i pamjes 16:9) Portret (9:16) - Ky raport është me ekran të gjerë, por i rrotulluar. Ky është një raport relativisht i ri i aspektit që është popullarizuar nga aplikacionet e videove në formë të shkurtër (për shembull, pantallonat e shkurtra në YouTube). Përdoreni këtë për objekte të larta me orientime të forta vertikale si ndërtesa, pemë, ujëvara ose objekte të tjera të ngjashme.
Prompt: një paraqitje dixhitale e një rrokaqiell masiv, modern, madhështor, epik me një muzg të bukur në sfond (raporti i pamjes 9:16)
Imazhe fotorealiste
Versione të ndryshme të modelit të gjenerimit të imazhit mund të ofrojnë një përzierje të prodhimit artistik dhe fotorealist. Përdorni formulimin e mëposhtëm në kërkesat për të gjeneruar rezultate më fotorealiste, bazuar në subjektin që dëshironi të gjeneroni.
Rasti i përdorimit | Lloji i lenteve | Gjatësitë fokale | Detaje shtesë |
---|---|---|---|
Njerëzit (portrete) | Kryeni, zmadhoni | 24-35 mm | film bardh e zi, Film noir, Thellësia e fushës, duoton (përmend dy ngjyra) |
Ushqimi, insektet, bimët (objektet, natyra e qetë) | Makro | 60-105 mm | Detaje të larta, fokusim i saktë, ndriçim i kontrolluar |
Sport, kafshë të egra (lëvizje) | Zmadhimi i telefotos | 100-400 mm | Shpejtësia e shpejtë e diafragmës, ndjekja e veprimit ose lëvizjes |
Astronomike, peizazhore (me kënd të gjerë) | Me kënd të gjerë | 10-24 mm | Kohë të gjata ekspozimi, fokus i mprehtë, ekspozim i gjatë, ujë i qetë ose re |
Portrete
Rasti i përdorimit | Lloji i lenteve | Gjatësitë fokale | Detaje shtesë |
---|---|---|---|
Njerëzit (portrete) | Kryeni, zmadhoni | 24-35 mm | film bardh e zi, Film noir, Thellësia e fushës, duoton (përmend dy ngjyra) |
Duke përdorur disa fjalë kyçe nga tabela, Imagen mund të gjenerojë portretet e mëposhtme:
![]() | ![]() | ![]() | ![]() |
Kërkesa: Një grua, portret 35 mm, duoton blu dhe gri
Modeli: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
Prompt: Një grua, portret 35 mm, film noir
Modeli: imagen-3.0-generate-002
Objektet
Rasti i përdorimit | Lloji i lenteve | Gjatësitë fokale | Detaje shtesë |
---|---|---|---|
Ushqimi, insektet, bimët (objektet, natyra e qetë) | Makro | 60-105 mm | Detaje të larta, fokusim i saktë, ndriçim i kontrolluar |
Duke përdorur disa fjalë kyçe nga tabela, Imagen mund të gjenerojë imazhet e mëposhtme të objekteve:
![]() | ![]() | ![]() | ![]() |
Prompt: fletë e një bime lutjeje, makro lente, 60 mm
Modeli: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
Prompt: një pjatë me makarona, lente makro 100 mm
Modeli: imagen-3.0-generate-002
Lëvizja
Rasti i përdorimit | Lloji i lenteve | Gjatësitë fokale | Detaje shtesë |
---|---|---|---|
Sport, kafshë të egra (lëvizje) | Zmadhimi i telefotos | 100-400 mm | Shpejtësia e shpejtë e diafragmës, ndjekja e veprimit ose lëvizjes |
Duke përdorur disa fjalë kyçe nga tabela, Imagen mund të gjenerojë imazhet e mëposhtme të lëvizjes:
![]() | ![]() | ![]() | ![]() |
Prompt: një goditje fituese, shpejtësi e shpejtë e diafragmës, gjurmim i lëvizjes
Modeli: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
Prompt: Një dre që vrapon në pyll, shpejtësi e shpejtë e diafragmës, gjurmim i lëvizjes
Modeli: imagen-3.0-generate-002
Me kënd të gjerë
Rasti i përdorimit | Lloji i lenteve | Gjatësitë fokale | Detaje shtesë |
---|---|---|---|
Astronomike, peizazhore (me kënd të gjerë) | Me kënd të gjerë | 10-24 mm | Kohë të gjata ekspozimi, fokus i mprehtë, ekspozim i gjatë, ujë i qetë ose re |
Duke përdorur disa fjalë kyçe nga tabela, Imagen mund të gjenerojë imazhet e mëposhtme me kënd të gjerë:
![]() | ![]() | ![]() | ![]() |
Prompt: një varg malor i gjerë, peizazh me kënd të gjerë 10 mm
Modeli: imagen-3.0-generate-002
![]() | ![]() | ![]() | ![]() |
Prompt: një foto e hënës, fotografi astro, kënd i gjerë 10 mm
Modeli: imagen-3.0-generate-002
Çfarë është më pas
- Shikoni udhëzuesin Veo për të mësuar se si të gjeneroni video me Gemini API.
- Për të mësuar më shumë rreth modeleve Gemini 2.0, shihni modelet e Gemini dhe modelet eksperimentale .