Imagen është modeli i gjenerimit të imazheve me besueshmëri të lartë i Google-it, i aftë të gjenerojë imazhe realiste dhe me cilësi të lartë nga udhëzimet me tekst. Të gjitha imazhet e gjeneruara përfshijnë një filigran SynthID. Për të mësuar më shumë rreth varianteve të disponueshme të modelit Imagen, shihni seksionin Versionet e modelit .
Gjeneroni imazhe duke përdorur modelet Imagen
Ky shembull demonstron gjenerimin e imazheve me një model Imagen :
Python
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
client = genai.Client()
response = client.models.generate_images(
    model='imagen-4.0-generate-001',
    prompt='Robot holding a red skateboard',
    config=types.GenerateImagesConfig(
        number_of_images= 4,
    )
)
for generated_image in response.generated_images:
  generated_image.image.show()
JavaScript
import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";
async function main() {
  const ai = new GoogleGenAI({});
  const response = await ai.models.generateImages({
    model: 'imagen-4.0-generate-001',
    prompt: 'Robot holding a red skateboard',
    config: {
      numberOfImages: 4,
    },
  });
  let idx = 1;
  for (const generatedImage of response.generatedImages) {
    let imgBytes = generatedImage.image.imageBytes;
    const buffer = Buffer.from(imgBytes, "base64");
    fs.writeFileSync(`imagen-${idx}.png`, buffer);
    idx++;
  }
}
main();
Shko
package main
import (
  "context"
  "fmt"
  "os"
  "google.golang.org/genai"
)
func main() {
  ctx := context.Background()
  client, err := genai.NewClient(ctx, nil)
  if err != nil {
      log.Fatal(err)
  }
  config := &genai.GenerateImagesConfig{
      NumberOfImages: 4,
  }
  response, _ := client.Models.GenerateImages(
      ctx,
      "imagen-4.0-generate-001",
      "Robot holding a red skateboard",
      config,
  )
  for n, image := range response.GeneratedImages {
      fname := fmt.Sprintf("imagen-%d.png", n)
          _ = os.WriteFile(fname, image.Image.ImageBytes, 0644)
  }
}
PUSHTIM
curl -X POST \
    "https://generativelanguage.googleapis.com/v1beta/models/imagen-4.0-generate-001:predict" \
    -H "x-goog-api-key: $GEMINI_API_KEY" \
    -H "Content-Type: application/json" \
    -d '{
        "instances": [
          {
            "prompt": "Robot holding a red skateboard"
          }
        ],
        "parameters": {
          "sampleCount": 4
        }
      }'

Konfigurimi i imazhit
Imagen mbështet vetëm kërkesa në anglisht në këtë kohë dhe parametrat e mëposhtëm:
-  
numberOfImages: Numri i imazheve që do të gjenerohen, nga 1 deri në 4 (përfshirëse). Vlera parazgjedhur është 4. -  
imageSize: Madhësia e imazhit të gjeneruar. Kjo mbështetet vetëm për modelet Standard dhe Ultra. Vlerat e mbështetura janë1Kdhe2K. Vlera parazgjedhur është1K. -  
aspectRatio: Ndryshon raportin e aspektit të imazhit të gjeneruar. Vlerat e mbështetura janë"1:1","3:4","4:3","9:16"dhe"16:9". Vlera parazgjedhur është"1:1". personGeneration: Lejon modelin të gjenerojë imazhe të njerëzve. Mbështeten vlerat e mëposhtme:-  
"dont_allow": Blloko gjenerimin e imazheve të njerëzve. -  
"allow_adult": Gjeneroni imazhe të të rriturve, por jo të fëmijëve. Kjo është parazgjedhja. -  
"allow_all": Gjeneroni imazhe që përfshijnë të rritur dhe fëmijë. 
-  
 
Udhëzues për imazhe
Ky seksion i udhëzuesit Imagen ju tregon se si modifikimi i një mesazhi për shndërrimin e tekstit në imazh mund të prodhojë rezultate të ndryshme, së bashku me shembuj të imazheve që mund të krijoni.
Bazat e shkrimit të shpejtë
Një sugjerim i mirë është përshkrues dhe i qartë, dhe përdor fjalë kyçe dhe modifikues kuptimplotë. Filloni duke menduar për temën , kontekstin dhe stilin tuaj.

Subjekti : Gjëja e parë për të cilën duhet të mendoni me çdo pyetje është subjekti : objekti, personi, kafsha ose peizazhi që dëshironi të keni një imazh.
Konteksti dhe sfondi: Po aq i rëndësishëm është sfondi ose konteksti në të cilin do të vendoset subjekti. Mundohuni ta vendosni subjektin tuaj në një sërë sfondesh. Për shembull, një studio me sfond të bardhë, ambiente të jashtme ose të brendshme.
Stili: Së fundmi, shtoni stilin e imazhit që dëshironi. Stilet mund të jenë të përgjithshme (pikturë, fotografi, skica) ose shumë specifike (pikturë pastel, vizatim me qymyr, 3D izometrike). Gjithashtu mund të kombinoni stile.
Pasi të shkruani versionin e parë të kërkesës suaj, përsosni kërkesën tuaj duke shtuar më shumë detaje derisa të arrini te imazhi që dëshironi. Përsëritja është e rëndësishme. Filloni duke përcaktuar idenë tuaj kryesore dhe më pas përsosni dhe zgjeroni atë ide kryesore derisa imazhi i gjeneruar të jetë afër vizionit tuaj.
![]()  | ![]()  | ![]()  | 
Modelet Imagen mund t'i transformojnë idetë tuaja në imazhe të detajuara, pavarësisht nëse kërkesat tuaja janë të shkurtra apo të gjata dhe të detajuara. Përsosni vizionin tuaj përmes kërkesave përsëritëse, duke shtuar detaje derisa të arrini rezultatin e përsosur.
Udhëzimet e shkurtra ju lejojnë të gjeneroni një imazh shpejt. ![]()  | Kërkesat më të gjata ju lejojnë të shtoni detaje specifike dhe të ndërtoni imazhin tuaj. ![]()  | 
Këshilla shtesë për shkrimin e shpejtë të Imagen:
- Përdorni gjuhë përshkruese : Përdorni mbiemra dhe ndajfolje të detajuara për të krijuar një tablo të qartë për Imagen.
 - Jepni kontekstin : Nëse është e nevojshme, përfshini informacione mbi sfondin për të ndihmuar inteligjencën artificiale të kuptojë.
 - Referojuni artistëve ose stileve specifike : Nëse keni një estetikë të veçantë në mendje, referenca ndaj artistëve ose lëvizjeve artistike specifike mund të jetë e dobishme.
 - Përdorni mjete inxhinierike të shpejta : Merrni në konsideratë eksplorimin e mjeteve ose burimeve të inxhinierisë së shpejtë për t'ju ndihmuar të përsosni kërkesat tuaja dhe të arrini rezultate optimale.
 - Përmirësimi i detajeve të fytyrës në imazhet tuaja personale dhe në grup : Specifikoni detajet e fytyrës si fokus të fotos (për shembull, përdorni fjalën "portret" në kërkesë).
 
Gjeneroni tekst në imazhe
Modelet e imazheve mund të shtojnë tekst në imazhe, duke hapur mundësi më krijuese për gjenerimin e imazheve. Përdorni udhëzimet e mëposhtme për të përfituar sa më shumë nga kjo veçori:
- Përsëriteni me besim : Mund t'ju duhet të rigjeneroni imazhet derisa të arrini pamjen që dëshironi. Integrimi i tekstit të Imagen është ende në zhvillim e sipër dhe ndonjëherë përpjekjet e shumëfishta japin rezultatet më të mira.
 - Mbajeni të shkurtër : Kufizoni tekstin në 25 karaktere ose më pak për gjenerim optimal.
 Fraza të shumëfishta : Eksperimentoni me dy ose tre fraza të dallueshme për të dhënë informacion shtesë. Shmangni tejkalimin e tre frazave për kompozime më të qarta.

Njoftim: Një poster me tekstin "Verëlindja" me shkronja të trasha si titull, poshtë këtij teksti është slogani "Vera nuk është ndjerë kurrë kaq mirë" Vendosja e Udhëzuesit : Ndërsa Imagen mund të përpiqet të pozicionojë tekstin sipas udhëzimeve, prisni ndryshime të herëpashershme. Kjo veçori është duke u përmirësuar vazhdimisht.
Stili i shkronjave Inspire : Specifikoni një stil të përgjithshëm shkronjash për të ndikuar në mënyrë delikate në zgjedhjet e Imagen. Mos u mbështetni në replikimin e saktë të shkronjave, por prisni interpretime krijuese.
Madhësia e shkronjave : Specifikoni një madhësi shkronjash ose një tregues të përgjithshëm të madhësisë (për shembull, e vogël , mesatare , e madhe ) për të ndikuar në gjenerimin e madhësisë së shkronjave.
Parametëzimi i menjëhershëm
Për të kontrolluar më mirë rezultatet e daljes, mund ta gjeni të dobishme të parametrizoni të dhënat hyrëse në Imagen. Për shembull, supozojmë se dëshironi që klientët tuaj të jenë në gjendje të gjenerojnë logo për biznesin e tyre dhe dëshironi të siguroheni që logot të gjenerohen gjithmonë në një sfond me ngjyra të forta. Gjithashtu, dëshironi të kufizoni opsionet që klienti mund të zgjedhë nga një menu.
Në këtë shembull, mund të krijoni një prompt të parametrizuar të ngjashëm me sa vijon:
A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.Në ndërfaqen tuaj të përdoruesit të personalizuar, klienti mund të futë parametrat duke përdorur një menu, dhe vlera e zgjedhur prej tij plotëson kërkesën që merr Imagen.
Për shembull:
Nxitje:
A minimalist logo for a health care company on a solid color background. Include the text Journey .
Nxitje:
A modern logo for a software company on a solid color background. Include the text Silo .
Nxitje:
A traditional logo for a baking company on a solid color background. Include the text Seed .
Teknika të avancuara të shkrimit të shpejtë
Përdorni shembujt e mëposhtëm për të krijuar sugjerime më specifike bazuar në atribute si përshkruesit e fotografisë, format dhe materialet, lëvizjet historike të artit dhe modifikuesit e cilësisë së imazhit.
Fotografi
- Kërkesa përfshin: "Një foto e..."
 
Për të përdorur këtë stil, filloni duke përdorur fjalë kyçe që i tregojnë qartë Imagen se po kërkoni një fotografi. Filloni pyetjet tuaja me "Një foto e..." . Për shembull:
![]()  | ![]()  | ![]()  | 
Burimi i imazhit: Çdo imazh u gjenerua duke përdorur komandën përkatëse të tekstit me modelin Imagen 3.
Modifikuesit e fotografisë
Në shembujt e mëposhtëm, mund të shihni disa modifikues dhe parametra specifikë për fotografinë. Mund të kombinoni modifikues të shumtë për një kontroll më të saktë.
Afërsia e Kamerës - Pamje nga afër, e bërë nga larg

Njoftim: Një foto nga afër e kokrrave të kafesë 
Njoftim: Një foto e zmadhuar e një qeseje të vogël me 
kokrra kafeje në një kuzhinë të rrëmujshmePozicioni i kamerës - nga ajri, nga poshtë

Njoftim: foto ajrore e qytetit urban me rrokaqiej 
Njoftim: Një foto e një kupe pylli me qiell blu nga poshtë Ndriçimi - natyral, dramatik, i ngrohtë, i ftohtë

Nxitje: foto studioje e një kolltuku modern, ndriçim natyral 
Nxitje: foto në studio e një kolltuku modern, ndriçim dramatik Cilësimet e kamerës - turbullim lëvizjeje, fokus i butë, bokeh, portret

Njoftim: foto e një qyteti me rrokaqiej nga brenda një makine me turbullim lëvizjeje 
Njoftim: fotografi me fokus të butë e një ure në një qytet urban natën Llojet e lenteve - 35 mm, 50 mm, sy peshku, kënd i gjerë, makro

Njoftim: foto e një gjetheje, makrolent 
Nxitje: fotografi rruge, qyteti i Nju Jorkut, lente fisheye Llojet e filmave - bardhë e zi, polaroid

Nxitje: një portret polaroid i një qeni që mban syze dielli 
Njoftim: foto bardh e zi e një qeni që mban syze dielli 
Burimi i imazhit: Çdo imazh u gjenerua duke përdorur komandën përkatëse të tekstit me modelin Imagen 3.
Ilustrim dhe art
- Kërkesa përfshin: "Një painting e..." , "Një sketch e..."
 
Stilet e artit variojnë nga stilet monokrome si skicat me laps, deri te arti dixhital hiperrealist. Për shembull, imazhet e mëposhtme përdorin të njëjtën nxitje me stile të ndryshme:
"Një [art style or creation technique] e një sedani elektrik sportiv këndor me rrokaqiej në sfond"
![]()  | ![]()  | ![]()  | 
![]()  | ![]()  | ![]()  | 
Burimi i imazhit: Çdo imazh u gjenerua duke përdorur komandën përkatëse të tekstit me modelin Imagen 2.
Format dhe materialet
- Pyetja përfshin: "...e bërë nga..." , "...në formën e..."
 
Një nga pikat e forta të kësaj teknologjie është se ju mund të krijoni imazhe që përndryshe do të ishin të vështira ose të pamundura. Për shembull, ju mund të rikrijoni logon e kompanisë suaj në materiale dhe tekstura të ndryshme.
![]()  | ![]()  | ![]()  | 
Burimi i imazhit: Çdo imazh u gjenerua duke përdorur komandën përkatëse të tekstit me modelin Imagen 3.
Referenca historike të artit
- Kërkesa përfshin: "...në stilin e..."
 
Disa stile janë bërë ikonike me kalimin e viteve. Më poshtë janë disa ide të pikturës historike ose stileve të artit që mund të provoni.
"gjenero një imazh në stilin e [art period or movement] : një park eolik"
![]()  | ![]()  | ![]()  | 
Burimi i imazhit: Çdo imazh u gjenerua duke përdorur komandën përkatëse të tekstit me modelin Imagen 3.
Modifikuesit e cilësisë së imazhit
Disa fjalë kyçe mund ta bëjnë të ditur modelin se po kërkoni një aset me cilësi të lartë. Shembuj të modifikuesve të cilësisë përfshijnë sa vijon:
- Modifikues të Përgjithshëm - me cilësi të lartë, të bukur, të stilizuar
 - Foto - 4K, HDR, Foto në Studio
 - Art, Ilustrim - nga një profesionist, i detajuar
 
Më poshtë janë disa shembuj të kërkesave pa modifikues të cilësisë dhe e njëjta kërkesë me modifikues të cilësisë.
![]()  | ![]() foto e një kërcelli misri të bërë nga një fotograf profesionist  | 
Burimi i imazhit: Çdo imazh u gjenerua duke përdorur komandën përkatëse të tekstit me modelin Imagen 3.
Raportet e aspektit
Gjenerimi i imazheve Imagen ju lejon të vendosni pesë raporte të dallueshme të aspekteve të imazhit.
- Katror (1:1, parazgjedhur) - Një foto katrore standarde. Përdorimet e zakonshme për këtë raport pamjeje përfshijnë postimet në mediat sociale.
 Ekran i plotë (4:3) - Ky raport aspekti përdoret zakonisht në media ose film. Është gjithashtu dimensioni i shumicës së televizorëve të vjetër (jo me ekran të gjerë) dhe kamerave me format të mesëm. Ai kap më shumë nga skena horizontalisht (krahasuar me 1:1), duke e bërë atë një raport aspekti të preferuar për fotografinë.

Nxitje: pamje nga afër e gishtërinjve të një muzikanti që luan në piano, film bardhë e zi, klasik (raporti i aspektit 4:3) 
Njoftim: Një foto profesionale studioje e patateve të skuqura për një restorant luksoz, në stilin e një reviste ushqimore (raporti i aspektit 4:3) Ekran i plotë portret (3:4) - Ky është raporti i aspektit të ekranit të plotë i rrotulluar 90 gradë. Kjo lejon të kapet më shumë nga skena vertikalisht krahasuar me raportin e aspektit 1:1.

Stimul: një grua duke bërë ecje malore, pjesa e pasme e çizmeve të saj pasqyrohet në një pellg, male të mëdha në sfond, në stilin e një reklame, kënde dramatike (raporti i aspektit 3:4) 
Njoftim: pamje ajrore e një lumi që rrjedh përgjatë një lugine mistike (raporti i aspektit 3:4) Ekran i gjerë (16:9) - Ky raport ka zëvendësuar raportin 4:3 dhe tani është raporti më i zakonshëm i aspektit për televizorët, monitorët dhe ekranet e telefonave celularë (peizazh). Përdoreni këtë raport aspekti kur dëshironi të kapni më shumë nga sfondi (për shembull, peizazhe piktoreske).

Njoftim: një burrë i veshur tërësisht me rroba të bardha i ulur në plazh, pamje nga afër, ndriçim i orës së artë (raporti i aspektit 16:9) Portret (9:16) - Ky raport është ekran i gjerë, por i rrotulluar. Ky është një raport relativisht i ri i aspektit që është popullarizuar nga aplikacionet e videove të shkurtra (për shembull, filmat e shkurtër në YouTube). Përdoreni këtë për objekte të larta me orientime të forta vertikale, siç janë ndërtesat, pemët, ujëvarat ose objekte të tjera të ngjashme.

Njoftim: një renderim dixhital i një rrokaqielli masiv, modern, madhështor, epik me një perëndim dielli të bukur në sfond (raporti i aspektit 9:16) 
Imazhe fotorealiste
Versione të ndryshme të modelit të gjenerimit të imazhit mund të ofrojnë një përzierje të rezultateve artistike dhe fotorealiste. Përdorni formulimin e mëposhtëm në udhëzime për të gjeneruar më shumë rezultate fotorealiste, bazuar në subjektin që dëshironi të gjeneroni.
| Rast përdorimi | Lloji i lentes | Gjatësitë fokale | Detaje shtesë | 
|---|---|---|---|
| Njerëz (portrete) | Kryesor, zmadhim | 24-35 mm | film bardh e zi, Film noir, Thellësi fushe, dyngjyrësh (përmend dy ngjyra) | 
| Ushqim, insekte, bimë (objekte, natyrë e qetë) | Makro | 60-105 mm | Detaje të larta, fokusim i saktë, ndriçim i kontrolluar | 
| Sporte, kafshë të egra (lëvizje) | Zmadhim telefoto | 100-400 mm | Shpejtësi e lartë e qepenit, gjurmim i veprimit ose lëvizjes | 
| Astronomik, peizazh (kënd i gjerë) | Kënd i gjerë | 10-24 mm | Kohë të gjata ekspozimi, fokus i mprehtë, ekspozim i gjatë, ujë i qetë ose re | 
Portrete
| Rast përdorimi | Lloji i lentes | Gjatësitë fokale | Detaje shtesë | 
|---|---|---|---|
| Njerëz (portrete) | Kryesor, zmadhim | 24-35 mm | film bardh e zi, Film noir, Thellësi fushe, dyngjyrësh (përmend dy ngjyra) | 
Duke përdorur disa fjalë kyçe nga tabela, Imagen mund të gjenerojë portretet e mëposhtme:
![]()  | ![]()  | ![]()  | ![]()  | 
 Stimul: Një grua, portret 35 mm, dyngjyrëshe blu dhe gri
 Modeli: imagen-3.0-generate-002 
![]()  | ![]()  | ![]()  | ![]()  | 
 Stimul: Një grua, portret 35 mm, film noir
 Modeli: imagen-3.0-generate-002
Objektet
| Rast përdorimi | Lloji i lentes | Gjatësitë fokale | Detaje shtesë | 
|---|---|---|---|
| Ushqim, insekte, bimë (objekte, natyrë e qetë) | Makro | 60-105 mm | Detaje të larta, fokusim i saktë, ndriçim i kontrolluar | 
Duke përdorur disa fjalë kyçe nga tabela, Imagen mund të gjenerojë imazhet e mëposhtme të objekteve:
![]()  | ![]()  | ![]()  | ![]()  | 
 Nxitje: gjethe e një bime lutjeje, makrolent, 60 mm
 Modeli: imagen-3.0-generate-002 
![]()  | ![]()  | ![]()  | ![]()  | 
 Nxitje: një pjatë me makarona, lente makro 100 mm
 Modeli: imagen-3.0-generate-002
Lëvizje
| Rast përdorimi | Lloji i lentes | Gjatësitë fokale | Detaje shtesë | 
|---|---|---|---|
| Sporte, kafshë të egra (lëvizje) | Zmadhim telefoto | 100-400 mm | Shpejtësi e lartë e qepenit, gjurmim i veprimit ose lëvizjes | 
Duke përdorur disa fjalë kyçe nga tabela, Imagen mund të gjenerojë imazhet e mëposhtme në lëvizje:
![]()  | ![]()  | ![]()  | ![]()  | 
 Nxitje: një gol fitues, shpejtësi e lartë e qepenit, gjurmim lëvizjeje
 Modeli: imagen-3.0-generate-002 
![]()  | ![]()  | ![]()  | ![]()  | 
 Njoftim: Një dre që vrapon në pyll, shpejtësi e lartë e qepenit, gjurmim lëvizjeje
 Modeli: imagen-3.0-generate-002
Kënd i gjerë
| Rast përdorimi | Lloji i lentes | Gjatësitë fokale | Detaje shtesë | 
|---|---|---|---|
| Astronomik, peizazh (kënd i gjerë) | Kënd i gjerë | 10-24 mm | Kohë të gjata ekspozimi, fokus i mprehtë, ekspozim i gjatë, ujë i qetë ose re | 
Duke përdorur disa fjalë kyçe nga tabela, Imagen mund të gjenerojë imazhet e mëposhtme me kënd të gjerë:
![]()  | ![]()  | ![]()  | ![]()  | 
 Nxitje: një vargmal i gjerë, peizazh me kënd të gjerë 10 mm
 Modeli: imagen-3.0-generate-002 
![]()  | ![]()  | ![]()  | ![]()  | 
 Nxitje: një foto e hënës, fotografi astro, kënd i gjerë 10 mm
 Modeli: imagen-3.0-generate-002
Versionet e modelit
Imazhi 4
| Pronë | Përshkrimi | 
|---|---|
| Kodi i modelit të | API-ja e Gemini-t    | 
| llojet e të dhënave të mbështetura | Hyrje Tekst Prodhimi Imazhe  | 
| Limitet e token [*] | Limiti i tokenit të hyrjes 480 tokena (tekst) Imazhe të nxjerra 1 deri në 4 (Ultra/Standard/I Shpejtë)  | 
| Përditësimi më i fundit | Qershor 2025 | 
Imazhi 3
| Pronë | Përshkrimi | 
|---|---|
| Kodi i modelit të | API-ja e Gemini-t    | 
| llojet e të dhënave të mbështetura | Hyrje Tekst Prodhimi Imazhe  | 
| Limitet e token [*] | Limiti i tokenit të hyrjes N/A Imazhe të nxjerra Deri në 4  | 
| Përditësimi më i fundit | Shkurt 2025 | 





















































