Gjeneroni imazhe

Gemini API mbështet gjenerimin e imazheve duke përdorur Gemini 2.0 Flash Experimental dhe duke përdorur Imagen 3 . Ky udhëzues ju ndihmon të filloni me të dy modelet.

Për udhëzime për nxitjen e imazheve, shikoni seksionin e udhëzuesit të shpejtë të Imagen .

Para se të filloni

Përpara se të telefononi Gemini API, sigurohuni që keni të instaluar SDK-në tuaj të zgjedhur dhe një çelës Gemini API të konfiguruar dhe gati për t'u përdorur.

Gjeneroni imazhe duke përdorur Gemini

Gemini 2.0 Flash Experimental mbështet aftësinë për të nxjerrë tekst dhe imazhe inline. Kjo ju lejon të përdorni Binjakët për të modifikuar në mënyrë bisedore imazhe ose për të gjeneruar rezultate me tekst të ndërthurur (për shembull, duke krijuar një postim në blog me tekst dhe imazhe në një kthesë të vetme). Të gjitha imazhet e krijuara përfshijnë një filigran SynthID dhe imazhet në Google AI Studio përfshijnë gjithashtu një filigran të dukshëm.

Shembulli i mëposhtëm tregon se si të përdorni Gemini 2.0 për të gjeneruar dalje teksti dhe imazhi:

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import base64

client = genai.Client()

contents = ('Hi, can you create a 3d rendered image of a pig '
            'with wings and a top hat flying over a happy '
            'futuristic scifi city with lots of greenery?')

response = client.models.generate_content(
    model="gemini-2.0-flash-exp-image-generation",
    contents=contents,
    config=types.GenerateContentConfig(
      response_modalities=['TEXT', 'IMAGE']
    )
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO((part.inline_data.data)))
    image.save('gemini-native-image.png')
    image.show()
import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  const contents =
    "Hi, can you create a 3d rendered image of a pig " +
    "with wings and a top hat flying over a happy " +
    "futuristic scifi city with lots of greenery?";

  // Set responseModalities to include "Image" so the model can generate  an image
  const response = await ai.models.generateContent({
    model: "gemini-2.0-flash-exp-image-generation",
    contents: contents,
    config: {
      responseModalities: [Modality.TEXT, Modality.IMAGE],
    },
  });
  for (const part of response.candidates[0].content.parts) {
    // Based on the part type, either show the text or save the image
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageData = part.inlineData.data;
      const buffer = Buffer.from(imageData, "base64");
      fs.writeFileSync("gemini-native-image.png", buffer);
      console.log("Image saved as gemini-native-image.png");
    }
  }
}

main();
curl -s -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp-image-generation:generateContent?key=$GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [
        {"text": "Hi, can you create a 3d rendered image of a pig with wings and a top hat flying over a happy futuristic scifi city with lots of greenery?"}
      ]
    }],
    "generationConfig":{"responseModalities":["TEXT","IMAGE"]}
  }' \
  | grep -o '"data": "[^"]*"' \
  | cut -d'"' -f4 \
  | base64 --decode > gemini-native-image.png
Imazhi i krijuar nga AI i një derri fantastik fluturues
Imazhi i krijuar nga AI i një derri fantastik fluturues

Në varësi të kërkesës dhe kontekstit, Binjakët do të gjenerojnë përmbajtje në mënyra të ndryshme (tekst në imazh, tekst në imazh dhe tekst, etj.). Këtu janë disa shembuj:

  • Teksti në imazh
    • Shembull i kërkesës: "Gjeneroni një imazh të kullës Eifel me fishekzjarre në sfond."
  • Teksti në imazh(et) dhe teksti (i ndërthurur)
    • Shembull i kërkesës: "Krijoni një recetë të ilustruar për një paella."
  • Imazhi(et) dhe teksti në imazh(et) dhe teksti (i ndërthurur)
    • Shembull i kërkesës: (Me një imazh të një dhome të mobiluar) "Cila divane me ngjyra të tjera do të funksiononin në hapësirën time? a mund ta përditësoni imazhin?"
  • Redaktimi i imazhit (tekst dhe imazh në imazh)
    • Shembull i kërkesës: "Ndrysho këtë imazh që të duket si një film vizatimor"
    • Shembull i kërkesës: [imazhi i një mace] + [imazhi i një jastëku] + "Krijo një qepje tërthore të maces sime në këtë jastëk."
  • Redaktimi i imazhit me shumë kthesa (chat)
    • Shembull kërkon: [ngarkoni një imazh të një makine blu.] "Kthejeni këtë makinë në një makinë të konvertueshme." "Tani ndryshoni ngjyrën në të verdhë."

Redaktimi i imazhit me Binjakët

Për të kryer redaktimin e imazhit, shtoni një imazh si hyrje. Shembulli i mëposhtëm tregon ngarkimin e imazheve të koduara bazë64. Për imazhe të shumta dhe ngarkesa më të mëdha, kontrolloni seksionin e futjes së imazhit .

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

import PIL.Image

image = PIL.Image.open('/path/to/image.png')

client = genai.Client()

text_input = ('Hi, This is a picture of me.'
            'Can you add a llama next to me?',)

response = client.models.generate_content(
    model="gemini-2.0-flash-exp-image-generation",
    contents=[text_input, image],
    config=types.GenerateContentConfig(
      response_modalities=['TEXT', 'IMAGE']
    )
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO(part.inline_data.data))
    image.show()
import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  // Load the image from the local file system
  const imagePath = "path/to/image.png";
  const imageData = fs.readFileSync(imagePath);
  const base64Image = imageData.toString("base64");

  // Prepare the content parts
  const contents = [
    { text: "Can you add a llama next to the image?" },
    {
      inlineData: {
        mimeType: "image/png",
        data: base64Image,
      },
    },
  ];

  // Set responseModalities to include "Image" so the model can generate an image
  const response = await ai.models.generateContent({
    model: "gemini-2.0-flash-exp-image-generation",
    contents: contents,
    config: {
      responseModalities: [Modality.TEXT, Modality.IMAGE],
    },
  });
  for (const part of response.candidates[0].content.parts) {
    // Based on the part type, either show the text or save the image
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageData = part.inlineData.data;
      const buffer = Buffer.from(imageData, "base64");
      fs.writeFileSync("gemini-native-image.png", buffer);
      console.log("Image saved as gemini-native-image.png");
    }
  }
}

main();
IMG_PATH=/path/to/your/image1.jpeg

if [[ "$(base64 --version 2>&1)" = *"FreeBSD"* ]]; then
  B64FLAGS="--input"
else
  B64FLAGS="-w0"
fi

IMG_BASE64=$(base64 "$B64FLAGS" "$IMG_PATH" 2>&1)

curl -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp-image-generation:generateContent?key=$GEMINI_API_KEY" \
    -H 'Content-Type: application/json' \
    -d "{
      \"contents\": [{
        \"parts\":[
            {\"text\": \"'Hi, This is a picture of me. Can you add a llama next to me\"},
            {
              \"inline_data\": {
                \"mime_type\":\"image/jpeg\",
                \"data\": \"$IMG_BASE64\"
              }
            }
        ]
      }],
      \"generationConfig\": {\"responseModalities\": [\"TEXT\", \"IMAGE\"]}
    }"  \
  | grep -o '"data": "[^"]*"' \
  | cut -d'"' -f4 \
  | base64 --decode > gemini-edited-image.png

Kufizimet

  • Për performancën më të mirë, përdorni gjuhët e mëposhtme: EN, es-MX, ja-JP, zh-CN, hi-IN.
  • Gjenerimi i imazhit nuk mbështet hyrjet audio ose video.
  • Gjenerimi i imazhit mund të mos shkaktojë gjithmonë:
    • Modeli mund të nxjerrë vetëm tekst. Provoni të kërkoni në mënyrë eksplicite rezultatet e imazhit (p.sh. "gjeneroni një imazh", "siguroni imazhe ndërsa vazhdoni", "përditësoni imazhin").
    • Modeli mund të ndalojë së prodhuari pjesërisht. Provo sërish ose provo një kërkesë tjetër.
  • Kur krijoni tekst për një imazh, Binjakët funksionojnë më mirë nëse së pari krijoni tekstin dhe më pas kërkoni një imazh me tekstin.

Zgjidhni një model

Cilin model duhet të përdorni për të krijuar imazhe? Kjo varet nga rasti i përdorimit tuaj.

Gemini 2.0 është më i miri për prodhimin e imazheve përkatëse në kontekst, përzierjen e tekstit + imazhet, përfshirjen e njohurive botërore dhe arsyetimin rreth imazheve. Ju mund ta përdorni atë për të krijuar pamje të sakta, përkatëse kontekstuale, të ngulitura në sekuenca të gjata teksti. Ju gjithashtu mund t'i modifikoni imazhet në bisedë, duke përdorur gjuhën natyrore, duke ruajtur kontekstin gjatë gjithë bisedës.

Nëse cilësia e imazhit është prioriteti juaj kryesor, atëherë Imagen 3 është një zgjedhje më e mirë. Imagen 3 shkëlqen në fotorealizëm, detaje artistike dhe stile specifike artistike si impresionizmi ose anime. Imagen 3 është gjithashtu një zgjedhje e mirë për detyra të specializuara të redaktimit të imazheve si përditësimi i sfondeve të produkteve, përmirësimi i imazheve dhe futja e markës dhe stilit në pamjet vizuale. Ju mund të përdorni Imagen 3 për të krijuar logo ose modele të tjera produktesh të markës.

Gjeneroni imazhe duke përdorur Imagen 3

Gemini API ofron akses në Imagen 3 , modeli tekst-në-imazh i cilësisë më të lartë të Google, duke shfaqur një sërë aftësish të reja dhe të përmirësuara. Imazhi 3 mund të bëjë sa më poshtë:

  • Gjeneroni imazhe me detaje më të mira, ndriçim më të pasur dhe më pak objekte shpërqendruese sesa modelet e mëparshme
  • Kuptoni udhëzimet e shkruara në gjuhë natyrore
  • Gjeneroni imazhe në një gamë të gjerë formatesh dhe stilesh
  • Paraqitni tekstin në mënyrë më efektive se modelet e mëparshme
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client(api_key='GEMINI_API_KEY')

response = client.models.generate_images(
    model='imagen-3.0-generate-002',
    prompt='Robot holding a red skateboard',
    config=types.GenerateImagesConfig(
        number_of_images= 4,
    )
)
for generated_image in response.generated_images:
  image = Image.open(BytesIO(generated_image.image.image_bytes))
  image.show()
import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  const response = await ai.models.generateImages({
    model: 'imagen-3.0-generate-002',
    prompt: 'Robot holding a red skateboard',
    config: {
      numberOfImages: 4,
    },
  });

  let idx = 1;
  for (const generatedImage of response.generatedImages) {
    let imgBytes = generatedImage.image.imageBytes;
    const buffer = Buffer.from(imgBytes, "base64");
    fs.writeFileSync(`imagen-${idx}.png`, buffer);
    idx++;
  }
}

main();
curl -X POST \
    "https://generativelanguage.googleapis.com/v1beta/models/imagen-3.0-generate-002:predict?key=GEMINI_API_KEY" \
    -H "Content-Type: application/json" \
    -d '{
        "instances": [
          {
            "prompt": "Robot holding a red skateboard"
          }
        ],
        "parameters": {
          "sampleCount": 4
        }
      }'
Imazhi i krijuar nga AI i dy lepurushëve të paqartë në kuzhinë
Imazhi i krijuar nga AI i dy lepurushëve të paqartë në kuzhinë

Imagen mbështet kërkesat vetëm në anglisht në këtë moment dhe parametrat e mëposhtëm:

Parametrat e modelit të imazhit

(Konventat e emërtimit ndryshojnë sipas gjuhës së programimit.)

  • numberOfImages : Numri i imazheve për të gjeneruar, nga 1 në 4 (përfshirë). Parazgjedhja është 4.
  • aspectRatio : Ndryshon raportin e pamjes së imazhit të krijuar. Vlerat e mbështetura janë "1:1" , "3:4" , "4:3" , "9:16" dhe "16:9" . Parazgjedhja është "1:1" .
  • personGeneration : Lejo modelin të gjenerojë imazhe të njerëzve. Vlerat e mëposhtme mbështeten:
    • "DONT_ALLOW" : Blloko gjenerimin e imazheve të njerëzve.
    • "ALLOW_ADULT" : Krijo imazhe të të rriturve, por jo të fëmijëve. Ky është standardi.

Udhëzues i shpejtë i imazhit

Ky seksion i udhëzuesit Imagen ju tregon se si modifikimi i një kërkese tekst-në-imazh mund të prodhojë rezultate të ndryshme, së bashku me shembuj të imazheve që mund të krijoni.

Bazat e menjëhershme të shkrimit

Një kërkesë e mirë është përshkruese dhe e qartë, dhe përdor fjalë kyçe dhe modifikues kuptimplotë. Filloni duke menduar për temën , kontekstin dhe stilin tuaj.

Njoftoni me temën, kontekstin dhe stilin e theksuar
Teksti i imazhit: Një skicë ( stil ) e një ndërtese moderne apartamentesh ( subjekt ) i rrethuar nga rrokaqiejt ( konteksti dhe sfondi ).
  1. Tema : Gjëja e parë për të cilën duhet të mendoni me çdo kërkesë është tema : objekti, personi, kafsha ose peizazhi që dëshironi një imazh.

  2. Konteksti dhe sfondi: Po aq i rëndësishëm është sfondi ose konteksti në të cilin do të vendoset subjekti. Provoni ta vendosni subjektin tuaj në sfonde të ndryshme. Për shembull, një studio me sfond të bardhë, në ambiente të jashtme ose të brendshme.

  3. Stili: Së fundi, shtoni stilin e imazhit që dëshironi. Stilet mund të jenë të përgjithshme (pikturë, fotografi, skica) ose shumë specifike (pikturë pastel, vizatim me qymyr, izometrik 3D). Ju gjithashtu mund të kombinoni stilet.

Pasi të shkruani një version të parë të kërkesës suaj, rafinoni kërkesën tuaj duke shtuar më shumë detaje derisa të arrini te imazhi që dëshironi. Përsëritja është e rëndësishme. Filloni duke krijuar idenë tuaj bazë, dhe më pas përsojeni dhe zgjeroni atë ide thelbësore derisa imazhi i krijuar të jetë afër vizionit tuaj.

Imazhi i mostrës fotorealiste 1
Prompt: Një park në pranverë pranë një liqeni
imazh fotorealist mostër 2
Prompt: Një park në pranverë pranë një liqeni, dielli perëndon përtej liqenit, orë e artë
Imazhi i mostrës fotorealiste 3
Njoftim: Një park në pranverë pranë një liqeni, dielli perëndon mbi liqen, orë e artë, lule të egra të kuqe

Imagen 3 mund t'i transformojë idetë tuaja në imazhe të detajuara, pavarësisht nëse kërkesat tuaja janë të shkurtra apo të gjata dhe të detajuara. Përsosni vizionin tuaj nëpërmjet nxitjes përsëritëse, duke shtuar detaje derisa të arrini rezultatin perfekt.

Kërkesat e shkurtra ju lejojnë të krijoni një imazh shpejt.

Imazhi 3 shembull i shkurtër i shpejtë
Prompt: foto nga afër e një gruaje në të 20-at, fotografi në rrugë, filma filmash, tone të ngrohta të heshtura portokalli

Kërkesat më të gjata ju lejojnë të shtoni detaje specifike dhe të ndërtoni imazhin tuaj.

Shembull i shpejtë i imazhit 3
Prompt: foto magjepsëse e një gruaje në të 20-at e saj duke përdorur një stil fotografik në rrugë. Imazhi duhet të duket si një film ende me tone të ngrohta portokalli të heshtur.

Këshilla shtesë për shkrimin e shpejtë të Imagen:

  • Përdorni gjuhën përshkruese : Përdorni mbiemra dhe ndajfolje të detajuara për të dhënë një pamje të qartë për Imagen 3.
  • Jepni kontekstin : Nëse është e nevojshme, përfshini informacione bazë për të ndihmuar të kuptuarit e AI.
  • Referojuni artistëve ose stileve specifike : Nëse keni një estetikë të veçantë në mendje, referimi i artistëve ose lëvizjeve të veçanta të artit mund të jetë i dobishëm.
  • Përdorni mjete të menjëhershme inxhinierike : Merrni parasysh eksplorimin e mjeteve ose burimeve të shpejta inxhinierike për t'ju ndihmuar të rafinoni kërkesat tuaja dhe të arrini rezultate optimale.
  • Përmirësimi i detajeve të fytyrës në imazhet tuaja personale dhe grupore :
    • Specifikoni detajet e fytyrës si fokus të fotografisë (për shembull, përdorni fjalën "portret" në kërkesë).

Gjeneroni tekst në imazhe

Imagen mund të shtojë tekst në imazhe, duke hapur më shumë mundësi krijuese të krijimit të imazheve. Përdorni udhëzimet e mëposhtme për të përfituar sa më shumë nga kjo veçori:

  • Përsëriteni me besim : Mund t'ju duhet të rigjeneroni imazhet derisa të arrini pamjen që dëshironi. Integrimi i tekstit të Imagen është ende në zhvillim, dhe nganjëherë përpjekjet e shumta japin rezultatet më të mira.
  • Mbajeni të shkurtër : Kufizoni tekstin në 25 karaktere ose më pak për gjenerim optimal.
  • Fraza të shumta : Eksperimentoni me dy ose tre fraza të ndryshme për të dhënë informacion shtesë. Shmangni tejkalimin e tre frazave për kompozime më të pastra.

    Imazhi 3 gjeneron shembull teksti
    Prompt: Një poster me tekstin "Summerland" me shkronja të zeza si titull, poshtë këtij teksti është slogani "Summer never ndjerë kaq mirë"
  • Vendosja e udhëzuesit : Ndërsa Imagen mund të përpiqet të pozicionojë tekstin sipas udhëzimeve, prisni ndryshime të herëpashershme. Kjo veçori po përmirësohet vazhdimisht.

  • Frymëzoni stilin e shkronjave : Specifikoni një stil të përgjithshëm fonti për të ndikuar në mënyrë delikate në zgjedhjet e Imagen. Mos u mbështetni në përsëritjen e saktë të shkronjave, por prisni interpretime krijuese.

  • Madhësia e shkronjave : Specifikoni një madhësi fonti ose një tregues të përgjithshëm të madhësisë (për shembull, i vogël , i mesëm , i madh ) për të ndikuar në gjenerimin e madhësisë së shkronjave.

Parametrizim i menjëhershëm

Për të kontrolluar më mirë rezultatet e daljes, mund të jetë e dobishme të parametrizoni hyrjet në Imagen. Për shembull, supozoni se dëshironi që klientët tuaj të jenë në gjendje të gjenerojnë logo për biznesin e tyre dhe dëshironi të siguroheni që logot të krijohen gjithmonë në një sfond me ngjyra të forta. Ju gjithashtu dëshironi të kufizoni opsionet që klienti mund të zgjedhë nga një menu.

Në këtë shembull, ju mund të krijoni një kërkesë të parametrizuar të ngjashme me sa vijon:

A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.

Në ndërfaqen tuaj të personalizuar të përdoruesit, klienti mund të futë parametrat duke përdorur një meny dhe vlera e tyre e zgjedhur plotëson kërkesën që merr Imagen.

Për shembull:

  1. Prompt: A minimalist logo for a health care company on a solid color background. Include the text Journey .

    Shembulli i parametrizimit të shpejtë të imazhit 3 1

  2. Prompt: A modern logo for a software company on a solid color background. Include the text Silo .

    Shembulli 2 i parametrizimit të shpejtë të imazhit 3

  3. Prompt: A traditional logo for a baking company on a solid color background. Include the text Seed .

    Shembulli 3 i parametrizimit të shpejtë të imazhit 3

Teknika të avancuara të shkrimit të shpejtë

Përdorni shembujt e mëposhtëm për të krijuar kërkesa më specifike bazuar në atribute si përshkruesit e fotografisë, format dhe materialet, lëvizjet e artit historik dhe modifikuesit e cilësisë së imazhit.

Fotografia

  • Prompti përfshin: "Një foto e..."

Për të përdorur këtë stil, filloni me përdorimin e fjalëve kyçe që i tregojnë qartë Imagen se po kërkoni një fotografi. Filloni kërkesat tuaja me "Një foto e ...." . Për shembull:

Imazhi i mostrës fotorealiste 1
Prompt: Një foto e kokrrave të kafesë në një kuzhinë në një sipërfaqe druri
imazh fotorealist mostër 2
Prompt: Një foto e një çokollate në një banak kuzhine
Imazhi i mostrës fotorealiste 3
Prompt: Një foto e një ndërtese moderne me ujë në sfond

Burimi i imazhit: Çdo imazh u krijua duke përdorur kërkesën përkatëse të tekstit me modelin Imagen 3.

Modifikuesit e fotografisë

Në shembujt e mëposhtëm, mund të shihni disa modifikues dhe parametra specifikë të fotografisë. Ju mund të kombinoni modifikues të shumtë për kontroll më të saktë.

  1. Afërsia me kamerën - nga afër, e marrë nga larg

    nga afër imazhin e mostrës së kamerës
    Prompt: Një foto nga afër e kokrrave të kafesë
    imazhi i mostrës së kamerës së zmadhuar
    Prompt: Një foto e zmadhuar e një çantë të vogël të
    kokrra kafeje në një kuzhinë të çrregullt

  2. Pozicioni i kamerës - ajrore, nga poshtë

    Imazhi i mostrës së fotografisë ajrore
    Prompt: foto ajrore e qytetit urban me rrokaqiejt
    një pamje nga poshtë imazhit të mostrës
    Prompt: Një foto e një tende pylli me qiell blu nga poshtë
  3. Ndriçimi - natyral, dramatik, i ngrohtë, i ftohtë

    Imazhi i mostrës së ndriçimit natyror
    Prompt: foto në studio e një karrige moderne, ndriçim natyral
    imazh i mostrës së ndriçimit dramatik
    Prompt: foto në studio e një karrige moderne, ndriçim dramatik
  4. Cilësimet e kamerës - turbullim i lëvizjes, fokus i butë, bokeh, portret

    mostër e imazhit të turbullimit të lëvizjes
    Prompt: foto e një qyteti me rrokaqiej nga pjesa e brendshme e një makine me turbullim lëvizjeje
    imazh i mostrës me fokus të butë
    Prompt: fotografi me fokus të butë të një ure në një qytet urban gjatë natës
  5. Llojet e lenteve - 35mm, 50mm, fisheye, kënd të gjerë, makro

    imazh i mostrës së lenteve makro
    Prompt: foto e një gjetheje, lente makro
    Imazhi i mostrës së lenteve të syrit të peshkut
    Prompt: fotografi në rrugë, New York City, lente fisheye
  6. Llojet e filmit - bardh e zi, polaroid

    Imazhi i mostrës së fotografisë polaroid
    Prompt: një portret polaroid i një qeni që mban syze dielli
    Imazhi i mostrës së fotografisë bardh e zi
    Prompt: foto bardh e zi e një qeni me syze dielli

Burimi i imazhit: Çdo imazh u krijua duke përdorur kërkesën përkatëse të tekstit me modelin Imagen 3.

Ilustrimi dhe arti

  • Prompti përfshin: "Një painting e..." , "Një sketch e..."

Stilet e artit ndryshojnë nga stilet njëngjyrëshe si skicat me laps, deri te arti dixhital hiper-realist. Për shembull, imazhet e mëposhtme përdorin të njëjtën kërkesë me stile të ndryshme:

"Një [art style or creation technique] i një sedani elektrik sportiv këndor me rrokaqiejt në sfond"

mostra të imazheve të artit
Prompt: Një vizatim teknik me laps i një këndore...
mostra të imazheve të artit
Prompt: Një vizatim me qymyr i një këndore...
mostra të imazheve të artit
Prompt: Një vizatim me laps me ngjyra i një këndore...
mostra të imazheve të artit
Prompt: Një pikturë pastel e një këndore...
mostra të imazheve të artit
Prompt: Një art dixhital i një këndi...
mostra të imazheve të artit
Prompt: Një dekorim arti (poster) i një këndi...

Burimi i imazhit: Çdo imazh u krijua duke përdorur kërkesën përkatëse të tekstit me modelin Imagen 2.

Format dhe materialet

  • Prompti përfshin: "...i bërë nga..." , "...në formën e..."

Një nga pikat e forta të kësaj teknologjie është se ju mund të krijoni imazhe që përndryshe janë të vështira ose të pamundura. Për shembull, ju mund të rikrijoni logon e kompanisë tuaj në materiale dhe tekstura të ndryshme.

forma dhe materiale shembull imazhi 1
Njoftim: një qese me gjizë e bërë me djathë
forma dhe materiale shembull imazhi 2
Prompt: tuba neoni në formën e një zogu
forma dhe materiale shembull imazhi 3
Prompt: një kolltuk i bërë nga letra , foto në studio, stil origami

Burimi i imazhit: Çdo imazh u krijua duke përdorur kërkesën përkatëse të tekstit me modelin Imagen 3.

Referencat e artit historik

  • Prompti përfshin: "...në stilin e..."

Disa stile janë bërë ikonë me kalimin e viteve. Më poshtë janë disa ide të pikturës historike ose stileve të artit që mund të provoni.

"gjeneroni një imazh në stilin e [art period or movement] : një fermë me erë"

shembull imazhi i impresionizmit
Prompt: gjeneroni një imazh në stilin e një pikture impresioniste : një fermë me erë
imazh shembull i rilindjes
Prompt: gjeneroni një imazh në stilin e një pikture të rilindjes : një fermë me erë
Imazhi i shembullit të artit pop
Prompt: gjeneroni një imazh në stilin e artit pop : një fermë me erë

Burimi i imazhit: Çdo imazh u krijua duke përdorur kërkesën përkatëse të tekstit me modelin Imagen 3.

Modifikuesit e cilësisë së imazhit

Disa fjalë kyçe mund t'i bëjnë të ditur modelit se po kërkoni një aset me cilësi të lartë. Shembuj të modifikuesve të cilësisë përfshijnë si më poshtë:

  • Modifikues të përgjithshëm - me cilësi të lartë, të bukur, të stilizuar
  • Fotografitë - 4K, HDR, Studio Foto
  • Art, Ilustrim - nga një profesionist, i detajuar

Më poshtë janë disa shembuj të kërkesave pa modifikues të cilësisë dhe e njëjta kërkesë me modifikues të cilësisë.

imazh misri shembull pa modifikues
Prompt (pa modifikues të cilësisë): një foto e një kërcell misri
misri shembull imazhi me modifikues
Prompt (me modifikues cilësor): 4k HDR i bukur
foto e një kërcell misri të marrë nga një
fotograf profesionist

Burimi i imazhit: Çdo imazh u krijua duke përdorur kërkesën përkatëse të tekstit me modelin Imagen 3.

Raportet e aspektit

Gjenerimi i imazhit Imagen 3 ju lejon të vendosni pesë raporte të dallueshme të pamjes së imazhit.

  1. Sheshi (1:1, i paracaktuar) - Një foto standarde katrore. Përdorimet e zakonshme për këtë raport aspekti përfshijnë postimet në mediat sociale.
  2. Ekrani i plotë (4:3) - Ky raport i pamjes përdoret zakonisht në media ose film. Janë gjithashtu dimensionet e shumicës së televizorëve të vjetër (jo me ekran të gjerë) dhe kamerave me format të mesëm. Ai kap më shumë nga skena horizontalisht (krahasuar me 1:1), duke e bërë atë një raport të preferuar të pamjes për fotografimin.

    shembull i raportit të pamjes
    Kërkim: nga afër gishtat e një muzikanti që luan në piano, film bardh e zi, vintage (raporti i pamjes 4:3)
    shembull i raportit të pamjes
    Prompt: Një foto profesionale në studio e patate të skuqura për një restorant të nivelit të lartë, në stilin e një reviste ushqimore (raporti i pamjes 4:3)
  3. Portret në ekran të plotë (3:4) - Ky është raporti i pamjes së ekranit të plotë i rrotulluar 90 gradë. Kjo ju lejon të kapni më shumë skenë vertikalisht në krahasim me raportin e pamjes 1:1.

    shembull i raportit të pamjes
    Njoftim: një grua në shëtitje, mbyllja e çizmeve të saj të pasqyruara në një pellg, male të mëdha në sfond, në stilin e një reklame, kënde dramatike (raporti i pamjes 3:4)
    shembull i raportit të pamjes
    Kërkesa: shkrepje ajrore e një lumi që rrjedh në një luginë mistike (raporti i pamjes 3:4)
  4. Ekrani i gjerë (16:9) - Ky raport ka zëvendësuar 4:3 dhe tani është raporti më i zakonshëm i pamjes për televizorët, monitorët dhe ekranet e telefonave celularë (peizazh). Përdorni këtë raport të pamjes kur dëshironi të kapni më shumë sfond (për shembull, peizazhe piktoreske).

    shembull i raportit të pamjes
    Njoftim: një burrë i veshur me rroba të bardha, ulur në plazh, nga afër, ndriçim i orës së artë (raporti i pamjes 16:9)
  5. Portret (9:16) - Ky raport është me ekran të gjerë, por i rrotulluar. Ky është një raport relativisht i ri i aspektit që është popullarizuar nga aplikacionet e videove në formë të shkurtër (për shembull, pantallonat e shkurtra në YouTube). Përdoreni këtë për objekte të larta me orientime të forta vertikale si ndërtesa, pemë, ujëvara ose objekte të tjera të ngjashme.

    shembull i raportit të pamjes
    Prompt: një paraqitje dixhitale e një rrokaqiell masiv, modern, madhështor, epik me një muzg të bukur në sfond (raporti i pamjes 9:16)

Imazhe fotorealiste

Versione të ndryshme të modelit të gjenerimit të imazhit mund të ofrojnë një përzierje të prodhimit artistik dhe fotorealist. Përdorni formulimin e mëposhtëm në kërkesat për të gjeneruar rezultate më fotorealiste, bazuar në subjektin që dëshironi të gjeneroni.

Rasti i përdorimit Lloji i lenteve Gjatësitë fokale Detaje shtesë
Njerëzit (portrete) Kryeni, zmadhoni 24-35 mm film bardh e zi, Film noir, Thellësia e fushës, duoton (përmend dy ngjyra)
Ushqimi, insektet, bimët (objektet, natyra e qetë) Makro 60-105 mm Detaje të larta, fokusim i saktë, ndriçim i kontrolluar
Sport, kafshë të egra (lëvizje) Zmadhimi i telefotos 100-400 mm Shpejtësia e shpejtë e diafragmës, ndjekja e veprimit ose lëvizjes
Astronomike, peizazhore (me kënd të gjerë) Me kënd të gjerë 10-24 mm Kohë të gjata ekspozimi, fokus i mprehtë, ekspozim i gjatë, ujë i qetë ose re

Portrete

Rasti i përdorimit Lloji i lenteve Gjatësitë fokale Detaje shtesë
Njerëzit (portrete) Kryeni, zmadhoni 24-35 mm film bardh e zi, Film noir, Thellësia e fushës, duoton (përmend dy ngjyra)

Duke përdorur disa fjalë kyçe nga tabela, Imagen mund të gjenerojë portretet e mëposhtme:

shembull i fotografisë së portretitshembull i fotografisë së portretitshembull i fotografisë së portretitshembull i fotografisë së portretit

Kërkesa: Një grua, portret 35 mm, duoton blu dhe gri
Modeli: imagen-3.0-generate-002

shembull i fotografisë së portretitshembull i fotografisë së portretitshembull i fotografisë së portretitshembull i fotografisë së portretit

Prompt: Një grua, portret 35 mm, film noir
Modeli: imagen-3.0-generate-002

Objektet

Rasti i përdorimit Lloji i lenteve Gjatësitë fokale Detaje shtesë
Ushqimi, insektet, bimët (objektet, natyra e qetë) Makro 60-105 mm Detaje të larta, fokusim i saktë, ndriçim i kontrolluar

Duke përdorur disa fjalë kyçe nga tabela, Imagen mund të gjenerojë imazhet e mëposhtme të objekteve:

shembull i fotografisë së objektitshembull i fotografisë së objektitshembull i fotografisë së objektitshembull i fotografisë së objektit

Prompt: fletë e një bime lutjeje, makro lente, 60 mm
Modeli: imagen-3.0-generate-002

shembull i fotografisë së objektitshembull i fotografisë së objektitshembull i fotografisë së objektitshembull i fotografisë së objektit

Prompt: një pjatë me makarona, lente makro 100 mm
Modeli: imagen-3.0-generate-002

Lëvizja

Rasti i përdorimit Lloji i lenteve Gjatësitë fokale Detaje shtesë
Sport, kafshë të egra (lëvizje) Zmadhimi i telefotos 100-400 mm Shpejtësia e shpejtë e diafragmës, ndjekja e veprimit ose lëvizjes

Duke përdorur disa fjalë kyçe nga tabela, Imagen mund të gjenerojë imazhet e mëposhtme të lëvizjes:

shembull i fotografisë në lëvizjeshembull i fotografisë në lëvizjeshembull i fotografisë në lëvizjeshembull i fotografisë në lëvizje

Prompt: një goditje fituese, shpejtësi e shpejtë e diafragmës, gjurmim i lëvizjes
Modeli: imagen-3.0-generate-002

shembull i fotografisë në lëvizjeshembull i fotografisë në lëvizjeshembull i fotografisë në lëvizjeshembull i fotografisë në lëvizje

Prompt: Një dre që vrapon në pyll, shpejtësi e shpejtë e diafragmës, gjurmim i lëvizjes
Modeli: imagen-3.0-generate-002

Me kënd të gjerë

Rasti i përdorimit Lloji i lenteve Gjatësitë fokale Detaje shtesë
Astronomike, peizazhore (me kënd të gjerë) Me kënd të gjerë 10-24 mm Kohë të gjata ekspozimi, fokus i mprehtë, ekspozim i gjatë, ujë i qetë ose re

Duke përdorur disa fjalë kyçe nga tabela, Imagen mund të gjenerojë imazhet e mëposhtme me kënd të gjerë:

shembull i fotografisë me kënd të gjerëshembull fotografie me kënd të gjerëshembull fotografie me kënd të gjerëshembull i fotografisë me kënd të gjerë

Prompt: një varg malor i gjerë, peizazh me kënd të gjerë 10 mm
Modeli: imagen-3.0-generate-002

shembull i fotografisë me kënd të gjerëshembull i fotografisë me kënd të gjerëshembull i fotografisë me kënd të gjerëshembull i fotografisë me kënd të gjerë

Prompt: një foto e hënës, fotografi astro, kënd i gjerë 10 mm
Modeli: imagen-3.0-generate-002

Çfarë është më pas