Imagen का इस्तेमाल करके इमेज जनरेट करना

Imagen, Google का इमेज जनरेट करने वाला एक मॉडल है. यह टेक्स्ट प्रॉम्प्ट से, असल और अच्छी क्वालिटी की इमेज जनरेट कर सकता है. जनरेट की गई सभी इमेज में SynthID वॉटरमार्क होता है. उपलब्ध Imagen मॉडल के अलग-अलग वर्शन के बारे में ज़्यादा जानने के लिए, मॉडल के वर्शन सेक्शन देखें.

Imagen मॉडल का इस्तेमाल करके इमेज जनरेट करना

इस उदाहरण में, Imagen मॉडल की मदद से इमेज जनरेट करने का तरीका बताया गया है:

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client()

response = client.models.generate_images(
    model='imagen-4.0-generate-001',
    prompt='Robot holding a red skateboard',
    config=types.GenerateImagesConfig(
        number_of_images= 4,
    )
)
for generated_image in response.generated_images:
  generated_image.image.show()

JavaScript

import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({});

  const response = await ai.models.generateImages({
    model: 'imagen-4.0-generate-001',
    prompt: 'Robot holding a red skateboard',
    config: {
      numberOfImages: 4,
    },
  });

  let idx = 1;
  for (const generatedImage of response.generatedImages) {
    let imgBytes = generatedImage.image.imageBytes;
    const buffer = Buffer.from(imgBytes, "base64");
    fs.writeFileSync(`imagen-${idx}.png`, buffer);
    idx++;
  }
}

main();

ऐप पर जाएं

package main

import (
  "context"
  "fmt"
  "os"
  "google.golang.org/genai"
)

func main() {

  ctx := context.Background()
  client, err := genai.NewClient(ctx, nil)
  if err != nil {
      log.Fatal(err)
  }

  config := &genai.GenerateImagesConfig{
      NumberOfImages: 4,
  }

  response, _ := client.Models.GenerateImages(
      ctx,
      "imagen-4.0-generate-001",
      "Robot holding a red skateboard",
      config,
  )

  for n, image := range response.GeneratedImages {
      fname := fmt.Sprintf("imagen-%d.png", n)
          _ = os.WriteFile(fname, image.Image.ImageBytes, 0644)
  }
}

REST

curl -X POST \
    "https://generativelanguage.googleapis.com/v1beta/models/imagen-4.0-generate-001:predict" \
    -H "x-goog-api-key: $GEMINI_API_KEY" \
    -H "Content-Type: application/json" \
    -d '{
        "instances": [
          {
            "prompt": "Robot holding a red skateboard"
          }
        ],
        "parameters": {
          "sampleCount": 4
        }
      }'

एआई से जनरेट की गई, लाल रंग का स्केटबोर्ड पकड़े हुए रोबोट की इमेज — लाल रंग का स्केटबोर्ड पकड़े हुए रोबोट की एआई से बनाई गई इमेज

Imagen का कॉन्फ़िगरेशन

फ़िलहाल, Imagen में सिर्फ़ अंग्रेज़ी में प्रॉम्प्ट दिए जा सकते हैं. साथ ही, इन पैरामीटर का इस्तेमाल किया जा सकता है:

numberOfImages: जनरेट की जाने वाली इमेज की संख्या. यह संख्या 1 से 4 (दोनों शामिल) के बीच होनी चाहिए. डिफ़ॉल्ट वैल्यू 4 होती है.
imageSize: जनरेट की गई इमेज का साइज़. यह सुविधा सिर्फ़ Standard और Ultra मॉडल के लिए उपलब्ध है. 1K और 2K को वैल्यू के तौर पर इस्तेमाल किया जा सकता है. डिफ़ॉल्ट वैल्यू 1K है.
aspectRatio: इससे जनरेट की गई इमेज का आसपेक्ट रेशियो बदल जाता है. "1:1", "3:4", "4:3", "9:16", और "16:9" वैल्यू इस्तेमाल की जा सकती हैं. डिफ़ॉल्ट वैल्यू "1:1" है.
personGeneration: मॉडल को लोगों की इमेज जनरेट करने की अनुमति दें. इन वैल्यू का इस्तेमाल किया जा सकता है:
- "dont_allow": लोगों की इमेज जनरेट करने की सुविधा को ब्लॉक करें.
- "allow_adult": वयस्कों की इमेज जनरेट की जा सकती हैं, लेकिन बच्चों की नहीं. यह डिफ़ॉल्ट विकल्प है.
- "allow_all": ऐसी इमेज जनरेट करें जिनमें वयस्क और बच्चे शामिल हों.
ध्यान दें: ईयू, यूके, सीएच, और मीना में "allow_all" पैरामीटर की वैल्यू इस्तेमाल करने की अनुमति नहीं है.

Imagen के लिए प्रॉम्प्ट गाइड

Imagen की इस गाइड के इस सेक्शन में बताया गया है कि टेक्स्ट से इमेज बनाने के लिए दिए गए प्रॉम्प्ट में बदलाव करके, अलग-अलग नतीजे कैसे पाए जा सकते हैं. साथ ही, इसमें ऐसी इमेज के उदाहरण भी दिए गए हैं जिन्हें बनाया जा सकता है.

प्रॉम्प्ट लिखने के बारे में बुनियादी जानकारी

एक अच्छा प्रॉम्प्ट, साफ़ तौर पर जानकारी देने वाला होता है. इसमें काम के कीवर्ड और मॉडिफ़ायर का इस्तेमाल किया जाता है. सबसे पहले, अपने विषय, संदर्भ, और स्टाइल के बारे में सोचें.

विषय, संदर्भ, और स्टाइल पर ज़ोर देने वाला प्रॉम्प्ट — इमेज में मौजूद टेक्स्ट: *स्केच* (**स्टाइल**) वाली *मॉडर्न अपार्टमेंट बिल्डिंग* (**विषय**) की इमेज. इसके आस-पास *ऊंची-ऊंची इमारतें* (**संदर्भ और बैकग्राउंड**) हैं.

सब्जेक्ट: किसी भी प्रॉम्प्ट के बारे में सोचते समय, सबसे पहले सब्जेक्ट के बारे में सोचें. यह वह ऑब्जेक्ट, व्यक्ति, जानवर या सीनरी होती है जिसकी आपको इमेज चाहिए.
कॉन्टेक्स्ट और बैकग्राउंड: किसी इमेज में बैकग्राउंड या कॉन्टेक्स्ट उतना ही ज़रूरी होता है जितना कि उसमें मौजूद विषय. अपने विषय को अलग-अलग बैकग्राउंड में रखकर देखें. उदाहरण के लिए, सफ़ेद बैकग्राउंड वाला स्टूडियो, आउटडोर या इंडोर एनवायरमेंट.
स्टाइल: आखिर में, इमेज की वह स्टाइल जोड़ें जो आपको चाहिए. स्टाइल सामान्य (पेंटिंग, फ़ोटोग्राफ़, स्केच) या बहुत खास (पेस्टल पेंटिंग, चारकोल ड्राइंग, आइसोमेट्रिक 3D) हो सकते हैं. स्टाइल को भी एक साथ इस्तेमाल किया जा सकता है.

प्रॉम्प्ट का पहला वर्शन लिखने के बाद, उसमें ज़्यादा जानकारी जोड़कर उसे बेहतर बनाएँ. ऐसा तब तक करें, जब तक आपको अपनी पसंद की इमेज न मिल जाए. बार-बार जांच करना ज़रूरी है. सबसे पहले, अपने मुख्य आइडिया के बारे में बताएं. इसके बाद, उस मुख्य आइडिया को तब तक बेहतर बनाएं और उसमें ज़्यादा जानकारी जोड़ें, जब तक जनरेट की गई इमेज आपकी सोच के मुताबिक न हो जाए.

फ़ोटोरियलिस्टिक सैंपल इमेज 1 — प्रॉम्प्ट: झील के किनारे वसंत के मौसम में मौजूद एक पार्क

फ़ोटोरियलिस्टिक सैंपल इमेज 2 — प्रॉम्प्ट: झील के किनारे वसंत के मौसम में एक पार्क, **झील के उस पार सूरज डूब रहा है, गोल्डन आवर**

फ़ोटोरियलिस्टिक सैंपल इमेज 3 — प्रॉम्प्ट: झील के किनारे वसंत के मौसम में एक पार्क, **झील के उस पार सूरज डूब रहा है, सुनहरा समय, लाल रंग के जंगली फूल**

Imagen मॉडल, आपके आइडिया को ज़्यादा जानकारी वाली इमेज में बदल सकते हैं. इससे कोई फ़र्क़ नहीं पड़ता कि आपके प्रॉम्प्ट छोटे हैं या बड़े और ज़्यादा जानकारी वाले हैं. प्रॉम्प्ट को बार-बार बेहतर बनाएं. साथ ही, जब तक आपको मनमुताबिक नतीजे न मिल जाएं, तब तक उसमें ज़्यादा जानकारी जोड़ते रहें.

छोटे प्रॉम्प्ट की मदद से, इमेज को तुरंत जनरेट किया जा सकता है.

Imagen 4 के लिए छोटे प्रॉम्प्ट का उदाहरण — प्रॉम्प्ट: 20 साल की महिला की क्लोज़-अप फ़ोटो, स्ट्रीट फ़ोटोग्राफ़ी, फ़िल्म का स्टिल, हल्के नारंगी रंग के वॉर्म टोन

बड़े प्रॉम्प्ट में, खास जानकारी जोड़ी जा सकती है और इमेज बनाई जा सकती है.

Imagen 4 के लिए लंबे प्रॉम्प्ट का उदाहरण — प्रॉम्प्ट: 20 साल की एक महिला की ऐसी फ़ोटो जो लोगों का ध्यान खींचे. इसमें स्ट्रीट फ़ोटोग्राफ़ी स्टाइल का इस्तेमाल किया गया हो. इमेज किसी फ़िल्म के सीन की तरह दिखनी चाहिए. इसमें हल्के नारंगी रंग की वॉर्म टोन होनी चाहिए.

Imagen के लिए प्रॉम्प्ट लिखने के बारे में अन्य सलाह:

ज़्यादा जानकारी देने वाली भाषा का इस्तेमाल करें: Imagen को साफ़ तौर पर जानकारी देने के लिए, विशेषण और क्रियाविशेषण का इस्तेमाल करें.
संदर्भ दें: अगर ज़रूरी हो, तो एआई को समझने में मदद करने के लिए, बैकग्राउंड की जानकारी शामिल करें.
किसी खास कलाकार या स्टाइल का रेफ़रंस दें: अगर आपको किसी खास स्टाइल में इमेज जनरेट करनी है, तो किसी कलाकार या कला आंदोलन का रेफ़रंस देना मददगार हो सकता है.
प्रॉम्प्ट इंजीनियरिंग टूल का इस्तेमाल करें: प्रॉम्प्ट इंजीनियरिंग टूल या संसाधनों के बारे में जानें. इससे आपको अपने प्रॉम्प्ट को बेहतर बनाने और बेहतरीन नतीजे पाने में मदद मिलेगी.
अपनी और ग्रुप फ़ोटो में चेहरे के नैन-नक्श को बेहतर बनाना: फ़ोटो में चेहरे के नैन-नक्श को फ़ोकस के तौर पर सेट करें. उदाहरण के लिए, प्रॉम्प्ट में "पोर्ट्रेट" शब्द का इस्तेमाल करें.

इमेज में टेक्स्ट जनरेट करना

Imagen मॉडल, इमेज में टेक्स्ट जोड़ सकते हैं. इससे इमेज जनरेट करने के लिए, क्रिएटिविटी दिखाने के ज़्यादा अवसर मिलते हैं. इस सुविधा का ज़्यादा से ज़्यादा फ़ायदा पाने के लिए, यहां दिए गए दिशा-निर्देशों का पालन करें:

बेझिझक इमेज जनरेट करें: आपको अपनी पसंद के मुताबिक इमेज मिलने तक, उन्हें फिर से जनरेट करना पड़ सकता है. Imagen में टेक्स्ट इंटिग्रेशन की सुविधा अब भी विकसित हो रही है. इसलिए, कभी-कभी कई बार कोशिश करने पर सबसे अच्छे नतीजे मिलते हैं.
इसे छोटा रखें: बेहतर जनरेशन के लिए, टेक्स्ट को 25 वर्ण या इससे कम रखें.
एक से ज़्यादा वाक्यांश: ज़्यादा जानकारी देने के लिए, दो या तीन अलग-अलग वाक्यांशों का इस्तेमाल करें. बेहतर कंपोज़िशन के लिए, तीन से ज़्यादा वाक्यांशों का इस्तेमाल न करें.

प्रॉम्प्ट: एक ऐसा पोस्टर जिसमें "Summerland" टेक्स्ट को बोल्ड फ़ॉन्ट में टाइटल के तौर पर लिखा गया हो. इसके नीचे "Summer never felt so good" स्लोगन लिखा हो
टेक्स्ट को सही जगह पर रखना: Imagen, टेक्स्ट को आपकी बताई गई जगह पर रखने की कोशिश करता है. हालांकि, कभी-कभी इसमें बदलाव हो सकता है. इस सुविधा को लगातार बेहतर बनाया जा रहा है.
फ़ॉन्ट स्टाइल के लिए सुझाव: फ़ॉन्ट स्टाइल के लिए सामान्य सुझाव दें, ताकि Imagen को फ़ॉन्ट चुनने में मदद मिल सके. फ़ॉन्ट को सटीक तरीके से कॉपी करने पर भरोसा न करें. हालांकि, आपको क्रिएटिव इंटरप्रेटेशन मिल सकते हैं.
फ़ॉन्ट का साइज़: फ़ॉन्ट का साइज़ जनरेट करने के लिए, फ़ॉन्ट का साइज़ या साइज़ के बारे में सामान्य जानकारी दें. उदाहरण के लिए, छोटा, मीडियम, बड़ा.

प्रॉम्प्ट पैरामीटर सेट करना

आउटपुट के नतीजों को बेहतर तरीके से कंट्रोल करने के लिए, आपको Imagen में इनपुट को पैरामीटर के तौर पर इस्तेमाल करना फ़ायदेमंद लग सकता है. उदाहरण के लिए, मान लें कि आपको अपने ग्राहकों को उनके कारोबार के लिए लोगो जनरेट करने की सुविधा देनी है. साथ ही, आपको यह पक्का करना है कि लोगो हमेशा एक ही रंग के बैकग्राउंड पर जनरेट हों. आपको यह भी तय करना है कि क्लाइंट, मेन्यू से कितने विकल्प चुन सकता है.

इस उदाहरण में, पैरामीटर वाला ऐसा प्रॉम्प्ट बनाया जा सकता है:

A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.

कस्टम यूज़र इंटरफ़ेस में, ग्राहक मेन्यू का इस्तेमाल करके पैरामीटर डाल सकता है. इसके बाद, चुनी गई वैल्यू, Imagen को मिलने वाले प्रॉम्प्ट में अपने-आप भर जाती है.

उदाहरण के लिए:

प्रॉम्प्ट: A minimalist logo for a health care company on a solid color background. Include the text Journey.
प्रॉम्प्ट: A modern logo for a software company on a solid color background. Include the text Silo.
प्रॉम्प्ट: A traditional logo for a baking company on a solid color background. Include the text Seed.

प्रॉम्प्ट लिखने की ऐडवांस तकनीकें

यहां दिए गए उदाहरणों का इस्तेमाल करके, एट्रिब्यूट के आधार पर ज़्यादा सटीक प्रॉम्प्ट बनाएं. जैसे, फ़ोटोग्राफ़ी के बारे में जानकारी देने वाले शब्द, आकार और मटीरियल, कला के ऐतिहासिक आंदोलन, और इमेज क्वालिटी को बेहतर बनाने वाले शब्द.

फ़ोटोग्राफ़ी

प्रॉम्प्ट में यह शामिल है: "... की एक फ़ोटो"

इस स्टाइल का इस्तेमाल करने के लिए, ऐसे कीवर्ड का इस्तेमाल करें जिनसे Imagen को साफ़ तौर पर पता चले कि आपको फ़ोटोग्राफ़ चाहिए. अपने प्रॉम्प्ट इस तरह शुरू करें "इसकी फ़ोटो. . .". उदाहरण के लिए:

^{इमेज का सोर्स: हर इमेज को, उससे जुड़े टेक्स्ट प्रॉम्प्ट का इस्तेमाल करके जनरेट किया गया है. इसके लिए, Imagen 4 मॉडल का इस्तेमाल किया गया है.}

फ़ोटोग्राफ़ी मॉडिफ़ायर

यहां दिए गए उदाहरणों में, फ़ोटोग्राफ़ी से जुड़े कई मॉडिफ़ायर और पैरामीटर देखे जा सकते हैं. ज़्यादा सटीक कंट्रोल के लिए, कई मॉडिफ़ायर जोड़े जा सकते हैं.

कैमरे की प्रॉक्सिमिटी - क्लोज़ अप, दूर से ली गई फ़ोटो

कैमरे से ली गई क्लोज़-अप इमेज का सैंपल — प्रॉम्प्ट: कॉफ़ी बीन्स की **क्लोज़-अप** फ़ोटो

कैमरे से ली गई ज़ूम आउट की गई सैंपल इमेज — प्रॉम्प्ट: बिखरे हुए किचन में, **ज़ूम आउट** करके ली गई कॉफ़ी बीन्स के छोटे बैग की फ़ोटो

कैमरे की पोज़िशन - एरियल, नीचे से

प्लेन से ली गई फ़ोटो के सैंपल की इमेज — प्रॉम्प्ट: गगनचुंबी इमारतों वाले शहर की **एरियल फ़ोटो**

सैंपल इमेज के नीचे का व्यू — प्रॉम्प्ट: नीले आसमान के साथ जंगल के कैनोपी की फ़ोटो, जिसे **नीचे से** लिया गया है

लाइटिंग - नैचुरल, शानदार, गर्म, ठंडी

नैचुरल लाइटिंग की सैंपल इमेज — प्रॉम्प्ट: मॉडर्न आर्म चेयर की स्टूडियो फ़ोटो, **नैचुरल लाइटिंग**

ड्रामैटिक लाइटिंग की सैंपल इमेज — प्रॉम्प्ट: मॉडर्न आर्म चेयर की स्टूडियो फ़ोटो, **ड्रामैटिक लाइटिंग**

कैमरे की सेटिंग - मोशन ब्लर, सॉफ्ट फ़ोकस, बोके, पोर्ट्रेट

मोशन ब्लर की सैंपल इमेज — प्रॉम्प्ट: कार के अंदर से गगनचुंबी इमारतों वाले शहर की फ़ोटो, जिसमें **मोशन ब्लर** इफ़ेक्ट हो

सॉफ़्ट फ़ोकस वाली इमेज का सैंपल — प्रॉम्प्ट: रात में शहर के किसी पुल की **सॉफ़्ट फ़ोकस** वाली फ़ोटोग्राफ़

लेंस के टाइप - 35 मि॰मी॰, 50 मि॰मी॰, फ़िशआई, वाइड ऐंगल, मैक्रो

मैक्रो लेंस की सैंपल इमेज — प्रॉम्प्ट: पत्ती की फ़ोटो, **मैक्रो लेंस**

फ़िशआई लेंस की सैंपल इमेज — प्रॉम्प्ट: स्ट्रीट फ़ोटोग्राफ़ी, न्यूयॉर्क सिटी, **फ़िशआई लेंस**

फ़िल्म के टाइप - ब्लैक ऐंड व्हाइट, पोलरॉइड

पोलरॉइड फ़ोटो के सैंपल की इमेज — प्रॉम्प्ट: धूप का चश्मा पहने हुए कुत्ते का **पोलरॉइड पोर्ट्रेट**

ब्लैक ऐंड व्हाइट फ़ोटो के सैंपल की इमेज — प्रॉम्प्ट: धूप का चश्मा पहने हुए कुत्ते की **ब्लैक ऐंड व्हाइट फ़ोटो**

इलस्ट्रेशन और कला

प्रॉम्प्ट में ये शामिल हैं: "painting का...", "A sketch of..."

आर्ट स्टाइल, पेंसिल स्केच जैसी मोनोक्रोम स्टाइल से लेकर बिलकुल असली लगने वाली डिजिटल आर्ट तक अलग-अलग होती हैं. उदाहरण के लिए, यहां दी गई इमेज में एक ही प्रॉम्प्ट का इस्तेमाल किया गया है, लेकिन इनकी स्टाइल अलग-अलग हैं:

"बैकग्राउंड में गगनचुंबी इमारतों के साथ, ऐंगल वाली स्पोर्टी इलेक्ट्रिक सेडान की [art style or creation technique]"

कला के सैंपल की इमेज — प्रॉम्प्ट: एक ऐंगल वाली... की **टेक्निकल पेंसिल ड्रॉइंग**...

^{इमेज का सोर्स: हर इमेज को, उससे जुड़े टेक्स्ट प्रॉम्प्ट का इस्तेमाल करके जनरेट किया गया है. इसके लिए, Imagen 2 मॉडल का इस्तेमाल किया गया है.}

आकृतियां और मटीरियल

प्रॉम्प्ट में ये शामिल हैं: "...से बना...", "...के रूप में..."

इस टेक्नोलॉजी की एक ख़ासियत यह है कि इससे ऐसी इमेज बनाई जा सकती हैं जिन्हें बनाना मुश्किल होता है या जो बनाई ही नहीं जा सकतीं. उदाहरण के लिए, अपनी कंपनी के लोगो को अलग-अलग मटीरियल और टेक्सचर में फिर से बनाया जा सकता है.

आकृतियों और मटीरियल के उदाहरण की पहली इमेज — प्रॉम्प्ट: चीज़ **से बना** डफ़ल बैग

आकृतियों और मटीरियल के उदाहरण की दूसरी इमेज — प्रॉम्प्ट: पक्षी **के आकार** की नियॉन ट्यूब

आकृतियों और मटीरियल के तीसरे उदाहरण की इमेज — प्रॉम्प्ट: **कागज़ से बनी** आर्मचेयर, स्टूडियो फ़ोटो, ओरिगामी स्टाइल

कला से जुड़े ऐतिहासिक रेफ़रंस

प्रॉम्प्ट में यह शामिल है: "...के स्टाइल में..."

कुछ स्टाइल, समय के साथ आइकॉनिक बन गए हैं. यहाँ पेंटिंग या कला की कुछ ऐतिहासिक शैलियों के बारे में बताया गया है. इन्हें आज़माया जा सकता है.

"[art period or movement] के स्टाइल में एक इमेज जनरेट करो: पवन ऊर्जा फ़ार्म"

इंप्रेशनिज़्म के उदाहरण वाली इमेज — प्रॉम्प्ट: इंप्रेशनिस्ट पेंटिंग*की स्टाइल में*: पवन ऊर्जा फ़ार्म की एक इमेज जनरेट करो

रेनेसां की शैली में बनी इमेज का उदाहरण — प्रॉम्प्ट: रेनेसां काल की पेंटिंग *की स्टाइल में* एक इमेज जनरेट करो: पवन ऊर्जा फ़ार्म

पॉप आर्ट की उदाहरण इमेज — प्रॉम्प्ट: पॉप आर्ट *स्टाइल* में एक इमेज जनरेट करो: पवन ऊर्जा फ़ार्म

इमेज की क्वालिटी को बेहतर बनाने वाले मॉडिफ़ायर

कुछ कीवर्ड से मॉडल को यह पता चल सकता है कि आपको अच्छी क्वालिटी वाली ऐसेट चाहिए. क्वालिटी मॉडिफ़ायर के उदाहरणों में ये शामिल हैं:

सामान्य मॉडिफ़ायर - बेहतरीन क्वालिटी, सुंदर, स्टाइल वाला
फ़ोटो - 4K, एचडीआर, Studio Photo
आर्ट, इलस्ट्रेशन - किसी पेशेवर ने बनाया हो, पूरी जानकारी दी गई हो

यहां क्वालिटी मॉडिफ़ायर के बिना और क्वालिटी मॉडिफ़ायर के साथ एक ही प्रॉम्प्ट के कुछ उदाहरण दिए गए हैं.

मॉडिफ़ायर के बिना मक्का की इमेज का उदाहरण — प्रॉम्प्ट (क्वालिटी मॉडिफ़ायर नहीं): मक्के के पौधे की फ़ोटो

मॉडिफ़ायर के साथ मक्के की इमेज का उदाहरण — क्वालिटी मॉडिफ़ायर के साथ प्रॉम्प्ट: **4K एचडीआर सुंदर**
मक्के के पौधे की फ़ोटो जो किसी
प्रोफ़ेशनल फ़ोटोग्राफ़र ने ली हो

आसपेक्ट रेशियो (लंबाई-चौड़ाई का अनुपात)

Imagen की मदद से इमेज जनरेट करते समय, इमेज के पांच अलग-अलग आसपेक्ट रेशियो (लंबाई-चौड़ाई का अनुपात) सेट किए जा सकते हैं.

स्क्वेयर (1:1, डिफ़ॉल्ट) - यह एक स्टैंडर्ड स्क्वेयर फ़ोटो होती है. इस पहलू के अनुपात का इस्तेमाल आम तौर पर सोशल मीडिया पोस्ट के लिए किया जाता है.

फ़ुलस्क्रीन (4:3) - इस आसपेक्ट रेशियो का इस्तेमाल आम तौर पर मीडिया या फ़िल्म में किया जाता है. यह ज़्यादातर पुराने (नॉन-वाइडस्क्रीन) टीवी और मीडियम फ़ॉर्मैट वाले कैमरों का डाइमेंशन भी है. यह 1:1 के मुकाबले, सीन को हॉरिज़ॉन्टल तौर पर ज़्यादा कैप्चर करता है. इसलिए, फ़ोटोग्राफ़ी के लिए इसे बेहतर आसपेक्ट रेशियो माना जाता है.

आस्पेक्ट रेशियो का उदाहरण — प्रॉम्प्ट: पियानो बजाते हुए संगीतकार की उंगलियों की क्लोज़ अप इमेज, ब्लैक ऐंड व्हाइट फ़िल्म, विंटेज (4:3 आसपेक्ट रेशियो)

पोर्ट्रेट मोड में फ़ुल स्क्रीन (3:4) - यह फ़ुलस्क्रीन आसपेक्ट रेशियो है, जिसे 90 डिग्री पर घुमाया गया है. इससे 1:1 आसपेक्ट रेशियो (लंबाई-चौड़ाई का अनुपात) की तुलना में, वर्टिकल तौर पर ज़्यादा सीन कैप्चर किया जा सकता है.

वाइडस्क्रीन (16:9) - इस रेशियो ने 4:3 को बदल दिया है. अब यह टीवी, मॉनिटर, और मोबाइल फ़ोन की स्क्रीन (लैंडस्केप) के लिए सबसे आम आसपेक्ट रेशियो है. इस आसपेक्ट रेशियो (लंबाई-चौड़ाई का अनुपात) का इस्तेमाल तब करें, जब आपको बैकग्राउंड का ज़्यादा हिस्सा कैप्चर करना हो. उदाहरण के लिए, सीनरी वाले लैंडस्केप.

प्रॉम्प्ट: एक आदमी ने सफ़ेद रंग के कपड़े पहने हैं और वह समुद्र तट पर बैठा है. क्लोज़ अप, सुनहरे पल की रोशनी (16:9 आसपेक्ट रेशियो)
पोर्ट्रेट (9:16) - यह रेशियो वाइडस्क्रीन होता है, लेकिन इसे घुमाया जाता है. यह आसपेक्ट रेशियो, अपेक्षाकृत नया है. इसे कम अवधि के वीडियो वाले ऐप्लिकेशन (उदाहरण के लिए, YouTube Shorts) ने लोकप्रिय बनाया है. इसका इस्तेमाल लंबी चीज़ों के लिए करें. जैसे, इमारतें, पेड़, झरने या इस तरह की अन्य चीज़ें.

प्रॉम्प्ट: एक विशाल गगनचुंबी इमारत का डिजिटल रेंडर, आधुनिक, भव्य, शानदार, और बैकग्राउंड में खूबसूरत सूर्यास्त (9:16 आसपेक्ट रेशियो)

असल में खींची गई फ़ोटो जैसी दिखने वाली इमेज

इमेज जनरेट करने वाले अलग-अलग मॉडल, आर्टिस्टिक और फ़ोटोरियलिस्टिक आउटपुट दे सकते हैं. आपको जिस विषय पर फ़ोटो जैसा आउटपुट जनरेट करना है उसके आधार पर, प्रॉम्प्ट में यहां दिए गए शब्दों का इस्तेमाल करें.

इस्तेमाल का उदाहरण	लेंस का टाइप	फ़ोकल लेंथ	ज़्यादा जानकारी
लोग (पोर्ट्रेट)	प्राइम, ज़ूम	24 से 35 मि॰मी॰	ब्लैक ऐंड व्हाइट फ़िल्म, फ़िल्म नोइर, डेप्थ ऑफ़ फ़ील्ड, ड्यूटोन (दो रंगों का ज़िक्र करें)
खाना, कीड़े-मकोड़े, पौधे (ऑब्जेक्ट, स्टिल लाइफ़)	मैक्रो	60-105 मि॰मी॰	ज़्यादा बारीकी से जानकारी, सटीक फ़ोकस, और कंट्रोल की गई लाइटिंग
खेल-कूद, वन्यजीव (मोशन)	टेलीफ़ोटो ज़ूम	100-400 मि॰मी॰	शटर स्पीड तेज़ हो, ऐक्शन या मूवमेंट को ट्रैक किया जा रहा हो
खगोलीय, लैंडस्केप (वाइड-ऐंगल)	वाइड-एंगल	10-24 मि॰मी॰	लॉन्ग एक्सपोज़र टाइम, शार्प फ़ोकस, लॉन्ग एक्सपोज़र, पानी या बादलों की स्मूद इमेज

पोर्ट्रेट

इस्तेमाल का उदाहरण	लेंस का टाइप	फ़ोकल लेंथ	ज़्यादा जानकारी
लोग (पोर्ट्रेट)	प्राइम, ज़ूम	24 से 35 मि॰मी॰	ब्लैक ऐंड व्हाइट फ़िल्म, फ़िल्म नोइर, डेप्थ ऑफ़ फ़ील्ड, ड्यूटोन (दो रंगों का ज़िक्र करें)

टेबल में दिए गए कई कीवर्ड का इस्तेमाल करके, Imagen इन पोर्ट्रेट को जनरेट कर सकता है:

प्रॉम्प्ट: एक महिला, 35 मि॰मी॰ पोर्ट्रेट, नीले और स्लेटी रंग का ड्यूओटोन
मॉडल: imagen-4.0-generate-001

प्रॉम्प्ट: 35 मि॰मी॰ के पोर्ट्रेट में एक महिला, फ़िल्म नॉयर
मॉडल: imagen-4.0-generate-001

ऑब्जेक्ट

इस्तेमाल का उदाहरण	लेंस का टाइप	फ़ोकल लेंथ	ज़्यादा जानकारी
खाना, कीड़े-मकोड़े, पौधे (ऑब्जेक्ट, स्टिल लाइफ़)	मैक्रो	60-105 मि॰मी॰	ज़्यादा बारीकी से जानकारी, सटीक फ़ोकस, और कंट्रोल की गई लाइटिंग

टेबल में दिए गए कई कीवर्ड का इस्तेमाल करके, Imagen इन ऑब्जेक्ट की इमेज जनरेट कर सकता है:

प्रॉम्प्ट: प्रार्थना करने वाले पौधे की पत्ती, मैक्रो लेंस, 60 मि॰मी॰
मॉडल: imagen-4.0-generate-001

प्रॉम्प्ट: पास्ता की एक प्लेट, 100 मि॰मी॰ मैक्रो लेंस
मॉडल: imagen-4.0-generate-001

मोशन

इस्तेमाल का उदाहरण	लेंस का टाइप	फ़ोकल लेंथ	ज़्यादा जानकारी
खेल-कूद, वन्यजीव (मोशन)	टेलीफ़ोटो ज़ूम	100-400 मि॰मी॰	शटर स्पीड तेज़ हो, ऐक्शन या मूवमेंट को ट्रैक किया जा रहा हो

टेबल में दिए गए कई कीवर्ड का इस्तेमाल करके, Imagen इन मोशन इमेज को जनरेट कर सकता है:

प्रॉम्प्ट: विनिंग टचडाउन, फ़ास्ट शटर स्पीड, मूवमेंट ट्रैकिंग
मॉडल: imagen-4.0-generate-001

प्रॉम्प्ट: जंगल में दौड़ता हुआ हिरण, शटर की तेज़ स्पीड, मूवमेंट ट्रैकिंग
मॉडल: imagen-4.0-generate-001

वाइड-एंगल

इस्तेमाल का उदाहरण	लेंस का टाइप	फ़ोकल लेंथ	ज़्यादा जानकारी
खगोलीय, लैंडस्केप (वाइड-ऐंगल)	वाइड-एंगल	10-24 मि॰मी॰	लॉन्ग एक्सपोज़र टाइम, शार्प फ़ोकस, लॉन्ग एक्सपोज़र, पानी या बादलों की स्मूद इमेज

टेबल में दिए गए कई कीवर्ड का इस्तेमाल करके, Imagen इन वाइड-ऐंगल इमेज को जनरेट कर सकता है:

प्रॉम्प्ट: पहाड़ों की लंबी श्रृंखला, लैंडस्केप वाइड ऐंगल 10 मि॰मी॰
मॉडल: imagen-4.0-generate-001

प्रॉम्प्ट: चांद की फ़ोटो, ऐस्ट्रो फ़ोटोग्राफ़ी, वाइड ऐंगल 10 मि॰मी॰
मॉडल: imagen-4.0-generate-001

मॉडल के वर्शन

Imagen 4

प्रॉपर्टी	ब्यौरा
मॉडल कोड	Gemini API `imagen-4.0-generate-001` `imagen-4.0-ultra-generate-001` `imagen-4.0-fast-generate-001`
इस्तेमाल किए जा सकने वाले डेटा टाइप	इनपुट टेक्स्ट आउटपुट इमेज
टोकन की सीमाएं^[*]	इनपुट टोकन की सीमा 480 टोकन (टेक्स्ट) आउटपुट इमेज 1 से 4 (अल्ट्रा/स्टैंडर्ड/फ़ास्ट)
नया अपडेट	जून 2025

Imagen 3

Imagen 3 मॉडल को बंद कर दिया गया है.