Gemini API में Imagen 3

Gemini API के ज़रिए, Imagen 3 को ऐक्सेस किया जा सकता है. यह Google का सबसे बेहतरीन क्वालिटी का टेक्स्ट-टू-इमेज मॉडल है. इसमें कई नई और बेहतर सुविधाएं मिलती हैं. Imagen 3 ये काम कर सकता है:

  • पिछले मॉडल की तुलना में, बेहतर जानकारी, बेहतर रोशनी, और कम ध्यान भटकाने वाले आर्टफ़ैक्ट वाली इमेज जनरेट करना
  • आम भाषा में लिखे गए प्रॉम्प्ट को समझना
  • अलग-अलग फ़ॉर्मैट और स्टाइल में इमेज जनरेट करना
  • पिछले मॉडल की तुलना में, टेक्स्ट को ज़्यादा असरदार तरीके से रेंडर करना

इमेज जनरेट करें

इस सेक्शन में, Imagen मॉडल को इंस्टैंशिएट करने और इमेज जनरेट करने का तरीका बताया गया है.

Google जनरेटिव एआई SDK टूल इंस्टॉल करने के बाद, इमेज जनरेट करने के लिए इस कोड का इस्तेमाल किया जा सकता है:

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client(api_key='GEMINI_API_KEY')

response = client.models.generate_images(
    model='imagen-3.0-generate-002',
    prompt='Fuzzy bunnies in my kitchen',
    config=types.GenerateImagesConfig(
        number_of_images= 4,
    )
)
for generated_image in response.generated_images:
  image = Image.open(BytesIO(generated_image.image.image_bytes))
  image.show()

कोड सैंपल में, इससे मिलती-जुलती चार इमेज होनी चाहिए:

रसोई में दो फ़ज़ी बन्नी की एआई से जनरेट की गई इमेज

Python डेवलपर, Gemini कुकबुक में जाकर भी Imagen notebook के साथ शुरुआत करना आज़मा सकते हैं.

Imagen मॉडल के पैरामीटर

generate_images() के लिए ये पैरामीटर उपलब्ध हैं:

  • prompt: इमेज के लिए टेक्स्ट प्रॉम्प्ट.
  • number_of_images: जनरेट की जाने वाली इमेज की संख्या, 1 से 4 के बीच होनी चाहिए. डिफ़ॉल्ट रूप से, यह संख्या 4 होती है.
  • aspect_ratio: जनरेट की गई इमेज का आसपेक्ट रेशियो बदलता है. "1:1", "3:4", "4:3", "9:16", और "16:9" वैल्यू इस्तेमाल की जा सकती हैं. डिफ़ॉल्ट रूप से, यह "1:1" पर सेट होता है.
  • safety_filter_level: सुरक्षा फ़िल्टर करने की सुविधा में एक फ़िल्टर लेवल जोड़ता है. ये वैल्यू मान्य हैं:
    • "BLOCK_LOW_AND_ABOVE": प्रॉबबिलिटी स्कोर या गंभीरता स्कोर LOW, MEDIUM या HIGH होने पर ब्लॉक करें.
    • "BLOCK_MEDIUM_AND_ABOVE": प्रॉबबिलिटी स्कोर या गंभीरता स्कोर MEDIUM या HIGH होने पर ब्लॉक करें.
    • "BLOCK_ONLY_HIGH": प्रॉबबिलिटी स्कोर या गंभीरता का स्कोर HIGH होने पर ब्लॉक करें.
  • person_generation: मॉडल को लोगों की इमेज जनरेट करने की अनुमति दें. ये वैल्यू इस्तेमाल की जा सकती हैं:
    • "DONT_ALLOW": लोगों की इमेज जनरेट करने की सुविधा को ब्लॉक करें.
    • "ALLOW_ADULT": वयस्कों की इमेज जनरेट करें, लेकिन बच्चों की नहीं. यह डिफ़ॉल्ट विकल्प है.

जनरेट की गई इमेज में, न दिखने वाला डिजिटल SynthID वॉटरमार्क हमेशा जोड़ा जाता है.

टेक्स्ट प्रॉम्प्ट की भाषा

इनपुट टेक्स्ट प्रॉम्प्ट की इन भाषाओं में काम करता है:

  • अंग्रेज़ी (en)

आगे क्या करना है

Imagen के लिए प्रॉम्प्ट लिखने के बारे में ज़्यादा जानने के लिए, Imagen प्रॉम्प्ट गाइड देखें.