Gemini API के ज़रिए, Imagen 3 को ऐक्सेस किया जा सकता है. यह Google का सबसे बेहतरीन क्वालिटी का टेक्स्ट-टू-इमेज मॉडल है. इसमें कई नई और बेहतर सुविधाएं मिलती हैं. Imagen 3 ये काम कर सकता है:
- पिछले मॉडल की तुलना में, बेहतर जानकारी, बेहतर रोशनी, और कम ध्यान भटकाने वाले आर्टफ़ैक्ट वाली इमेज जनरेट करना
- आम भाषा में लिखे गए प्रॉम्प्ट को समझना
- अलग-अलग फ़ॉर्मैट और स्टाइल में इमेज जनरेट करना
- पिछले मॉडल की तुलना में, टेक्स्ट को ज़्यादा असरदार तरीके से रेंडर करना
इमेज जनरेट करें
इस सेक्शन में, Imagen मॉडल को इंस्टैंशिएट करने और इमेज जनरेट करने का तरीका बताया गया है.
Google जनरेटिव एआई SDK टूल इंस्टॉल करने के बाद, इमेज जनरेट करने के लिए इस कोड का इस्तेमाल किया जा सकता है:
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
client = genai.Client(api_key='GEMINI_API_KEY')
response = client.models.generate_images(
model='imagen-3.0-generate-002',
prompt='Fuzzy bunnies in my kitchen',
config=types.GenerateImagesConfig(
number_of_images= 4,
)
)
for generated_image in response.generated_images:
image = Image.open(BytesIO(generated_image.image.image_bytes))
image.show()
कोड सैंपल में, इससे मिलती-जुलती चार इमेज होनी चाहिए:
Python डेवलपर, Gemini कुकबुक में जाकर भी Imagen notebook के साथ शुरुआत करना आज़मा सकते हैं.
Imagen मॉडल के पैरामीटर
generate_images()
के लिए ये पैरामीटर उपलब्ध हैं:
prompt
: इमेज के लिए टेक्स्ट प्रॉम्प्ट.number_of_images
: जनरेट की जाने वाली इमेज की संख्या, 1 से 4 के बीच होनी चाहिए. डिफ़ॉल्ट रूप से, यह संख्या 4 होती है.aspect_ratio
: जनरेट की गई इमेज का आसपेक्ट रेशियो बदलता है."1:1"
,"3:4"
,"4:3"
,"9:16"
, और"16:9"
वैल्यू इस्तेमाल की जा सकती हैं. डिफ़ॉल्ट रूप से, यह"1:1"
पर सेट होता है.safety_filter_level
: सुरक्षा फ़िल्टर करने की सुविधा में एक फ़िल्टर लेवल जोड़ता है. ये वैल्यू मान्य हैं:"BLOCK_LOW_AND_ABOVE"
: प्रॉबबिलिटी स्कोर या गंभीरता स्कोरLOW
,MEDIUM
याHIGH
होने पर ब्लॉक करें."BLOCK_MEDIUM_AND_ABOVE"
: प्रॉबबिलिटी स्कोर या गंभीरता स्कोरMEDIUM
याHIGH
होने पर ब्लॉक करें."BLOCK_ONLY_HIGH"
: प्रॉबबिलिटी स्कोर या गंभीरता का स्कोरHIGH
होने पर ब्लॉक करें.
person_generation
: मॉडल को लोगों की इमेज जनरेट करने की अनुमति दें. ये वैल्यू इस्तेमाल की जा सकती हैं:"DONT_ALLOW"
: लोगों की इमेज जनरेट करने की सुविधा को ब्लॉक करें."ALLOW_ADULT"
: वयस्कों की इमेज जनरेट करें, लेकिन बच्चों की नहीं. यह डिफ़ॉल्ट विकल्प है.
जनरेट की गई इमेज में, न दिखने वाला डिजिटल SynthID वॉटरमार्क हमेशा जोड़ा जाता है.
टेक्स्ट प्रॉम्प्ट की भाषा
इनपुट टेक्स्ट प्रॉम्प्ट की इन भाषाओं में काम करता है:
- अंग्रेज़ी (
en
)
आगे क्या करना है
Imagen के लिए प्रॉम्प्ट लिखने के बारे में ज़्यादा जानने के लिए, Imagen प्रॉम्प्ट गाइड देखें.