Imazhi 3 në API të Gemini

Gemini API ofron akses në Imagen 3 , modeli tekst-në-imazh i cilësisë më të lartë të Google, duke shfaqur një sërë aftësish të reja dhe të përmirësuara. Imazhi 3 mund të bëjë sa më poshtë:

  • Gjeneroni imazhe me detaje më të mira, ndriçim më të pasur dhe më pak objekte shpërqendruese sesa modelet e mëparshme
  • Kuptoni kërkesat e shkruara në gjuhë natyrore
  • Gjeneroni imazhe në një gamë të gjerë formatesh dhe stilesh
  • Paraqitni tekstin në mënyrë më efektive se modelet e mëparshme

Gjeneroni imazhe

Ky seksion ju tregon se si të krijoni një model Imagen dhe të krijoni imazhe.

Pasi të instaloni AI SDK gjeneruese të Google, mund të përdorni kodin e mëposhtëm për të gjeneruar imazhe:

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client(api_key='GEMINI_API_KEY')

response = client.models.generate_images(
    model='imagen-3.0-generate-002',
    prompt='Fuzzy bunnies in my kitchen',
    config=types.GenerateImagesConfig(
        number_of_images= 4,
    )
)
for generated_image in response.generated_images:
  image = Image.open(BytesIO(generated_image.image.image_bytes))
  image.show()

Shembulli i kodit duhet të nxjerrë katër imazhe të ngjashme me këtë:

Imazhi i krijuar nga AI i dy lepurushëve të paqartë në kuzhinë

Zhvilluesit e Python mund të provojnë gjithashtu fletoren Fillimi me Imagenlibrin e gatimit Gemini .

Parametrat e modelit të imazhit

Parametrat e mëposhtëm janë të disponueshëm për generate_images() :

  • prompt : Prompt teksti për imazhin.
  • number_of_images : Numri i imazheve që do të gjenerohen, nga 1 në 4 (përfshirë). Parazgjedhja është 4.
  • aspect_ratio : Ndryshon raportin e pamjes së imazhit të krijuar. Vlerat e mbështetura janë "1:1" , "3:4" , "4:3" , "9:16" dhe "16:9" . Parazgjedhja është "1:1" .
  • safety_filter_level : Shton një nivel filtri në filtrimin e sigurisë. Vlerat e mëposhtme janë të vlefshme:
    • "BLOCK_LOW_AND_ABOVE" : Blloko kur rezultati i probabilitetit ose rezultati i ashpërsisë është LOW , MEDIUM ose HIGH .
    • "BLOCK_MEDIUM_AND_ABOVE" : Blloko kur rezultati i probabilitetit ose rezultati i ashpërsisë është MEDIUM ose HIGH .
    • "BLOCK_ONLY_HIGH" : Blloko kur rezultati i probabilitetit ose rezultati i ashpërsisë është HIGH .
  • person_generation : Lejo modelin të gjenerojë imazhe të njerëzve. Vlerat e mëposhtme mbështeten:
    • "DONT_ALLOW" : Blloko gjenerimin e imazheve të njerëzve.
    • "ALLOW_ADULT" : Krijo imazhe të të rriturve, por jo të fëmijëve. Ky është standardi.

Një filigran dixhital i padukshëm SynthID shtohet gjithmonë në imazhet e krijuara.

Gjuha e kërkesës së tekstit

Gjuhët e mëposhtme të kërkesës së tekstit të hyrjes mbështeten:

  • anglisht ( en )

Çfarë është më pas

Për të mësuar më shumë rreth shkrimit të shpejtë për Imagen, shihni udhëzuesin e kërkesës Imagen .