Resim 3'ü kullanarak resimler oluşturun

Gemini API, Google'ın en gelişmiş görüntü oluşturma modeli olan Imagen 3'e erişim sağlar. Imagen'i kullanarak metin istemlerinden yeni resimler oluşturabilirsiniz. Gemini API'nin Imagen ile entegrasyonu, kullanıcı istemlerini saniyeler içinde yüksek kaliteli görsel öğelere dönüştüren yeni nesil yapay zeka uygulamaları oluşturmanıza yardımcı olmak için tasarlanmıştır.

Bu kılavuz, Gemini API Python SDK'sını kullanarak Imagen'i kullanmaya başlamanıza yardımcı olacaktır.

Imagen 3 hakkında

Google'ın en yüksek kaliteli metinden görsel oluşturma modeli olan Imagen 3, bir dizi yeni ve iyileştirilmiş özelliklere sahiptir. Imagen 3 şunları yapabilir:

  • Önceki modellere kıyasla daha iyi ayrıntılara, daha zengin ışıklandırmaya ve daha az dikkat dağıtıcı artefact'a sahip görüntüler oluşturun.
  • Doğal ve günlük dilde yazılmış istemleri anlayarak karmaşık istem mühendisliği olmadan uyumlu çıktı oluşturmayı kolaylaştırır.
  • Fotogerçekçi peyzajlardan zengin dokulu yağlı boya tablolara veya tuhaf kil desenli sahnelere kadar çok çeşitli biçim ve stillerde resimler oluşturun.
  • Metni önceki modellere kıyasla daha etkili bir şekilde oluşturur. Böylece stilize doğum günü kartları, sunumlar ve daha fazlası gibi kullanım alanları için yeni olasılıklar sunar.

Imagen 3, veri ve model geliştirmeden üretime kadar Google'ın en son güvenlik ve sorumluluk yenilikleriyle oluşturuldu. Google DeepMind ekibi, veri kümelerindeki zararlı içeriği en aza indirmek ve zararlı çıktı olasılığını azaltmak için kapsamlı filtreleme ve veri etiketleme kullandı. Ekip ayrıca adalet, önyargı ve içerik güvenliği gibi konularda kırmızı ekipler oluşturup değerlendirmeler yaptı.

Daha fazla bilgi edinmek ve örnek çıkışı görmek için Google DeepMind Imagen 3'e genel bakış bölümüne bakın.

Başlamadan önce: Projenizi ve API anahtarınızı oluşturun

pip install -U git+https://github.com/google-gemini/generative-ai-python@imagen

Gemini API'yi çağırmadan önce projenizi ayarlamanız ve API anahtarınızı yapılandırmanız gerekir.

Resimleri oluştur

Bu bölümde, bir Imagen modelinin nasıl oluşturulacağı ve görüntüler nasıl oluşturulacağı gösterilmektedir.

Örnek kodu çalıştırmak için önce Pillow'u yüklemeniz gerekir:

pip install --upgrade Pillow

Ardından, Pillow ve Python SDK'sı yüklüyken resim oluşturmak için aşağıdaki kodu kullanabilirsiniz:

import os
import google.generativeai as genai

genai.configure(api_key=os.environ['API_KEY'])

imagen = genai.ImageGenerationModel("imagen-3.0-generate-001")

result = imagen.generate_images(
    prompt="Fuzzy bunnies in my kitchen",
    number_of_images=4,
    safety_filter_level="block_only_high",
    person_generation="allow_adult",
    aspect_ratio="3:4",
    negative_prompt="Outside",
)

for image in result.images:
  print(image)

# The output should look similar to this:
# <vertexai.preview.vision_models.GeneratedImage object at 0x78f3396ef370>
# <vertexai.preview.vision_models.GeneratedImage object at 0x78f3396ef700>
# <vertexai.preview.vision_models.GeneratedImage object at 0x78f33953c2b0>
# <vertexai.preview.vision_models.GeneratedImage object at 0x78f33953c280>

for image in result.images:
  # Open and display the image using your local operating system.
  image._pil_image.show()

Not defterinde şuna benzer dört resim gösterilir:

Mutfaktaki iki tüylü tavşanın yapay zeka tarafından üretilmiş resmi

Imagen model parametreleri

generate_images() için aşağıdaki parametreler kullanılabilir:

  • prompt: Resim için metin istemi.
  • negative_prompt: Oluşturulan resimlerde nelerden hariç tutmak istediğinizin bir açıklaması. Varsayılan değer "yok"tur.

    Örneğin, "geceleri yağmurlu ve insansız bir şehir caddesi" istemiyle karşılaşabilirsiniz. Model, "kişiler" ifadesini çıkarmak yerine dahil edilecek öğelerle ilgili bir talimat olarak yorumlayabilir. Daha iyi sonuçlar elde etmek için "gece yağmurlu bir şehir caddesi" istemiyle birlikte "insanlar" negatif istemini kullanabilirsiniz.

  • number_of_images: Oluşturulacak resim sayısı (1 ile 4 arasında). Varsayılan değer 4'tür.

  • aspect_ratio: Oluşturulan resmin en boy oranını değiştirir. Desteklenen değerler: "1:1", "3:4", "4:3", "9:16" ve "16:9". Varsayılan değer "1:1"'tir.

  • safety_filter_level: Güvenlik filtresine bir filtre düzeyi ekler. Aşağıdaki değerler geçerlidir:

    • "block_low_and_above": Olasılık puanı veya önem puanı LOW, MEDIUM veya HIGH olduğunda engelleyin.
    • "block_medium_and_above": Olasılık puanı veya önem puanı MEDIUM ya da HIGH olduğunda engelleyin.
    • "block_only_high": Olasılık puanı veya önem puanı HIGH olduğunda engelleyin.
  • person_generation: Modelin insanların resimlerini oluşturmasına izin verin. Aşağıdaki değerler desteklenir:

    • "dont_allow": Kullanıcı resimleri oluşturmayı engelle.
    • "allow_adult": Çocuklara ait değil, yetişkinlere ait görseller oluşturun.

Metin istemi dili

Aşağıdaki giriş metni istemi dilleri desteklenir:

  • Çince (basitleştirilmiş) (zh/zh-CN)
  • Çince (geleneksel) (zh-TW)
  • İngilizce (en)
  • Hintçe (hi)
  • Japonca (ja)
  • Korece (ko)
  • Portekizce (pt)
  • İspanyolca (es)

Sırada ne var?

Gemini API'deki Image 3, erken erişim sürümündedir. Özelliğin durumu hakkındaki duyuruları takip edin.