Resim 3'ü kullanarak resimler oluşturun

Gemini API şunlara erişim sağlar: Resim 3, Google'ın son teknoloji ürünü görüntü oluşturma modelidir. Imagen'i kullanarak yeni veya mevcut resimler de dahil olmak üzere Gemini API'nin Imagen ile entegrasyonu, kullanıcı istemlerini saniyeler içinde yüksek kaliteli görsel öğelere dönüştüren yeni nesil yapay zeka uygulamaları oluşturmanıza yardımcı olmak için tasarlanmıştır.

Bu kılavuz, Gemini API Python SDK'sını kullanarak Imagen'i kullanmaya başlamanıza yardımcı olacaktır.

Imagen 3 hakkında

Resim 3, Google'ın en yüksek kaliteli metinden görsele modelidir. Resimde yeni ve iyileştirilmiş olanaklar. Imagen 3 şunları yapabilir:

  • Daha iyi ayrıntı, daha zengin ışık ve daha az dikkat dağıtıcı görüntüler oluşturun. daha fazla görsel öğe vardır.
  • Günlük dilde, doğal dilde yazılan istemleri anlayarak Karmaşık istem mühendisliği olmadan uyumlu çıktılar elde etmenizi sağlar.
  • Fotogerçekçinden çok çeşitli biçim ve stillerde resimler oluşturun manzaralardan zengin dokulu yağlı boya tablolara veya sıra dışı kilim sahnelere kadar geniş bir alanı kapsıyor.
  • Metni önceki modellerden daha etkili bir şekilde oluşturarak yenilerini doğum günü kartları ve sunumlar gibi farklı kullanım alanlarına daha fazla.

Imagen 3, Google'ın güvenlik ve sorumluluk konusundaki en son yenilikleriyle geliştirilmiştir. veri ve model geliştirmeden üretime kadar her şeyi kapsayan bir süreçtir. Google DeepMind ekibi, veri kümelerindeki zararlı içeriği en aza indirmek ve zararlı çıktı olasılığını azaltmak için kapsamlı filtreleme ve veri etiketleme kullandı. Ekip ayrıca kırmızı fonksiyonlarda ekip oluşturma ve değerlendirmeler gibi konularda adalet, önyargı ve içerik güvenliği gibi konuları ele aldık.

Daha fazla bilgi edinmek ve örnek çıkışı görmek için Google DeepMind Imagen 3'e genel bakış başlıklı makaleyi inceleyin.

Başlamadan önce: Projenizi ve API anahtarınızı oluşturun

pip install -U git+https://github.com/google-gemini/generative-ai-python@imagen

Gemini API'yi çağırmadan önce projenizi oluşturmanız ve API anahtarınızı yapılandırmanız gerekir.

Resimleri oluştur

Bu bölümde, bir Imagen modelinin nasıl oluşturulacağı ve görüntüler nasıl oluşturulacağı gösterilmektedir.

Örnek kodu çalıştırmak için önce Pillow'u yüklemeniz gerekir:

pip install --upgrade Pillow

Ardından, Pillow ve Python SDK'sını yükledikten sonra aşağıdaki kodu kullanabilirsiniz resim oluşturmak için:

import os
import google.generativeai as genai

genai.configure(api_key=os.environ['API_KEY'])

imagen = genai.ImageGenerationModel("imagen-3.0-generate-001")

result = imagen.generate_images(
    prompt="Fuzzy bunnies in my kitchen",
    number_of_images=4,
    safety_filter_level="block_only_high",
    person_generation="allow_adult",
    aspect_ratio="3:4",
    negative_prompt="Outside",
)

for image in result.images:
  print(image)

# The output should look similar to this:
# <vertexai.preview.vision_models.GeneratedImage object at 0x78f3396ef370>
# <vertexai.preview.vision_models.GeneratedImage object at 0x78f3396ef700>
# <vertexai.preview.vision_models.GeneratedImage object at 0x78f33953c2b0>
# <vertexai.preview.vision_models.GeneratedImage object at 0x78f33953c280>

for image in result.images:
  # Open and display the image using your local operating system.
  image._pil_image.show()

Not defterinde şuna benzer dört resim gösterilir:

Mutfaktaki iki tüylü tavşanın yapay zeka tarafından üretilmiş resmi

Imagen modeli parametreleri

generate_images() için aşağıdaki parametreler kullanılabilir:

  • prompt: Resim için metin istemi.
  • negative_prompt: Oluşturulan resim. Varsayılan değer "yok"tur.

    Örneğin, "Gece yağışlı, yağışlı ve yoğun şehirde kişiler" olarak adlandırılır. Model, "kişiler" ifadesini çıkarmak yerine dahil edilecek öğelerle ilgili bir talimat olarak yorumlayabilir. Daha iyi sonuçlar elde etmek için "gece yağmurlu bir şehir caddesi" istemiyle birlikte "insanlar" negatif istemini kullanabilirsiniz.

  • number_of_images: Oluşturulacak resim sayısı (1 ile 4 arasında). Varsayılan değer 4'tür.

  • aspect_ratio: Oluşturulan resmin en boy oranını değiştirir. Desteklenen değerler: "1:1", "3:4", "4:3", "9:16" ve "16:9". Varsayılan değer "1:1"

  • safety_filter_level: Güvenlik filtresine bir filtre düzeyi ekler. Aşağıdakiler değerleri geçerli:

    • "block_low_and_above": Olasılık puanı veya önem derecesi puan LOW, MEDIUM veya HIGH.
    • "block_medium_and_above": Olasılık puanı veya önem puanı MEDIUM ya da HIGH olduğunda engelleyin.
    • "block_only_high": Olasılık puanı veya önem puanı HIGH olduğunda engelle.
  • person_generation: Modelin insan resimlerini oluşturmasına izin ver. Aşağıdaki değerler desteklenir:

    • "dont_allow": Kullanıcı resimleri oluşturmayı engelle.
    • "allow_adult": Çocukların değil yetişkinlerin resimlerini üretmesi.

Sırada ne var?

Gemini API'deki Image 3, erken erişim sürümündedir. Gelişmeler için bizi takip etmeye devam edin: ve özelliğin durumu.