Gemini API ile görüş özelliklerini keşfedin

ai.google.dev'de göster Google Colab'de çalıştır Kaynağı GitHub'da görüntüle

Gemini API, kendisine geçirilen görüntüler ve videolar üzerinde çıkarım yapabilir. Gemini bir resim, bir dizi resim veya video iletildiğinde şunları yapabilir:

  • İçerikle ilgili soruları açıklayın veya yanıtlayın.
  • İçeriği özetleyin
  • İçerikten çıkarım yapma

Bu eğitimde, resimler ve video girişleriyle Gemini API'ye istem göndermenin bazı olası yolları gösterilmektedir. Tüm çıktılar yalnızca metin şeklindedir.

Sırada ne var?

Bu kılavuzda, generateContent özelliğinin nasıl kullanıldığı ve resim ve video girişlerinden metin çıktılarının nasıl oluşturulacağı gösterilmektedir. Daha fazla bilgi edinmek için aşağıdaki kaynaklara göz atın:

  • Medya dosyalarıyla istem gönderme: Gemini API, çok modlu istem olarak da bilinen metin, resim, ses ve video verileriyle istem göndermeyi destekler.
  • Sistem talimatları: Sistem talimatları, modelin davranışını belirli ihtiyaçlarınıza ve kullanım alanlarınıza göre yönlendirmenizi sağlar.
  • Güvenlik yardımı: Üretken yapay zeka modelleri bazen hatalı, taraflı veya rahatsız edici çıkışlar gibi beklenmedik çıkışlar üretebilir. Bu tür çıkışların zarar görmesi riskini azaltmak için işleme sonrası ve gerçek kişiler tarafından yapılan değerlendirmeler çok önemlidir.