Gemini API ile görüş özelliklerini keşfedin

ai.google.dev'de görüntüleyin Google Colab'de çalıştır Kaynağı GitHub'da görüntüle

Gemini API, kendisine geçirilen görüntüler ve videolar üzerinde çıkarım yapabilir. Geçildiğinde bir resim, bir dizi resim veya video kullanıyorsanız Gemini şunları yapabilir:

  • İçerikle ilgili soruları açıklayın veya yanıtlayın.
  • İçeriği özetleyin
  • İçerikten çıkarım yapma

Bu eğitimde, Gemini API'yi kullanarak istemde bulunmanın bazı olası yolları gösterilmektedir resim ve video girişi. Tüm çıktılar yalnızca metin şeklindedir.

Sırada ne var?

Bu kılavuzda, generateContent ve resim ve video girişlerinden metin çıkışları oluşturmak için kullanılır. Daha fazla bilgi edinmek için şu kaynaklara göz atın:

  • Medya dosyalarıyla istem kullanma: Gemini API, istemlerin yanı sıra metin, resim, ses ve video verilerini de çok modlu istem olarak adlandırılır.
  • Sistem talimatları: Sistem talimatlar, modelin davranışını verilerinize göre yönlendirmenizi sağlar. kullanım alanlarını ele aldık.
  • Güvenlik rehberliği: Bazen üretken yapay zeka modeller, hatalı çıkışlar gibi beklenmedik çıkışlar üretir. veya rahatsız edici tavırlar ortaya koyar. Değerlendirme süreci, proje yöneticileri için bu tür çıkışların zarar verme riskini azaltır.