Belge anlama

Gemini API, uzun dokümanlar (3.600 sayfaya kadar) dahil olmak üzere PDF girişini destekler. Gemini modelleri, PDF'leri yerel görüntüleme ile işler ve bu nedenle dokümanlar içindeki hem metin hem de resim içeriklerini anlayabilir. Gemini modelleri, yerel PDF görüntüleme desteğiyle şunları yapabilir:

  • Dokümanlar içindeki diyagramları, grafikleri ve tabloları analiz etme
  • Bilgileri yapılandırılmış çıkış biçimlerine ayıklayın
  • Dokümanlardaki görsel ve metin içerikleriyle ilgili soruları yanıtlama
  • Belgeleri özetleme
  • Aşağı akış uygulamalarında kullanılmak üzere doküman içeriğini (ör. HTML'ye) düzen ve biçimlendirmeyi koruyarak metne dönüştürme

Bu eğitimde, PDF belgelerini işlemek için Gemini API'yi kullanmanın bazı olası yolları gösterilmektedir.

Sırada ne var?

Daha fazla bilgi edinmek için aşağıdaki kaynakları inceleyin:

  • Dosya istemi stratejileri: Gemini API, çoklu formatlı istem olarak da bilinen metin, resim, ses ve video verileriyle istemleri destekler.
  • Sistem talimatları: Sistem talimatları, modelin davranışını belirli ihtiyaçlarınıza ve kullanım alanlarınıza göre yönlendirmenize olanak tanır.