Mempelajari kemampuan pemrosesan dokumen dengan Gemini API

Gemini API dapat memproses dan menjalankan inferensi pada dokumen PDF yang diteruskan ke Gemini API. Saat PDF diupload, Gemini API dapat:

  • Menjelaskan atau menjawab pertanyaan tentang konten
  • Rangkum konten
  • Menggali informasi dari konten

Tutorial ini menunjukkan beberapa kemungkinan cara untuk memerintahkan Gemini API dengan dokumen PDF yang disediakan. Semua output hanya berupa teks.

Langkah berikutnya

Panduan ini menunjukkan cara menggunakan generateContent dan membuat output teks dari dokumen yang diproses. Untuk mempelajari lebih lanjut, lihat referensi berikut:

  • Strategi perintah file: Gemini API mendukung perintah dengan data teks, gambar, audio, dan video, yang juga dikenal sebagai perintah multimodal.
  • Petunjuk sistem: Petunjuk sistem memungkinkan Anda mengarahkan perilaku model berdasarkan kebutuhan dan kasus penggunaan tertentu.
  • Panduan keamanan: Terkadang model AI generatif menghasilkan output yang tidak terduga, seperti output yang tidak akurat, bias, atau menyinggung. Pascapemrosesan dan evaluasi manual sangat penting untuk membatasi risiko bahaya dari output tersebut.