สำรวจความสามารถในการประมวลผลเอกสารด้วย Gemini API

Gemini API สามารถประมวลผลและเรียกใช้การอนุมานในเอกสาร PDF ที่ส่งผ่านได้ เมื่ออัปโหลด PDF แล้ว Gemini API จะทําสิ่งต่อไปนี้ได้

  • อธิบายหรือตอบคำถามเกี่ยวกับเนื้อหา
  • สรุปเนื้อหา
  • คาดการณ์จากเนื้อหา

บทแนะนำนี้แสดงวิธีบางอย่างที่เป็นไปได้ในการแจ้ง Gemini API ด้วยเอกสาร PDF ที่ให้มา เอาต์พุตทั้งหมดเป็นแบบข้อความเท่านั้น

ขั้นตอนถัดไป

คู่มือนี้แสดงวิธีใช้ generateContent และวิธีสร้างเอาต์พุตข้อความจากเอกสารที่ประมวลผลแล้ว ดูข้อมูลเพิ่มเติมได้ที่แหล่งข้อมูลต่อไปนี้

  • กลยุทธ์การแจ้งไฟล์: Gemini API รองรับการแจ้งด้วยข้อมูลข้อความ รูปภาพ เสียง และวิดีโอ หรือที่เรียกว่าการแจ้งแบบหลายสื่อ
  • คำสั่งของระบบ: คำสั่งของระบบช่วยให้คุณควบคุมลักษณะการทํางานของโมเดลตามความต้องการและกรณีการใช้งานที่เฉพาะเจาะจง
  • คำแนะนำด้านความปลอดภัย: บางครั้งโมเดล Generative AI จะสร้างเอาต์พุตที่ไม่คาดคิด เช่น เอาต์พุตที่ไม่ถูกต้อง มีอคติ หรือไม่เหมาะสม ขั้นตอนหลังการประมวลผลและการประเมินจากเจ้าหน้าที่เป็นสิ่งจําเป็นในการจำกัดความเสี่ยงของอันตรายจากเอาต์พุตดังกล่าว