API Gemini có thể xử lý và chạy quy trình suy luận trên các tài liệu PDF được truyền vào. Khi bạn tải một tệp PDF lên, Gemini API có thể:
- Mô tả hoặc trả lời các câu hỏi về nội dung
- Tóm tắt nội dung
- Dự đoán từ nội dung
Hướng dẫn này minh hoạ một số cách có thể áp dụng để nhắc API Gemini bằng tài liệu PDF được cung cấp. Tất cả đầu ra đều chỉ ở dạng văn bản.
Bước tiếp theo
Hướng dẫn này cho biết cách sử dụng generateContent
và cách tạo đầu ra văn bản từ các tài liệu đã xử lý. Để tìm hiểu thêm, hãy xem các tài nguyên sau:
- Chiến lược nhắc tệp: Gemini API hỗ trợ nhắc bằng dữ liệu văn bản, hình ảnh, âm thanh và video, còn gọi là nhắc đa phương thức.
- Hướng dẫn hệ thống: Hướng dẫn hệ thống cho phép bạn điều hướng hành vi của mô hình dựa trên các nhu cầu và trường hợp sử dụng cụ thể.
- Hướng dẫn an toàn: Đôi khi, các mô hình AI tạo sinh tạo ra kết quả không mong muốn, chẳng hạn như kết quả không chính xác, thiên vị hoặc phản cảm. Quy trình xử lý hậu kỳ và đánh giá của con người là yếu tố thiết yếu để hạn chế rủi ro gây hại từ những kết quả như vậy.