יכולות של עיבוד מסמכים עם Gemini API

ה-API של Gemini יכול לעבד מסמכי PDF שמועברים אליו ולבצע בהם הסקת מסקנות. כשמועלה קובץ PDF, Gemini API יכול:

  • לתאר את התוכן או לענות על שאלות לגבי התוכן
  • סיכום התוכן
  • להסיק מסקנות מהתוכן

במדריך הזה נסביר כמה דרכים אפשריות להציג ל-Gemini API קובצי PDF שסופקו. כל הפלט הוא טקסט בלבד.

המאמרים הבאים

במדריך הזה מוסבר איך להשתמש ב-generateContent וליצור פלט טקסט ממסמכים שעברו עיבוד. מידע נוסף זמין במשאבים הבאים:

  • אסטרטגיות להצגת בקשות להעלאת קבצים: Gemini API תומך בהצגת בקשות להעלאת קבצים עם נתוני טקסט, תמונות, אודיו ווידאו, שנקראות גם בקשות להצגת נתונים במגוון מודלים.
  • הוראות מערכת: הוראות המערכת מאפשרות לכם לקבוע את התנהגות המודל בהתאם לצרכים ולתרחישים הספציפיים שלכם.
  • הנחיות בטיחות: לפעמים מודלים של AI גנרטיבי יוצרים תוצאות לא צפויות, כמו תוצאות לא מדויקות, מוטה או פוגעניות. עיבוד תמונה (Post Processing) והערכה אנושית הם חיוניים כדי להגביל את הסיכון לנזק כתוצאה מפלט כזה.