הבנת מסמכים

Gemini API תומך בקלט בפורמט PDF, כולל מסמכים ארוכים (עד 3,600 דפים). המודלים של Gemini מעבדים קובצי PDF באמצעות ראייה מקורית, ולכן הם יכולים להבין גם תוכן טקסט וגם תוכן תמונה במסמכים. בעזרת תמיכה מקורית ב-PDF, מודלים של Gemini יכולים:

  • לנתח דיאגרמות, תרשימים וטבלאות במסמכים
  • חילוץ מידע לפורמטים מובְנים של פלט
  • מענה על שאלות לגבי תוכן חזותי וטקסטואלי במסמכים
  • לסכם מסמכים
  • תמלול תוכן של מסמך (למשל ל-HTML) תוך שמירה על פריסות ועיצוב, לשימוש באפליקציות במורד הזרם

במדריך הזה נסביר כמה דרכים אפשריות לשימוש ב-Gemini API לעיבוד מסמכי PDF.

המאמרים הבאים

מידע נוסף זמין במקורות המידע הבאים:

  • אסטרטגיות להצגת בקשות להעלאת קבצים: Gemini API תומך בהצגת בקשות להעלאת קבצים עם נתוני טקסט, תמונות, אודיו ווידאו, שנקראות גם בקשות להצגת נתונים במגוון מודלים.
  • הוראות מערכת: הוראות המערכת מאפשרות לכם לקבוע את התנהגות המודל בהתאם לצרכים ולתרחישים הספציפיים שלכם.