تتيح واجهة برمجة التطبيقات Gemini API إدخال ملفات PDF، بما في ذلك المستندات الطويلة (حتى 1, 000 صفحة).
تعالج نماذج Gemini ملفات PDF باستخدام ميزة الرؤية الأصلية، وبالتالي يمكنها
فهم محتوى النصوص والصور داخل المستندات. من خلال إتاحة ميزة "الرؤية" لتنسيق PDF بشكلٍ أصلي، يمكن لنماذج Gemini إجراء ما يلي:
تحليل المخططات البيانية والرسومات البيانية والجداول داخل المستندات
استخراج المعلومات إلى تنسيقات نتائج منظَّمة
الإجابة عن أسئلة حول المحتوى المرئي والنصوص في المستندات
تلخيص المستندات
تحويل محتوى المستند إلى نص (مثلاً إلى HTML) مع الحفاظ على التنسيقات والتنسيقات، وذلك لاستخدامها في التطبيقات المعنيّة
يوضّح هذا البرنامج التعليمي بعض الطرق المحتمَلة لاستخدام Gemini API لمعالجة مستندات PDF.
الخطوات التالية
لمزيد من المعلومات، يُرجى الاطّلاع على المراجع التالية:
استراتيجيات طلب الملفات: تتيح
واجهة برمجة التطبيقات Gemini API طلب البيانات النصية والمرئية والصوتية والفيديوية، ويُعرف ذلك أيضًا باسم
الطلبات المتعدّدة الوسائط.
تعليمات النظام:
تتيح لك تعليمات النظام توجيه سلوك النموذج استنادًا إلى
احتياجاتك وحالات الاستخدام المحدّدة.
تاريخ التعديل الأخير: 2025-05-12 (حسب التوقيت العالمي المتفَّق عليه)
[[["يسهُل فهم المحتوى.","easyToUnderstand","thumb-up"],["ساعَدني المحتوى في حلّ مشكلتي.","solvedMyProblem","thumb-up"],["غير ذلك","otherUp","thumb-up"]],[["لا يحتوي على المعلومات التي أحتاج إليها.","missingTheInformationINeed","thumb-down"],["الخطوات معقدة للغاية / كثيرة جدًا.","tooComplicatedTooManySteps","thumb-down"],["المحتوى قديم.","outOfDate","thumb-down"],["ثمة مشكلة في الترجمة.","translationIssue","thumb-down"],["مشكلة في العيّنات / التعليمات البرمجية","samplesCodeIssue","thumb-down"],["غير ذلك","otherDown","thumb-down"]],["تاريخ التعديل الأخير: 2025-05-12 (حسب التوقيت العالمي المتفَّق عليه)"],[],[]]