استكشاف إمكانات معالجة المستندات باستخدام Gemini API

بإمكان Gemini API معالجة واستنتاج مستندات PDF التي يتم نقلها إليها. فعندما تحميل ملف PDF، يمكن لواجهة Gemini API تنفيذ ما يلي:

  • وضّح أسئلة حول المحتوى أو أجِب عنها
  • تلخيص المحتوى
  • الاستنتاج من المحتوى

يشرح هذا الدليل التوجيهي بعض الطرق المحتملة لطلب واجهة برمجة التطبيقات Gemini API باستخدام مستندات PDF المقدمة. تكون جميع النتائج نصية فقط.

الخطوات التالية

يوضح هذا الدليل كيفية استخدام generateContent و لإنشاء مخرجات نصية من المستندات التي تمت معالجتها. للمزيد من المعلومات يمكنك الاطّلاع على المراجع التالية:

  • عرض الطلب مع ملفات الوسائط: تتيح واجهة Gemini API أيضًا إرسال الطلبات باستخدام بيانات النصوص والصور والصوت والفيديوهات. المعروف باسم المطالبة متعددة الوسائط.
  • تعليمات النظام: النظام توجيه سلوك النموذج بناءً على احتياجاتهم وحالات الاستخدام الخاصة بهم.
  • إرشادات حول الأمان: يستخدم الذكاء الاصطناعي التوليدي أحيانًا مخرجات غير متوقعة، مثل المخرجات غير الدقيقة، أو متحيزة أو مسيئة. تعد مرحلة ما بعد المعالجة والتقييم البشري ضروريين الحد من مخاطر الضرر الناجم عن هذه المخرجات.