درک سند

Gemini API از ورودی PDF، از جمله اسناد طولانی (تا 3600 صفحه) پشتیبانی می کند. مدل‌های Gemini فایل‌های PDF را با دید بومی پردازش می‌کنند و بنابراین می‌توانند محتوای متن و تصویر درون اسناد را درک کنند. با پشتیبانی از دید PDF بومی، مدل‌های Gemini قادرند:

  • نمودارها، نمودارها و جداول داخل اسناد را تجزیه و تحلیل کنید
  • استخراج اطلاعات به فرمت های خروجی ساخت یافته
  • به سوالات مربوط به محتوای تصویری و متنی در اسناد پاسخ دهید
  • اسناد را خلاصه کنید
  • رونویسی محتوای سند (به عنوان مثال به HTML) با حفظ طرح‌بندی و قالب‌بندی، برای استفاده در برنامه‌های پایین دست

این آموزش راه های ممکن برای استفاده از Gemini API برای پردازش اسناد PDF را نشان می دهد.

بعدش چی

برای کسب اطلاعات بیشتر به منابع زیر مراجعه کنید:

  • استراتژی‌های درخواست فایل : Gemini API از درخواست با داده‌های متنی، تصویری، صوتی و ویدیویی پشتیبانی می‌کند که به عنوان درخواست چندوجهی نیز شناخته می‌شود.
  • دستورالعمل‌های سیستم : دستورالعمل‌های سیستم به شما امکان می‌دهد رفتار مدل را بر اساس نیازهای خاص و موارد استفاده خود هدایت کنید.
،

Gemini API از ورودی PDF، از جمله اسناد طولانی (تا 3600 صفحه) پشتیبانی می کند. مدل‌های Gemini فایل‌های PDF را با دید بومی پردازش می‌کنند و بنابراین می‌توانند محتوای متن و تصویر درون اسناد را درک کنند. با پشتیبانی از دید PDF بومی، مدل‌های Gemini قادرند:

  • نمودارها، نمودارها و جداول داخل اسناد را تجزیه و تحلیل کنید
  • استخراج اطلاعات به فرمت های خروجی ساخت یافته
  • به سوالات مربوط به محتوای تصویری و متنی در اسناد پاسخ دهید
  • اسناد را خلاصه کنید
  • رونویسی محتوای سند (به عنوان مثال به HTML) با حفظ طرح‌بندی و قالب‌بندی، برای استفاده در برنامه‌های پایین دست

این آموزش راه های ممکن برای استفاده از Gemini API برای پردازش اسناد PDF را نشان می دهد.

بعدش چی

برای کسب اطلاعات بیشتر به منابع زیر مراجعه کنید:

  • استراتژی‌های درخواست فایل : Gemini API از درخواست با داده‌های متنی، تصویری، صوتی و ویدیویی پشتیبانی می‌کند که به عنوان درخواست چندوجهی نیز شناخته می‌شود.
  • دستورالعمل‌های سیستم : دستورالعمل‌های سیستم به شما امکان می‌دهد رفتار مدل را بر اساس نیازهای خاص و موارد استفاده خود هدایت کنید.
،

Gemini API از ورودی PDF، از جمله اسناد طولانی (تا 3600 صفحه) پشتیبانی می کند. مدل‌های Gemini فایل‌های PDF را با دید بومی پردازش می‌کنند و بنابراین می‌توانند محتوای متن و تصویر درون اسناد را درک کنند. با پشتیبانی از دید PDF بومی، مدل‌های Gemini قادرند:

  • نمودارها، نمودارها و جداول داخل اسناد را تجزیه و تحلیل کنید
  • استخراج اطلاعات به فرمت های خروجی ساخت یافته
  • به سوالات مربوط به محتوای تصویری و متنی در اسناد پاسخ دهید
  • اسناد را خلاصه کنید
  • رونویسی محتوای سند (به عنوان مثال به HTML) با حفظ طرح‌بندی و قالب‌بندی، برای استفاده در برنامه‌های پایین دست

این آموزش راه های ممکن برای استفاده از Gemini API برای پردازش اسناد PDF را نشان می دهد.

بعدش چی

برای کسب اطلاعات بیشتر ، به منابع زیر مراجعه کنید:

  • استراتژی های فرکانس پرونده : API Gemini از ارسال با داده های متن ، تصویر ، صدا و ویدیویی پشتیبانی می کند ، همچنین به عنوان فرکانس چند حالته شناخته می شود.
  • دستورالعمل های سیستم : دستورالعمل های سیستم به شما امکان می دهد رفتار مدل را بر اساس نیازهای خاص خود هدایت کنید و موارد استفاده کنید.
،

API Gemini از ورودی PDF ، از جمله اسناد طولانی (حداکثر 3600 صفحه) پشتیبانی می کند. مدل های جمینی PDF ها را با دید بومی پردازش می کنند و بنابراین قادر به درک محتوای متن و تصویر در اسناد هستند. با پشتیبانی بینایی PDF بومی ، مدل های جمینی قادر به:

  • نمودارها ، نمودارها و جداول داخل اسناد را تجزیه و تحلیل کنید
  • اطلاعات را در قالب های خروجی ساختاری استخراج کنید
  • به سؤالات مربوط به محتوای بصری و متن در اسناد پاسخ دهید
  • خلاصه اسناد
  • برای استفاده در برنامه های پایین دست ، محتوای سند (به عنوان مثال به HTML) حفظ چیدمان و قالب بندی را رونویسی کنید

این آموزش برخی از روشهای ممکن برای استفاده از API Gemini را برای پردازش اسناد PDF نشان می دهد.

بعدش چی

برای کسب اطلاعات بیشتر ، به منابع زیر مراجعه کنید:

  • استراتژی های فرکانس پرونده : API Gemini از ارسال با داده های متن ، تصویر ، صدا و ویدیویی پشتیبانی می کند ، همچنین به عنوان فرکانس چند حالته شناخته می شود.
  • دستورالعمل های سیستم : دستورالعمل های سیستم به شما امکان می دهد رفتار مدل را بر اساس نیازهای خاص خود هدایت کنید و موارد استفاده کنید.