Poznaj możliwości przetwarzania dokumentów dzięki interfejsowi Gemini API

Interfejs Gemini API może przetwarzać przekazywane do niego dokumenty PDF i wyciągać wnioski. Kiedy po przesłaniu pliku PDF interfejs Gemini API może:

  • Opisz treści lub odpowiedz na pytania na ich temat
  • Streść treści
  • wyciągaj wnioski na podstawie treści,

Ten samouczek przedstawia kilka możliwych sposobów tworzenia promptów dla interfejsu Gemini API dostarczone dokumenty PDF. Wszystkie dane wyjściowe zawierają tylko tekst.

Co dalej?

Z tego przewodnika dowiesz się, jak używać generateContent i aby generować tekstowe dane wyjściowe z przetworzonych dokumentów. Aby dowiedzieć się więcej, zajrzyj do tych materiałów:

  • Wyświetlanie promptów przy użyciu plików multimedialnych: Gemini API obsługuje prompty z danymi tekstowymi, graficznymi, audio i wideo, nazywanych promptami multimodalnymi.
  • Instrukcje systemowe: system które pozwalają sterować działaniem modelu w zależności od do potrzeb i przypadków użycia.
  • Wskazówki dotyczące bezpieczeństwa: czasami generatywna AI modele generują nieoczekiwane wyniki, na przykład nieprawidłowe dane wyjściowe, stronniczych lub obraźliwych. Przetwarzanie końcowe i ocena manualna ma kluczowe znaczenie ograniczają ryzyko szkód takich jak dane wyjściowe.