Interfejs Gemini API może przetwarzać przekazywane do niego dokumenty PDF i wyciągać wnioski. Kiedy po przesłaniu pliku PDF interfejs Gemini API może:
- Opisz treści lub odpowiedz na pytania na ich temat
- Streść treści
- wyciągaj wnioski na podstawie treści,
Ten samouczek przedstawia kilka możliwych sposobów tworzenia promptów dla interfejsu Gemini API dostarczone dokumenty PDF. Wszystkie dane wyjściowe zawierają tylko tekst.
Co dalej?
Z tego przewodnika dowiesz się, jak używać
generateContent
i
aby generować tekstowe dane wyjściowe z przetworzonych dokumentów. Aby dowiedzieć się więcej,
zajrzyj do tych materiałów:
- Wyświetlanie promptów przy użyciu plików multimedialnych: Gemini API obsługuje prompty z danymi tekstowymi, graficznymi, audio i wideo, nazywanych promptami multimodalnymi.
- Instrukcje systemowe: system które pozwalają sterować działaniem modelu w zależności od do potrzeb i przypadków użycia.
- Wskazówki dotyczące bezpieczeństwa: czasami generatywna AI modele generują nieoczekiwane wyniki, na przykład nieprawidłowe dane wyjściowe, stronniczych lub obraźliwych. Przetwarzanie końcowe i ocena manualna ma kluczowe znaczenie ograniczają ryzyko szkód takich jak dane wyjściowe.