Esplora le funzionalità di elaborazione dei documenti con l'API Gemini

L'API Gemini può elaborare ed eseguire l'inferenza sui documenti PDF trasmessi. Quando viene caricato un PDF, l'API Gemini può:

  • Descrivere o rispondere a domande sui contenuti
  • Riassumere i contenuti
  • Fare estrazioni dai contenuti

Questo tutorial mostra alcuni possibili modi per richiedere all'API Gemini i documenti PDF forniti. Tutto l'output è solo di testo.

Passaggi successivi

Questa guida mostra come utilizzare generateContent e generare output di testo dai documenti elaborati. Per saperne di più, consulta le seguenti risorse:

  • Strategie di prompt dei file: l'API Gemini supporta i prompt con dati di testo, immagini, audio e video, noti anche come prompt multimodali.
  • Istruzioni di sistema: le istruzioni di sistema ti consentono di indirizzare il comportamento del modello in base alle tue esigenze e ai tuoi casi d'uso specifici.
  • Indicazioni per la sicurezza: a volte i modelli di IA generativa producono output inaspettati, ad esempio imprecisi, biassati o offensivi. La post-elaborazione e la valutazione umana sono essenziali per limitare il rischio di danni.