Découvrez les capacités de traitement de documents avec l'API Gemini

L'API Gemini peut traiter et exécuter des inférences sur les documents PDF qui lui sont transmis. Lorsqu'un PDF est importé, l'API Gemini peut :

  • décrire ou répondre à des questions sur le contenu ;
  • Résumer le contenu
  • Extrapoler à partir du contenu

Ce tutoriel présente quelques façons d'inviter l'API Gemini avec les documents PDF fournis. Toutes les sorties sont textuelles uniquement.

Étape suivante

Ce guide explique comment utiliser generateContent et générer des sorties textuelles à partir de documents traités. Pour en savoir plus, consultez les ressources suivantes :

  • Stratégies de requête de fichier: l'API Gemini est compatible avec les requêtes comportant du texte, des images, de l'audio et des vidéos, également appelées requêtes multimodales.
  • Instructions système : les instructions système vous permettent d'orienter le comportement du modèle en fonction de vos besoins et de vos cas d'utilisation spécifiques.
  • Conseils de sécurité : Les modèles d'IA générative produisent parfois des résultats inattendus, comme des résultats inexacts, biaisés ou choquants. Le post-traitement et l'évaluation humaine sont essentiels pour limiter le risque de préjudices liés à ces sorties.