Découvrez les capacités de traitement de documents avec l'API Gemini

L'API Gemini peut traiter et exécuter des inférences sur les documents PDF qui lui sont transmis. Quand ? un PDF est importé, l'API Gemini peut:

  • Décrivez ou répondez aux questions sur le contenu
  • Résumer le contenu
  • Extrapoler à partir du contenu

Ce tutoriel présente plusieurs façons d'envoyer une requête à l'API Gemini avec documents PDF fournis. Tous les résultats ne contiennent que du texte.

Étape suivante

Ce guide vous explique comment utiliser generateContent et pour générer des sorties texte à partir de documents traités. Pour en savoir plus, consultez les ressources suivantes:

  • Invite avec des fichiers multimédias: l'option L'API Gemini prend en charge les requêtes contenant du texte, des images, de l'audio et de la vidéo, appelées requêtes multimodales.
  • Instructions relatives au système: Système vous permettent de contrôler le comportement du modèle en fonction besoins et cas d'utilisation.
  • Conseils de sécurité: parfois, l'IA générative les modèles produisent des résultats inattendus, tels que des résultats inexacts, biaisées ou choquantes. Le post-traitement et l'évaluation humaine sont essentiels pour limiter le risque que ces sorties soient néfastes.