Conheça os recursos de processamento de documentos com a API Gemini

A API Gemini pode processar e executar inferências em documentos PDF transmitidos a ela. Quando um PDF é enviado, a API Gemini pode:

  • Descreva ou responda a perguntas sobre o conteúdo
  • Resumir o conteúdo
  • Extrapolar do conteúdo

Neste tutorial, demonstramos algumas maneiras possíveis de solicitar a API Gemini com documentos PDF fornecidos. Toda a saída é somente texto.

A seguir

Este guia mostra como usar generateContent e gerar saídas de texto de documentos processados. Para saber mais, confira estes recursos:

  • Estratégias de solicitação de arquivo: a API Gemini oferece suporte a solicitações com dados de texto, imagem, áudio e vídeo, também conhecidas como solicitações multimodais.
  • Instruções do sistema: as instruções do sistema permitem orientar o comportamento do modelo com base nas suas necessidades e casos de uso específicos.
  • Orientações de segurança: às vezes, os modelos de IA generativa produzem resultados inesperados, como respostas imprecisas, parciais ou ofensivas. O pós-processamento e a avaliação humana são essenciais para limitar o risco de danos causados por essas saídas.