Conheça os recursos de processamento de documentos com a API Gemini

A API Gemini pode processar e executar inferências em documentos PDF transmitidos a ela. Quando um PDF é enviado, a API Gemini pode:

  • Descreva ou responda a perguntas sobre o conteúdo
  • Resumir o conteúdo
  • Extrapolar do conteúdo

Neste tutorial, demonstramos algumas maneiras possíveis de enviar comandos à API Gemini documentos PDF fornecidos. Todas as saídas são somente de texto.

A seguir

Neste guia, mostramos como usar generateContent e para gerar saídas de texto com base em documentos processados. Para saber mais, consulte os seguintes recursos:

  • Como executar comandos com arquivos de mídia: o A API Gemini oferece suporte a comandos com dados de texto, imagem, áudio e vídeo, também conhecidos como comandos multimodais.
  • Instruções do sistema: System permitem que você direcione o comportamento do modelo com base necessidades e casos de uso.
  • Orientação de segurança: às vezes, a IA generativa os modelos produzem saídas inesperadas, como saídas imprecisas, enviesada ou ofensiva. O pós-processamento e a avaliação humana são essenciais e limitar o risco de danos desses resultados.