La API de Gemini puede procesar y ejecutar inferencias en los documentos PDF que se le pasan. Cuando se sube un PDF, la API de Gemini puede hacer lo siguiente:
- Describir o responder preguntas sobre el contenido
- Resume el contenido
- Extrapolar a partir del contenido
En este instructivo, se muestran algunas formas posibles de solicitar a la API de Gemini los documentos PDF proporcionados. Todo el resultado es solo texto.
¿Qué sigue?
En esta guía, se muestra cómo usar generateContent
y generar resultados de texto a partir de documentos procesados. Para obtener más información, consulta los siguientes recursos:
- Estrategias de indicaciones de archivos: La API de Gemini admite indicaciones con datos de texto, imagen, audio y video, también conocidos como indicaciones multimodales.
- Instrucciones del sistema: Las instrucciones del sistema te permiten dirigir el comportamiento del modelo según tus necesidades y casos de uso específicos.
- Orientación de seguridad: A veces, los modelos de IA generativa producen resultados inesperados, como resultados imprecisos, sesgados o ofensivos. El procesamiento posterior y la evaluación humana son esenciales para limitar el riesgo de daños que pueden causar estos resultados.