Explora las capacidades de procesamiento de documentos con la API de Gemini
Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
La API de Gemini puede procesar y ejecutar inferencias en documentos PDF que se le pasen. Cuándo
se sube un PDF, la API de Gemini puede hacer lo siguiente:
Describe o responde preguntas sobre el contenido
Resume el contenido
Extrapolar a partir del contenido
En este instructivo, se muestran algunas formas posibles de usar instrucciones para la API de Gemini
los documentos PDF proporcionados. Todos los resultados son de solo texto.
¿Qué sigue?
En esta guía, se muestra cómo usar
generateContent y
para generar resultados de texto
a partir de documentos procesados. Para obtener más información,
consulta los siguientes recursos:
Instrucciones con archivos multimedia: La
La API de Gemini admite instrucciones con datos de texto, imagen, audio y video.
conocida como instrucción multimodal.
Instrucciones del sistema: Sistema
instrucciones te permiten guiar el comportamiento del modelo según tu
necesidades y casos de uso.
Orientación sobre seguridad: A veces, la IA generativa
los modelos generan resultados inesperados,
como resultados inexactos
ofensiva o sesgada. El procesamiento posterior y la evaluación humana son esenciales
limitar el riesgo de daños derivados de dichos productos.