Знакомство с Gemini 2.5 Flash, Veo 2 и обновлениями Live API. Подробнее ,Знакомство с Gemini 2.5 Flash, Veo 2 и обновлениями Live API. Подробнее ,Знакомство с Gemini 2.5 Flash, Veo 2 и обновлениями Live API. Подробнее ,Знакомство с Gemini 2.5 Flash, Veo 2 и обновлениями Live API. Узнайте больше.
API Gemini поддерживает ввод PDF-файлов, включая длинные документы (до 3600 страниц). Модели Gemini обрабатывают PDF-файлы с использованием встроенного видения и поэтому способны понимать как текстовое, так и графическое содержимое внутри документов. Благодаря встроенной поддержке PDF-файлов модели Gemini могут:
Анализируйте диаграммы, диаграммы и таблицы внутри документов.
Извлечение информации в структурированные выходные форматы
Отвечать на вопросы о визуальном и текстовом содержимом документов.
Обобщить документы
Транскрибируйте содержимое документа (например, в HTML) с сохранением макетов и форматирования для использования в последующих приложениях.
В этом руководстве демонстрируются некоторые возможные способы использования API Gemini для обработки PDF-документов.
Что дальше
Чтобы узнать больше, посетите следующие ресурсы:
Стратегии запроса файлов . API Gemini поддерживает запросы с текстовыми, графическими, аудио- и видеоданными, также известные как мультимодальные запросы.
Системные инструкции . Системные инструкции позволяют вам управлять поведением модели в зависимости от ваших конкретных потребностей и вариантов использования.
[[["Прост для понимания","easyToUnderstand","thumb-up"],["Помог мне решить мою проблему","solvedMyProblem","thumb-up"],["Другое","otherUp","thumb-up"]],[["Отсутствует нужная мне информация","missingTheInformationINeed","thumb-down"],["Слишком сложен/слишком много шагов","tooComplicatedTooManySteps","thumb-down"],["Устарел","outOfDate","thumb-down"],["Проблема с переводом текста","translationIssue","thumb-down"],["Проблемы образцов/кода","samplesCodeIssue","thumb-down"],["Другое","otherDown","thumb-down"]],["Последнее обновление: 2025-04-28 UTC."],[],[]]