API взаимодействий
API Interactions — это новый стандарт для разработки с использованием Gemini, рекомендуемый для всех новых проектов. Он оптимизирован для агентских рабочих процессов, управления состоянием на стороне сервера и сложных многомодальных многоэтапных диалогов. Оригинальный API generateContent по-прежнему полностью поддерживается.
Зачем использовать API для взаимодействия?
- Управление историей на стороне сервера : упрощенные многоэтапные потоки с помощью
previous_interaction_id. Сервер по умолчанию включает состояние (store=true), но вы можете переключиться на поведение без состояния, установивstore=false. - Наблюдаемые этапы выполнения : Типизированные этапы упрощают отладку сложных сценариев и отображение пользовательского интерфейса для промежуточных событий (например, мыслей или виджетов поиска).
- Создано для агентных рабочих процессов : встроенная поддержка многоэтапного использования инструментов, оркестровки и сложных потоков рассуждений посредством типизированных этапов выполнения.
- Длительные и фоновые задачи : Поддерживает перенос ресурсоемких операций, таких как Deep Think и Deep Research, в фоновые процессы с помощью
background=true. - Доступ к новым моделям и возможностям : В дальнейшем новые модели, выходящие за рамки основной линейки, а также новые возможности и инструменты для работы с агентами будут запускаться исключительно через API взаимодействий.
Используйте API взаимодействий, если вы начинаете новый проект, разрабатываете агентские приложения или вам необходимо управление диалогами на стороне сервера. Используйте generateContent если у вас уже есть интеграция, которая подходит для ваших нужд, или если вам требуется функция, которая еще недоступна в API взаимодействий, например, API пакетной обработки или явное кэширование.
Начать
- Настройте своего помощника по программированию : подключитесь к Gemini Docs MCP и установите навык
gemini-interactions-api, чтобы предоставить своему помощнику прямой доступ к последней документации для разработчиков и рекомендациям по лучшим практикам. Настройте своего помощника по программированию → - Переход с
generateContent: Если у вас уже есть интеграция, следуйте руководству по миграции , чтобы перейти на API взаимодействий. - Попробуйте быстрый старт : начните работу с минимального рабочего примера в разделе быстрого старта по API взаимодействий .
Руководства по функциям
Изучите конкретные возможности API взаимодействий с помощью этих руководств. Вы можете использовать переключатель на этих страницах для переключения между generateContent и API взаимодействий:
- Генерация текста
- генерация изображений
- понимание изображений
- Понимание звука
- Понимание видео
- Обработка документов
- Вызов функции
- Структурированный вывод
- Агент глубоких исследований
- Гибкий вывод
- Приоритетный вывод
- Стриминг
Как работает API взаимодействий
API взаимодействия основан на ключевом ресурсе: Interaction . Interaction представляет собой полный ход в разговоре или задаче. Оно действует как запись сессии, содержащая всю историю взаимодействия в виде хронологической последовательности шагов выполнения . Эти шаги включают в себя мысли модели, вызовы инструментов на стороне сервера или клиента и результаты (например, function_call и function_result ), а также итоговый model_output ). Сохраненный ресурс (получаемый через interactions.get ) также включает шаги ввода user_input для полного контекста, хотя ответ interactions.create возвращает только шаги, сгенерированные моделью.
При вызове метода interactions.create вы создаете новый ресурс Interaction .
Доступ к выходным данным осуществляется с помощью удобных свойств SDK.
Хотя API взаимодействия возвращает структурированную временную шкалу этапов выполнения (таких как мысли, поисковые запросы и вызовы функций), вам не нужно вручную проходить эти этапы, чтобы получить окончательный ответ модели.
SDK Google GenAI предоставляют удобные свойства непосредственно в возвращаемом объекте Interaction для доступа к результатам для различных режимов отображения:
| Удобное свойство SDK | Тип возвращаемого значения | Описание |
|---|---|---|
interaction.output_text | Нить | Возвращает последние текстовые блоки в ответе модели. Если ответ разбит на несколько последовательных блоков TextContent , он автоматически объединяет их. Он не включает более ранние текстовые блоки, разделенные нетекстовым содержимым (таким как мысли, изображения, аудио или вызовы инструментов). Для сложных или чередующихся мультимодальных ответов необходимо вручную перебирать steps . |
interaction.output_image | ImageContent или None | Возвращает последний блок изображения, сгенерированный моделью в текущем запросе. |
interaction.output_audio | Аудиоконтент или None | Возвращает последний аудиоблок, сгенерированный моделью в текущем запросе. |
Для более сложных сценариев использования — таких как отображение промежуточных мыслительных процессов, анализ пошаговых вызовов инструментов или отладка — вы по-прежнему можете вручную просматривать и перемещаться по временной шкале interaction.steps .
Управление состоянием на стороне сервера
Вы можете использовать id завершенного взаимодействия в последующем вызове, используя параметр previous_interaction_id , чтобы продолжить разговор. Сервер использует этот идентификатор для получения истории разговора, что избавляет вас от необходимости повторно отправлять всю историю чата.
Параметр previous_interaction_id сохраняет только историю диалога (входные и выходные данные), используя previous_interaction_id . Остальные параметры относятся к конкретному взаимодействию и применяются только к тому конкретному взаимодействию, которое вы сейчас генерируете:
-
tools -
system_instruction -
generation_config(включаяthinking_level,temperatureи т. д.)
Это означает, что вам необходимо повторно указывать эти параметры при каждом новом взаимодействии, если вы хотите, чтобы они применялись. Управление состоянием на стороне сервера является необязательным; вы также можете работать в режиме без сохранения состояния, отправляя полную историю разговора в каждом запросе.
Хранение и сохранение данных
По умолчанию API хранит все объекты Interaction ( store=true ), чтобы упростить использование функций управления состоянием на стороне сервера (с помощью previous_interaction_id ), фонового выполнения (с помощью background=true ) и целей мониторинга.
- Платный уровень : система сохраняет информацию о взаимодействиях в течение 55 дней .
- Бесплатный уровень : система сохраняет информацию о взаимодействиях в течение 1 дня .
Если вам это не нужно, вы можете установить store=false в своем запросе. Этот параметр управления отделен от управления состоянием; вы можете отказаться от хранения данных для любого взаимодействия. Однако обратите внимание, что store=false несовместим с background=true и предотвращает использование previous_interaction_id для последующих ходов.
Вы можете удалить сохраненные взаимодействия в любое время, используя метод удаления, описанный в справочнике API . Удалить взаимодействия можно только в том случае, если известен их идентификатор.
По истечении срока хранения ваши данные будут автоматически удалены.
Система обрабатывает объекты взаимодействия в соответствии с условиями .
Передовые методы
- Показатель попадания в кэш : Использование
previous_interaction_idдля продолжения диалога позволяет системе проще использовать неявное кэширование истории разговоров, что повышает производительность и снижает затраты. - Смешивание взаимодействий : У вас есть возможность комбинировать взаимодействия агентов и моделей в рамках диалога. Например, вы можете использовать специализированного агента, такого как агент Deep Research, для первоначального сбора данных, а затем использовать стандартную модель Gemini для последующих задач, таких как суммирование или переформатирование, связывая эти шаги с
previous_interaction_id.
Поддерживаемые модели и агенты
| Название модели | Тип | Идентификатор модели |
|---|---|---|
| Вспышка Gemini 3.5 | Модель | gemini-3.5-flash |
| Фонарик Gemini 3.1 | Модель | gemini-3.1-flash-lite |
| Предварительная версия Gemini 3.1 Flash-Lite | Модель | gemini-3.1-flash-lite-preview |
| Gemini 3.1 Pro Preview | Модель | gemini-3.1-pro-preview |
| Предварительный просмотр Gemini 3 Flash | Модель | gemini-3-flash-preview |
| Gemini 2.5 Pro | Модель | gemini-2.5-pro |
| Вспышка Gemini 2.5 | Модель | gemini-2.5-flash |
| Фонарь Gemini 2.5 | Модель | gemini-2.5-flash-lite |
| Предварительный просмотр клипа Lyria 3 | Модель | lyria-3-clip-preview |
| Предварительная версия Lyria 3 Pro | Модель | lyria-3-pro-preview |
| Предварительный обзор углубленного исследования | Агент | deep-research-pro-preview-12-2025 |
| Предварительный обзор углубленного исследования | Агент | deep-research-preview-04-2026 |
| Предварительный обзор углубленного исследования | Агент | deep-research-max-preview-04-2026 |
SDK
Для доступа к API взаимодействий можно использовать последнюю версию SDK Google GenAI.
- В Python это пакет
google-genai, начиная с версии1.55.0. - В JavaScript это пакет
@google/genai, начиная с версии1.33.0.
Более подробную информацию об установке SDK можно найти на странице «Библиотеки» .
Ограничения
- Статус бета-версии : API взаимодействий находится в стадии бета-тестирования/предварительного просмотра. Функции и схемы могут изменяться.
- Удалённый MCP : Gemini 3 не поддерживает удалённый MCP, эта функция появится в ближайшее время.
Следующие функции поддерживаются API generateContent , но пока недоступны в API Interactions:
- Метаданные видео : Поле
video_metadataиспользуется для установки интервалов обрезки и пользовательской частоты кадров для лучшего понимания видео. - Пакетный API
- Автоматический вызов функций (Python)
- Явное кэширование : Обратите внимание, что неявное кэширование на стороне сервера доступно в API взаимодействий через
previous_interaction_id.
Изменения, нарушающие покой
API для взаимодействия в настоящее время находится на ранней стадии бета-тестирования. Мы активно разрабатываем и совершенствуем возможности API, схемы ресурсов и интерфейсы SDK на основе реального использования и отзывов разработчиков. В результате возможны изменения, нарушающие обратную совместимость .
Существующие критические изменения:
- Схема шагов : Новый массив шагов заменяет массив выходных данных, обеспечивая структурированную временную шкалу каждого этапа взаимодействия.
Чтобы узнать о последних существенных изменениях и понять, как осуществить миграцию, см. руководство по миграции в связи с существенными изменениями (май 2026 г.) .
В числе других возможных обновлений могут быть изменения в схемах ввода и вывода, сигнатурах методов SDK и структурах объектов, а также в поведении отдельных функций.
Для рабочих нагрузок в производственной среде следует продолжать использовать стандартный API generateContent . Он остается рекомендуемым вариантом для стабильных развертываний, и мы будем продолжать активно его разрабатывать и поддерживать.
Обратная связь
Ваши отзывы крайне важны для разработки API взаимодействий. Делитесь своими мыслями, сообщайте об ошибках или предлагайте новые функции на нашем форуме сообщества разработчиков Google AI .
Что дальше?
- Попробуйте блокнот для быстрого запуска API взаимодействий .
- Узнайте о потоковой передаче интерактивных данных для обработки ответов в реальном времени.
- Узнайте больше об агенте Gemini Deep Research Agent .