Справочник API Gemini

В этом справочнике API описаны унарные, потоковые и API реального времени, которые вы можете использовать для взаимодействия с моделями Gemini. Вы можете использовать REST API в любой среде, поддерживающей HTTP-запросы. Инструкции по началу работы с первым вызовом API см. в руководстве «Начало работы». Если вам нужны справочные материалы по нашим библиотекам и SDK для конкретных языков программирования, перейдите по ссылке для соответствующего языка в левой панели навигации в разделе «Справочные материалы по SDK» .

Основные конечные точки

API Gemini построен вокруг следующих основных конечных точек:

  • Взаимодействия ( CreateInteraction ) (Рекомендуется): Рекомендуемый стандартный примитив для построения сценариев с помощью Gemini, оптимизированный для агентных рабочих процессов, управления состоянием на стороне сервера и сложных многомодальных многоэтапных диалогов.
  • Генерация стандартного контента ( generateContent ): стандартная REST-конечная точка, которая обрабатывает ваш запрос и возвращает полный ответ модели в одном пакете. Это лучше всего подходит для неинтерактивных задач, где вы можете дождаться полного результата.
  • Генерация потокового контента ( streamGenerateContent ): использует события, отправляемые сервером (SSE), для отправки вам фрагментов ответа по мере их генерации. Это обеспечивает более быструю и интерактивную работу для таких приложений, как чат-боты.
  • Live API ( BidiGenerateContent ): API на основе WebSocket с сохранением состояния для двусторонней потоковой передачи данных, разработанный для сценариев использования в режиме реального времени в диалоговых приложениях.
  • Пакетный режим ( batchGenerateContent ): стандартная REST-точка доступа для отправки пакетов запросов generateContent .
  • Встраивание текста ( embedContent ): стандартная REST-точка доступа, которая генерирует вектор встраивания текста из входного Content .
  • API для генерации медиаконтента: конечные точки для генерации медиафайлов с использованием наших специализированных моделей, таких как Imagen для генерации изображений и Veo для генерации видео . Gemini также имеет встроенные возможности, к которым вы можете получить доступ с помощью API generateContent .
  • API платформы: Вспомогательные конечные точки, поддерживающие основные возможности, такие как загрузка файлов и подсчет токенов .

Аутентификация

Все запросы к API Gemini должны включать заголовок x-goog-api-key с вашим API-ключом. Создайте его всего за несколько кликов в Google AI Studio .

Ниже приведён пример запроса, в заголовок которого включён API-ключ:

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "parts": [
          {
            "text": "Explain how AI works in a few words"
          }
        ]
      }
    ]
  }'

Инструкции по передаче ключа в API с помощью SDK Gemini см. в руководстве « Использование ключей API Gemini» .