Dokumentacja Gemini API

Ten dokumentacja API opisuje interfejsy API typu unary, streaming i real-time, których możesz używać do interakcji z modelami Gemini. Interfejsów API REST możesz używać w dowolnym środowisku, które obsługuje żądania HTTP. Informacje o tym, jak wykonać pierwsze wywołanie interfejsu API, znajdziesz w przewodniku dla początkujących. Jeśli szukasz odniesień do naszych bibliotek i pakietów SDK dla poszczególnych języków, kliknij link do danego języka w menu po lewej stronie w sekcji Dokumentacja pakietu SDK.

Podstawowe punkty końcowe

Interfejs Gemini API jest zorganizowany wokół tych głównych punktów końcowych:

  • Interakcje (CreateInteraction) (zalecane): zalecany standardowy element podstawowy do tworzenia aplikacji z Gemini, zoptymalizowany pod kątem przepływów pracy opartych na agentach, zarządzania stanem po stronie serwera oraz złożonych rozmów wielomodowych i wieloetapowych.
  • Standardowe generowanie treści (generateContent): standardowy punkt końcowy REST, który przetwarza Twoje żądanie i zwraca pełną odpowiedź modelu w jednym pakiecie. Ta opcja najlepiej sprawdza się w przypadku zadań nieinteraktywnych, w których możesz poczekać na cały wynik.
  • Generowanie treści strumieniowych (streamGenerateContent): wykorzystuje zdarzenia wysyłane przez serwer (SSE), aby przesyłać do Ciebie fragmenty odpowiedzi w miarę ich generowania. Zapewnia to szybsze i bardziej interaktywne działanie aplikacji, takich jak chatboty.
  • Live API (BidiGenerateContent): interfejs API oparty na protokole WebSocket z zachowywaniem stanu, przeznaczony do dwukierunkowego przesyłania strumieniowego i rozmów w czasie rzeczywistym.
  • Tryb wsadowy (batchGenerateContent): standardowy punkt końcowy REST do przesyłania partii żądań generateContent.
  • Wektory dystrybucyjne (embedContent): standardowy punkt końcowy REST, który generuje wektor dystrybucyjny tekstu na podstawie danych wejściowych Content.
  • Interfejsy Gen Media API: punkty końcowe do generowania multimediów za pomocą naszych specjalistycznych modeli, takich jak Imagen do generowania obrazówVeo do generowania filmów. Gemini ma też wbudowane te funkcje, do których możesz uzyskać dostęp za pomocą interfejsu generateContentAPI.
  • Interfejsy API platformy: punkty końcowe narzędziowe, które obsługują podstawowe funkcje, takie jak przesyłanie plikówzliczanie tokenów.

Uwierzytelnianie

Wszystkie żądania wysyłane do interfejsu Gemini API muszą zawierać nagłówek x-goog-api-key z kluczem API. Utwórz go kilkoma kliknięciami w Google AI Studio.

Oto przykładowe żądanie z kluczem interfejsu API w nagłówku:

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "parts": [
          {
            "text": "Explain how AI works in a few words"
          }
        ]
      }
    ]
  }'

Instrukcje przekazywania klucza do interfejsu API za pomocą pakietów SDK Gemini znajdziesz w przewodniku Korzystanie z kluczy interfejsu Gemini API.