Ten dokumentacja API opisuje interfejsy API typu unary, streaming i real-time, których możesz używać do interakcji z modelami Gemini. Interfejsów API REST możesz używać w dowolnym środowisku, które obsługuje żądania HTTP. Informacje o tym, jak wykonać pierwsze wywołanie interfejsu API, znajdziesz w przewodniku dla początkujących. Jeśli szukasz odniesień do naszych bibliotek i pakietów SDK dla poszczególnych języków, kliknij link do danego języka w menu po lewej stronie w sekcji Dokumentacja pakietu SDK.
Podstawowe punkty końcowe
Interfejs Gemini API jest zorganizowany wokół tych głównych punktów końcowych:
- Interakcje (
CreateInteraction) (zalecane): zalecany standardowy element podstawowy do tworzenia aplikacji z Gemini, zoptymalizowany pod kątem przepływów pracy opartych na agentach, zarządzania stanem po stronie serwera oraz złożonych rozmów wielomodowych i wieloetapowych. - Standardowe generowanie treści (
generateContent): standardowy punkt końcowy REST, który przetwarza Twoje żądanie i zwraca pełną odpowiedź modelu w jednym pakiecie. Ta opcja najlepiej sprawdza się w przypadku zadań nieinteraktywnych, w których możesz poczekać na cały wynik. - Generowanie treści strumieniowych (
streamGenerateContent): wykorzystuje zdarzenia wysyłane przez serwer (SSE), aby przesyłać do Ciebie fragmenty odpowiedzi w miarę ich generowania. Zapewnia to szybsze i bardziej interaktywne działanie aplikacji, takich jak chatboty. - Live API (
BidiGenerateContent): interfejs API oparty na protokole WebSocket z zachowywaniem stanu, przeznaczony do dwukierunkowego przesyłania strumieniowego i rozmów w czasie rzeczywistym. - Tryb wsadowy (
batchGenerateContent): standardowy punkt końcowy REST do przesyłania partii żądańgenerateContent. - Wektory dystrybucyjne (
embedContent): standardowy punkt końcowy REST, który generuje wektor dystrybucyjny tekstu na podstawie danych wejściowychContent. - Interfejsy Gen Media API: punkty końcowe do generowania multimediów za pomocą naszych specjalistycznych modeli, takich jak Imagen do generowania obrazów i Veo do generowania filmów.
Gemini ma też wbudowane te funkcje, do których możesz uzyskać dostęp za pomocą interfejsu
generateContentAPI. - Interfejsy API platformy: punkty końcowe narzędziowe, które obsługują podstawowe funkcje, takie jak przesyłanie plików i zliczanie tokenów.
Uwierzytelnianie
Wszystkie żądania wysyłane do interfejsu Gemini API muszą zawierać nagłówek x-goog-api-key z kluczem API. Utwórz go kilkoma kliknięciami w Google AI Studio.
Oto przykładowe żądanie z kluczem interfejsu API w nagłówku:
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
"contents": [
{
"parts": [
{
"text": "Explain how AI works in a few words"
}
]
}
]
}'
Instrukcje przekazywania klucza do interfejsu API za pomocą pakietów SDK Gemini znajdziesz w przewodniku Korzystanie z kluczy interfejsu Gemini API.