Interfejs Interactions API jest już ogólnie dostępny. Zalecamy korzystanie z tego interfejsu API, aby mieć dostęp do wszystkich najnowszych funkcji i modeli.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Interactions API

Interfejs Interactions API to najprostszy i najlepszy sposób na tworzenie aplikacji z wykorzystaniem modeli i agentów Gemini. Od czerwca 2026 r. jest on ogólnie dostępny i zalecany do wszystkich nowych projektów. Chociaż jest on teraz uważany za starszy, oryginalny generateContent API jest nadal w pełni obsługiwany.

Dlaczego warto korzystać z interfejsu Interactions API?

Uniwersalny interfejs dla wszystkich aplikacji: zaprojektowany jako standardowy interfejs dla każdego przypadku użycia, w tym generowania tekstu w jednej turze, multimodalnego rozumienia, uporządkowanych danych wyjściowych, koordynacji narzędzi i przepływów pracy agenta.
Pojedynczy interfejs API dla modeli i agentów: jeden ujednolicony punkt końcowy i wzorzec do bezpośredniego wywoływania standardowych modeli Gemini oraz wyspecjalizowanych agentów (takich jak Deep Research i niestandardowi agenci zarządzani).
Nowe możliwości od razu po wyjęciu z pudełka: funkcje takie jak opcjonalny stan rozmowy po stronie serwera za pomocą parametru previous_interaction_id, widoczne kroki wykonania do debugowania i renderowania interfejsu oraz wykonywanie w tle długotrwałych zadań za pomocą parametru background=true.
Niższe koszty dzięki wyższym współczynnikom trafień w pamięci podręcznej: w przypadku rozmów wieloetapowych opcjonalne zarządzanie stanem po stronie serwera umożliwia bardziej efektywne buforowanie kontekstu między turami, co zmniejsza koszty tokenów.
Miejsce, w którym wprowadzane są nowe funkcje: w przyszłości wszystkie nowe modele, funkcje multimodalne, narzędzia i funkcje agenta będą wprowadzane w interfejsie Interactions API.

Domyślnie interfejs Interactions API przechowuje żądania, dzięki czemu możesz korzystać z funkcji zarządzania stanem po stronie serwera za pomocą parametru previous_interaction_id. Możesz włączyć zachowanie bezstanowe, ustawiając parametr store=false. Więcej informacji znajdziesz w sekcji Przechowywanie danych szczegółów.

Rozpocznij

Skonfiguruj agenta kodowania: połącz się z Gemini Docs MCP i zainstaluj umiejętność gemini-interactions-api, aby zapewnić asystentowi bezpośredni dostęp do najnowszych dokumentów dla programistów i sprawdzonych metod. Konfigurowanie agenta kodowania →
Migracja z generateContent: jeśli masz już integrację, postępuj zgodnie z przewodnikiem migracji, aby przejść na interfejs Interactions API.
Pierwsze krości: zapoznaj się z przewodnikiem Pierwsze kroki z interfejsem Interactions API guide.

Przewodniki po funkcjach

W tych przewodnikach znajdziesz informacje o konkretnych możliwościach interfejsu Interactions API. Na tych stronach możesz użyć przełącznika, aby przełączać się między interfejsami generateContent i Interactions API:

Jak działa interfejs Interactions API

Interfejs Interactions API opiera się na podstawowym zasobie: Interaction. Interaction reprezentuje pełną turę w rozmowie lub zadaniu. Działa jako rekord sesji, który zawiera całą historię interakcji jako chronologiczną sekwencję kroków wykonania. Te kroki obejmują myśli modelu, wywołania narzędzi po stronie serwera lub klienta oraz wyniki (np. function_call i function_result) oraz końcowy model_output. Przechowywany zasób (pobierany za pomocą interactions.get) zawiera też kroki user_input dla pełnego kontekstu, ale odpowiedź interactions.create zwraca tylko kroki wygenerowane przez model.

Gdy wywołujesz interactions.create, tworzysz nowy zasób Interaction.

Zarządzanie stanem po stronie serwera

Aby kontynuować rozmowę, możesz użyć parametru previous_interaction_id w kolejnym wywołaniu, podając id zakończonej interakcji. Serwer używa tego identyfikatora do pobierania historii rozmowy, dzięki czemu nie musisz ponownie wysyłać całej historii czatu.

Parametr previous_interaction_id zachowuje tylko historię rozmowy (dane wejściowe i wyjściowe) za pomocą parametru previous_interaction_id. Pozostałe parametry są zakresowe i mają zastosowanie tylko do konkretnej interakcji, którą obecnie generujesz:

tools
system_instruction
generation_config (w tym thinking_level, temperature itp.)

Oznacza to, że jeśli chcesz, aby te parametry były stosowane, musisz je ponownie określić w każdej nowej interakcji. Zarządzanie stanem po stronie serwera jest opcjonalne. Możesz też działać w trybie bezstanowym, wysyłając pełną historię rozmowy w każdym żądaniu.

Przechowywanie danych

Domyślnie interfejs API przechowuje wszystkie obiekty Interaction (store=true), aby uprościć korzystanie z funkcji zarządzania stanem po stronie serwera (za pomocą previous_interaction_id), wykonywania w tle (za pomocą background=true) i obserwacji.

Poziom płatny: system przechowuje interakcje przez 55 dni.
Poziom bezpłatny: system przechowuje interakcje przez 1 dzień.

Jeśli nie chcesz tego robić, możesz ustawić parametr store=false w żądaniu. To ustawienie jest niezależne od zarządzania stanem. Możesz zrezygnować z przechowywania dowolnej interakcji. Pamiętaj jednak, że store=false jest niezgodny z wykonywaniem w tle i uniemożliwia używanie previous_interaction_id w kolejnych turach.

W przypadku projektów na poziomie płatnym możesz skonfigurować okres przechowywania w AI Studio aby automatycznie oznaczać logi do usunięcia z pamięci projektu po 7, 14, 28 lub 55 dniach. Krótszy okres przechowywania może wpłynąć na pobieranie wcześniejszych rozmów.

W każdej chwili możesz usunąć przechowywane interakcje za pomocą metody delete, która wymaga identyfikatora interakcji. W AI Studio możesz też wyświetlać logi przechowywanych interakcji i nimi zarządzać, w tym usuwać je z pamięci projektu, w AI Studio.

Po upływie okresu przechowywania Twoje dane zostaną automatycznie usunięte.

Obiekty Interactions są przetwarzane zgodnie z warunkami.

Wyświetlanie interakcji w AI Studio

Interfejs API przechowuje żądania Interactions API wykonane z parametrem store=true w przypadku projektów na poziomie płatnym. Możesz je wyświetlić bezpośrednio na stronie Logi w Google AI Studio. Więcej informacji znajdziesz w przewodniku po logach.

Sprawdzone metody

Współczynnik trafień w pamięci podręcznej: buforowanie niejawne jest obsługiwane w trybie stanowym i bezstanowym (patrz Szybki start). Używanie parametru previous_interaction_id (stanowego) do kontynuowania rozmów umożliwia systemowi łatwiejsze korzystanie z buforowania niejawnego w przypadku historii rozmowy, co zwiększa wydajność i obniża koszty.
Mieszanie interakcji: możesz dowolnie łączyć interakcje agenta i modelu w ramach rozmowy. Na przykład do wstępnego zbierania danych możesz użyć wyspecjalizowanego agenta, takiego jak agent Deep Research, a następnie użyć standardowego modelu Gemini do wykonywania kolejnych zadań, takich jak podsumowywanie lub formatowanie, łącząc te kroki za pomocą parametru previous_interaction_id.

Obsługiwane modele i agenci

Nazwa modelu	Typ	Identyfikator modelu
Gemini 3.5 Flash	Model	`gemini-3.5-flash`
Gemini 3.1 Pro (wersja testowa)	Model	`gemini-3.1-pro-preview`
Gemini 3.1 Flash-Lite	Model	`gemini-3.1-flash-lite`
Gemini 3 Flash (wersja testowa)	Model	`gemini-3-flash-preview`
Gemini 2.5 Pro	Model	`gemini-2.5-pro`
Gemini 2.5 Flash	Model	`gemini-2.5-flash`
Gemini 2.5 Flash-Lite	Model	`gemini-2.5-flash-lite`
Gemini 3 Pro Image	Model	`gemini-3-pro-image`
Gemini 3.1 Flash Image	Model	`gemini-3.1-flash-image`
Gemini 3.1 Flash TTS (wersja testowa)	Model	`gemini-3.1-flash-tts-preview`
Gemma 4 31B IT	Model	`gemma-4-31b-it`
Gemma 4 26B MoE IT	Model	`gemma-4-26b-a4b-it`
Lyria 3 Clip (wersja testowa)	Model	`lyria-3-clip-preview`
Lyria 3 Pro (wersja testowa)	Model	`lyria-3-pro-preview`
Deep Research (wersja testowa)	Agent	`deep-research-preview-04-2026`
Deep Research (wersja testowa)	Agent	`deep-research-max-preview-04-2026`
Antigravity (wersja testowa)	Agent	`antigravity-preview-05-2026`

Pakiety SDK

Aby uzyskać dostęp do interfejsu Interactions API, możesz użyć najnowszej wersji pakietów SDK Google GenAI.

W Pythonie jest to pakiet google-genai w wersji 2.3.0 lub nowszej.
W JavaScript jest to pakiet @google/genai w wersji 2.3.0 lub nowszej.

Więcej informacji o instalowaniu pakietów SDK znajdziesz na stronie Biblioteki.

Ograniczenia

Zdalny MCP: Gemini 3 nie obsługuje zdalnego MCP. Ta funkcja będzie dostępna wkrótce.
Zgodność modelu wieloetapowego: jeśli w rozmowie (stanowej lub bezstanowej) używasz różnych modeli, kolejne modele muszą obsługiwać dane wyjściowe poprzednich modeli jako dane wejściowe. Jeśli na przykład wygenerujesz obraz za pomocą modelu gemini-3.1-flash-image, nie możesz kontynuować tej rozmowy z modelem, który nie akceptuje danych wejściowych w postaci obrazu (np. z modelem tylko tekstowym lub modelem generowania muzyki, takim jak Lyria).

Te funkcje są obsługiwane przez interfejs generateContent API, ale nie są jeszcze dostępne w interfejsie Interactions API:

Metadane filmu: pole video_metadata służy do ustawiania interwałów przycinania i niestandardowych liczby klatek na sekundę w przypadku rozumienia filmów.
Interfejs Batch API
Automatyczne wywoływanie funkcji (Python)
Buforowanie jawne: pamiętaj, że buforowanie niejawne po stronie serwera jest dostępne w interfejsie Interactions API za pomocą parametru previous_interaction_id.
**Ustawienia bezpieczeństwa**: w interfejsie Interactions API nie są obsługiwane niestandardowe ustawienia bezpieczeństwa.

Prześlij opinię

Twoja opinia jest kluczowa dla rozwoju interfejsu Interactions API. Podziel się swoimi przemyśleniami, zgłoś błędy lub poproś o nowe funkcje na naszym Forum społeczności programistów Google AI.

Co dalej?

Wypróbuj notatnik szybkiego startu z interfejsem Interactions API.
Dowiedz się więcej o agencie Deep Research w Gemini.