Interfejs Interactions API
Interfejs Interactions API to nowy standardowy element do tworzenia aplikacji z Gemini, zalecany w przypadku wszystkich nowych projektów. Jest zoptymalizowany pod kątem przepływów pracy z agentami, zarządzania stanem po stronie serwera oraz złożonych rozmów wielomodowych i wieloetapowych. Oryginalny generateContent API jest nadal w pełni obsługiwany.
Dlaczego warto używać interfejsu Interactions API?
- Zarządzanie historią po stronie serwera: uproszczone przepływy wieloetapowe dzięki parametrowi
previous_interaction_id. Serwer domyślnie włącza stan (store=true), ale możesz włączyć zachowanie bezstanowe, ustawiającstore=false. - Obserwowalne kroki wykonania: kroki z określonym typem ułatwiają debugowanie złożonych przepływów i renderowanie interfejsu użytkownika na potrzeby zdarzeń pośrednich (takich jak przemyślenia czy widżety wyszukiwania).
- Stworzony z myślą o przepływach pracy agentowych: natywna obsługa wieloetapowego korzystania z narzędzi, koordynacji i złożonych przepływów rozumowania dzięki krokom wykonania z określonym typem.
- Długotrwałe zadania i zadania w tle: obsługa przenoszenia czasochłonnych operacji, takich jak Deep Think i Deep Research, do procesów w tle za pomocą parametru
background=true. - Dostęp do nowych modeli i funkcji: w przyszłości nowe modele wykraczające poza podstawową rodzinę modeli, a także nowe funkcje i narzędzia agentów będą dostępne wyłącznie w interfejsie Interactions API.
Użyj interfejsu Interactions API, jeśli rozpoczynasz nowy projekt, tworzysz aplikacje z agentami lub potrzebujesz zarządzania rozmowami po stronie serwera. Użyj generateContent , jeśli masz już integrację, która spełnia Twoje potrzeby, lub jeśli potrzebujesz funkcji, która nie jest jeszcze dostępna w interfejsie Interactions API, np. interfejsu Batch API lub jawnego buforowania.
Rozpocznij
- Skonfiguruj agenta kodowania: połącz się z Gemini Docs MCP i zainstaluj
umiejętność
gemini-interactions-api, aby zapewnić Asystentowi bezpośredni dostęp do najnowszej dokumentacji dla programistów i sprawdzonych metod. Konfigurowanie agenta kodowania → - Migracja z
generateContent: jeśli masz już integrację, postępuj zgodnie z przewodnikiem po migracji, aby przejść na interfejs Interactions API. - Wypróbuj krótkie wprowadzenie: zacznij od minimalnego działającego przykładu w krótkim wprowadzeniu do interfejsu Interactions API.
Przewodniki po funkcjach
W tych przewodnikach znajdziesz informacje o konkretnych funkcjach interfejsu Interactions API. Za pomocą przełącznika na tych stronach możesz przełączać się między interfejsami generateContent i Interactions API:
- Generowanie tekstu
- Generowanie obrazów
- Rozpoznawanie obrazów
- Rozpoznawanie dźwięku
- Rozpoznawanie filmów
- Przetwarzanie dokumentów
- Wywoływanie funkcji
- Uporządkowane dane wyjściowe
- Agent Deep Research
- Wnioskowanie Flex
- Wnioskowanie priorytetowe
Jak działa interfejs Interactions API
Interfejs Interactions API opiera się na podstawowym zasobie: Interaction. Interaction reprezentuje pełny etap rozmowy lub zadania. Działa jako rekord sesji, który zawiera całą historię interakcji jako chronologiczną sekwencję kroków wykonania. Te kroki obejmują przemyślenia modelu, wywołania narzędzi po stronie serwera lub po stronie klienta oraz wyniki (np. function_call i function_result) oraz końcowy model_output. Przechowywany zasób (pobierany za pomocą interactions.get) zawiera też kroki user_input w celu uzyskania pełnego kontekstu, chociaż odpowiedź interactions.create zwraca tylko kroki wygenerowane przez model.
Gdy wywołujesz
interactions.create, tworzysz nowy zasób Interaction.
Zarządzanie stanem po stronie serwera
Aby kontynuować rozmowę, możesz użyć parametru
previous_interaction_id w kolejnym wywołaniu, podając id zakończonej interakcji. Serwer używa tego identyfikatora do pobierania historii rozmowy, dzięki czemu nie musisz ponownie wysyłać całej historii czatu.
Parametr previous_interaction_id zachowuje tylko historię rozmowy (dane wejściowe i wyjściowe) za pomocą parametru previous_interaction_id. Pozostałe parametry są zakresowe i mają zastosowanie tylko do konkretnej interakcji, którą obecnie generujesz:
toolssystem_instructiongeneration_config(w tymthinking_level,temperatureitp.)
Oznacza to, że jeśli chcesz, aby te parametry były stosowane, musisz je ponownie określić w każdej nowej interakcji. Zarządzanie stanem po stronie serwera jest opcjonalne. Możesz też działać w trybie bezstanowym, wysyłając pełną historię rozmowy w każdym żądaniu.
Przechowywanie i przechowywanie danych
Domyślnie interfejs API przechowuje wszystkie obiekty Interaction (store=true), aby uprościć korzystanie z funkcji zarządzania stanem po stronie serwera (za pomocą parametru previous_interaction_id), wykonywania w tle (za pomocą parametru background=true) i obserwacji.
- Płatny poziom: system przechowuje interakcje przez 55 dni.
- Poziom bezpłatny: system przechowuje interakcje przez 1 dzień.
Jeśli nie chcesz tego robić, możesz ustawić store=false w żądaniu. To ustawienie jest niezależne od zarządzania stanem. Możesz zrezygnować z przechowywania dowolnej interakcji. Pamiętaj jednak, że store=false jest niezgodne z background=true i uniemożliwia używanie previous_interaction_id w kolejnych etapach.
Przechowywane interakcje możesz w każdej chwili usunąć za pomocą metody delete, którą znajdziesz w dokumentacji interfejsu API. Interakcje możesz usuwać tylko wtedy, gdy znasz ich identyfikator.
Po upływie okresu przechowywania dane zostaną automatycznie usunięte.
System przetwarza obiekty Interaction zgodnie z warunkami.
Sprawdzone metody
- Współczynnik trafień w pamięci podręcznej: używanie parametru
previous_interaction_iddo kontynuowania rozmów umożliwia systemowi łatwiejsze korzystanie z niejawnego buforowania historii rozmów, co zwiększa wydajność i zmniejsza koszty. - Łączenie interli: możesz dowolnie łączyć interakcje agenta i
modelu w ramach rozmowy. Na przykład do wstępnego zbierania danych możesz użyć wyspecjalizowanego agenta, takiego jak agent Deep Research, a następnie użyć standardowego modelu Gemini do wykonywania kolejnych zadań, takich jak podsumowywanie lub formatowanie, łącząc te kroki za pomocą parametru
previous_interaction_id.
Obsługiwane modele i agenci
| Nazwa modelu | Typ | Identyfikator modelu |
|---|---|---|
| Gemini 3.1 Flash-Lite | Model | gemini-3.1-flash-lite |
| Gemini 3.1 Flash-Lite (wersja testowa) | Model | gemini-3.1-flash-lite-preview |
| Gemini 3.1 Pro (wersja testowa) | Model | gemini-3.1-pro-preview |
| Gemini 3 Flash (wersja testowa) | Model | gemini-3-flash-preview |
| Gemini 2.5 Pro | Model | gemini-2.5-pro |
| Gemini 2.5 Flash | Model | gemini-2.5-flash |
| Gemini 2.5 Flash-lite | Model | gemini-2.5-flash-lite |
| Lyria 3 Clip (wersja testowa) | Model | lyria-3-clip-preview |
| Lyria 3 Pro (wersja testowa) | Model | lyria-3-pro-preview |
| Deep Research (wersja testowa) | Agent | deep-research-pro-preview-12-2025 |
| Deep Research (wersja testowa) | Agent | deep-research-preview-04-2026 |
| Deep Research (wersja testowa) | Agent | deep-research-max-preview-04-2026 |
Pakiety SDK
Aby uzyskać dostęp do interfejsu Interactions API, możesz użyć najnowszej wersji pakietów Google GenAI SDK.
- W Pythonie jest to pakiet
google-genaiw wersji1.55.0lub nowszej. - W JavaScript jest to pakiet
@google/genaiw wersji1.33.0lub nowszej.
Więcej informacji o instalowaniu pakietów SDK znajdziesz na stronie Biblioteki.
Ograniczenia
- Stan wersji beta: interfejs Interactions API jest w wersji beta lub testowej. Funkcje i schematy mogą ulec zmianie.
- Zdalny MCP: Gemini 3 nie obsługuje zdalnego MCP. Ta funkcja będzie dostępna wkrótce.
Te funkcje są obsługiwane przez interfejs
generateContent API, ale nie są jeszcze
dostępne w interfejsie Interactions API:
- Metadane filmu: pole
video_metadatasłuży do ustawiania interwałów przycinania i niestandardowych klatek na sekundę na potrzeby rozpoznawania filmów. - Batch API
- Automatyczne wywoływanie funkcji (Python)
- Jawne buforowanie: pamiętaj, że niejawne buforowanie po stronie serwera jest dostępne w interfejsie Interactions API
za pomocą parametru
previous_interaction_id.
Zmiany powodujące niezgodność
Interfejs Interactions API jest obecnie w fazie wczesnych testów beta. Aktywnie rozwijamy i udoskonalamy funkcje interfejsu API, schematy zasobów i interfejsy pakietu SDK na podstawie rzeczywistego użytkowania i opinii programistów. W związku z tym mogą wystąpić zmiany powodujące niezgodność.
Obecne zmiany powodujące niezgodność:
- Schemat kroków: nowa tablica kroków zastępuje tablicę danych wyjściowych, zapewniając uporządkowaną oś czasu każdego etapu interakcji.
Aby dowiedzieć się więcej o najnowszej zmianie powodującej niezgodność i o tym, jak przeprowadzić migrację, zapoznaj się z przewodnikiem po migracji zmian powodujących niezgodność (maj 2026 r.).
Inne potencjalne aktualizacje mogą obejmować zmiany w schematach danych wejściowych i wyjściowych, sygnaturach metod pakietu SDK i strukturach obiektów oraz w zachowaniu określonych funkcji.
W przypadku zadań produkcyjnych nadal używaj standardowego
generateContent interfejsu API. Pozostaje on zalecanym sposobem stabilnego wdrażania, a my będziemy go aktywnie rozwijać i utrzymywać.
Prześlij opinię
Twoja opinia jest kluczowa dla rozwoju interfejsu Interactions API. Podziel się swoimi przemyśleniami, zgłoś błędy lub poproś o nowe funkcje na naszym forum społeczności programistów Google AI.
Co dalej?
- Wypróbuj notatnik z krótkim wprowadzeniem do interfejsu Interactions API.
- Dowiedz się więcej o agencie Deep Research w Gemini.