В Live API сессия представляет собой постоянное соединение, в котором входные и выходные данные непрерывно передаются по одному и тому же соединению (подробнее о том, как это работает, читайте здесь). Такая уникальная структура сессий обеспечивает низкую задержку и поддерживает уникальные функции, но также может создавать проблемы, такие как ограничения по времени сессии и преждевременное завершение. В этом руководстве описаны стратегии преодоления проблем управления сессиями, которые могут возникнуть при использовании Live API.
Срок действия сессии
Без сжатия продолжительность аудиосессий ограничена 15 минутами, а аудио-видеосессий — 2 минутами. Превышение этих лимитов приведет к завершению сессии (и, следовательно, к разрыву соединения), но вы можете использовать контекстное оконное сжатие , чтобы продлить сессию до неограниченного времени.
Время жизни соединения также ограничено примерно 10 минутами. При разрыве соединения сессия также завершается. В этом случае вы можете настроить одну сессию так, чтобы она оставалась активной при нескольких соединениях, используя функцию возобновления сессии . Вы также получите сообщение GoAway перед завершением соединения, что позволит вам предпринять дальнейшие действия.
Сжатие контекстного окна
Чтобы обеспечить более длительные сеансы и избежать внезапного разрыва соединения, вы можете включить сжатие контекстного окна, установив поле contextWindowCompression в конфигурации сеанса.
В параметре ContextWindowCompressionConfig можно настроить механизм скользящего окна и количество токенов , запускающих сжатие.
Python
from google.genai import types
config = types.LiveConnectConfig(
response_modalities=["AUDIO"],
context_window_compression=(
# Configures compression with default parameters.
types.ContextWindowCompressionConfig(
sliding_window=types.SlidingWindow(),
)
),
)
JavaScript
const config = {
responseModalities: [Modality.AUDIO],
contextWindowCompression: { slidingWindow: {} }
};
Возобновление сессии
Чтобы предотвратить разрыв сессии при периодическом сбросе WebSocket-соединения сервером, настройте поле sessionResumption в конфигурации .
Передача этой конфигурации приводит к тому, что сервер отправляет сообщения SessionResumptionUpdate , которые можно использовать для возобновления сессии, передав последний токен возобновления в качестве SessionResumptionConfig.handle последующего соединения.
Токены для возобновления сеанса действительны в течение 2 часов после завершения последнего сеанса.
Python
import asyncio
from google import genai
from google.genai import types
client = genai.Client()
model = "gemini-3.1-flash-live-preview"
async def main():
print(f"Connecting to the service with handle {previous_session_handle}...")
async with client.aio.live.connect(
model=model,
config=types.LiveConnectConfig(
response_modalities=["AUDIO"],
session_resumption=types.SessionResumptionConfig(
# The handle of the session to resume is passed here,
# or else None to start a new session.
handle=previous_session_handle
),
),
) as session:
while True:
await session.send_client_content(
turns=types.Content(
role="user", parts=[types.Part(text="Hello world!")]
)
)
async for message in session.receive():
# Periodically, the server will send update messages that may
# contain a handle for the current state of the session.
if message.session_resumption_update:
update = message.session_resumption_update
if update.resumable and update.new_handle:
# The handle should be retained and linked to the session.
return update.new_handle
# For the purposes of this example, placeholder input is continually fed
# to the model. In non-sample code, the model inputs would come from
# the user.
if message.server_content and message.server_content.turn_complete:
break
if __name__ == "__main__":
asyncio.run(main())
JavaScript
import { GoogleGenAI, Modality } from '@google/genai';
const ai = new GoogleGenAI({});
const model = 'gemini-3.1-flash-live-preview';
async function live() {
const responseQueue = [];
async function waitMessage() {
let done = false;
let message = undefined;
while (!done) {
message = responseQueue.shift();
if (message) {
done = true;
} else {
await new Promise((resolve) => setTimeout(resolve, 100));
}
}
return message;
}
async function handleTurn() {
const turns = [];
let done = false;
while (!done) {
const message = await waitMessage();
turns.push(message);
if (message.serverContent && message.serverContent.turnComplete) {
done = true;
}
}
return turns;
}
console.debug('Connecting to the service with handle %s...', previousSessionHandle)
const session = await ai.live.connect({
model: model,
callbacks: {
onopen: function () {
console.debug('Opened');
},
onmessage: function (message) {
responseQueue.push(message);
},
onerror: function (e) {
console.debug('Error:', e.message);
},
onclose: function (e) {
console.debug('Close:', e.reason);
},
},
config: {
responseModalities: [Modality.AUDIO],
sessionResumption: { handle: previousSessionHandle }
// The handle of the session to resume is passed here, or else null to start a new session.
}
});
const inputTurns = 'Hello how are you?';
session.sendClientContent({ turns: inputTurns });
const turns = await handleTurn();
for (const turn of turns) {
if (turn.sessionResumptionUpdate) {
if (turn.sessionResumptionUpdate.resumable && turn.sessionResumptionUpdate.newHandle) {
let newHandle = turn.sessionResumptionUpdate.newHandle
// ...Store newHandle and start new session with this handle here
}
}
}
session.close();
}
async function main() {
await live().catch((e) => console.error('got error', e));
}
main();
Получение сообщения до разрыва сессии приводит к её завершению.
Сервер отправляет сообщение GoAway , сигнализирующее о скором разрыве текущего соединения. Это сообщение содержит значение timeLeft , указывающее оставшееся время, и позволяет предпринять дальнейшие действия до того, как соединение будет разорвано с ошибкой ABORTED.
Python
async for response in session.receive():
if response.go_away is not None:
# The connection will soon be terminated
print(response.go_away.time_left)
JavaScript
const turns = await handleTurn();
for (const turn of turns) {
if (turn.goAway) {
console.debug('Time left: %s\n', turn.goAway.timeLeft);
}
}
Получение сообщения по завершении генерации.
Сервер отправляет сообщение generationComplete , сигнализирующее о завершении генерации ответа моделью.
Python
async for response in session.receive():
if response.server_content.generation_complete is True:
# The generation is complete
JavaScript
const turns = await handleTurn();
for (const turn of turns) {
if (turn.serverContent && turn.serverContent.generationComplete) {
// The generation is complete
}
}
Что дальше?
Узнайте больше о способах работы с Live API в полном руководстве по возможностям , на странице использования инструментов или в руководстве по Live API .