Gemini 3.1 Flash 실시간 미리보기

Gemini 3.1 Flash Live Preview는 음향 뉘앙스 감지, 숫자 정밀도, 멀티모달 인식 기능을 갖춘 실시간 대화 및 음성 우선 AI 애플리케이션에 최적화된 짧은 지연 시간의 오디오-오디오 모델입니다.

문서

기능 및 기능에 관한 전체 내용은 Live API 가이드 를 참고하세요.

gemini-3.1-flash-live-preview

속성 설명
모델 코드 gemini-3.1-flash-live-preview
지원되는 데이터 유형

입력

텍스트, 이미지, 오디오, 동영상

출력

텍스트 및 오디오

토큰 한도[*]

입력 토큰 한도

131,072

출력 토큰 한도

65,536

기능

오디오 생성

지원됨

Batch API

지원되지 않음

캐싱

지원되지 않음

코드 실행

지원되지 않음

파일 검색

지원되지 않음

함수 호출

지원됨

Google 지도 그라운딩

지원되지 않음

이미지 생성

지원되지 않음

Live API

지원됨

검색 그라운딩

지원됨

구조화된 출력

지원되지 않음

사고

지원됨

URL 컨텍스트

지원되지 않음

버전
자세한 내용은 모델 버전 패턴을 참고하세요.
  • 미리보기: gemini-3.1-flash-live-preview
최근 업데이트 2026년 3월
지식 단절 2025년 1월

Gemini 2.5 Flash Live에서 마이그레이션

Gemini 3.1 Flash Live Preview는 짧은 지연 시간의 실시간 대화에 최적화되어 있습니다. gemini-2.5-flash-native-audio-preview-12-2025에서 마이그레이션할 때는 다음을 고려하세요.

  • 모델 문자열: 모델 문자열을 gemini-2.5-flash-native-audio-preview-12-2025에서 gemini-3.1-flash-live-preview로 업데이트합니다.
  • 사고 구성: Gemini 3.1은 thinkingBudget 대신 thinkingLevel (설정은 minimal, low, medium, high 등)을 사용합니다. 기본값은 지연 시간을 최소화하도록 최적화된 minimal입니다. 사고 수준 및 예산을 참고하세요.
  • 서버 이벤트: 이제 단일 BidiGenerateContentServerContent 이벤트에 여러 콘텐츠 부분 (예: 오디오 청크 및 트랜스크립트)이 동시에 포함될 수 있습니다. 콘텐츠가 누락되지 않도록 각 이벤트의 모든 부분을 처리하도록 코드를 업데이트합니다.
  • 클라이언트 콘텐츠: send_client_content는 초기 컨텍스트 기록 시드에만 지원됩니다 (initial_history_in_client_content에서 history_config 설정 필요). 대화 중에 텍스트 업데이트를 전송하려면 send_realtime_input을 사용하세요. 증분 콘텐츠 업데이트를 참고하세요 .
  • 턴 범위: TURN_INCLUDES_ONLY_ACTIVITY 대신 TURN_INCLUDES_AUDIO_ACTIVITY_AND_ALL_VIDEO가 기본값입니다. 이제 모델의 턴에 감지된 오디오 활동과 모든 동영상 프레임이 포함됩니다. 애플리케이션에서 현재 동영상 프레임의 지속적인 스트림을 전송하는 경우 추가 비용이 발생하지 않도록 오디오 활동이 있을 때만 동영상 프레임을 전송하도록 애플리케이션을 업데이트하는 것이 좋습니다.
  • 비동기 함수 호출: 아직 지원되지 않습니다. 함수 호출은 동기식으로만 가능합니다. 도구 응답을 전송할 때까지 모델이 응답을 시작하지 않습니다. 비동기 함수 호출을 참고하세요.
  • 능동적 오디오 및 공감형 대화: Gemini 3.1 Flash Live에서는 아직 지원되지 않습니다. 코드에서 이러한 기능의 구성을 삭제합니다. 능동적 오디오공감형 대화를 참고하세요.

자세한 기능 비교는 모델 비교표를 기능 가이드 에서 참고하세요.