이제 Interactions API가 정식 버전으로 출시되었습니다. 이 API를 사용하여 모든 최신 기능과 모델에 액세스하는 것이 좋습니다.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

모델

Gemini 3

정식

Gemini 3.5 Flash

에이전트형 작업 및 코딩 작업에서 지속적인 최첨단 성능을 제공하는 가장 지능적인 모델입니다.

정식

Gemini 3.1 Flash-Lite

대규모 모델에 필적하는 최첨단 성능을 훨씬 저렴한 비용으로 제공합니다.

정식

Nano Banana 2

속도와 대용량 사용 사례에 최적화된 강력하고 효율적인 이미지 생성 및 편집 기능입니다.

정식

Nano Banana 2 Lite

대용량 대화형 사용 사례를 위해 설계된 지연 시간이 매우 짧고 비용 효율적인 이미지 생성 및 편집 기능입니다.

정식

Nano Banana Pro

컨텍스트가 풍부한 네이티브 이미지 생성을 위한 최첨단 이미지 생성 및 편집 모델입니다.

정식

미리보기

Gemini 3.1 Pro

고급 인텔리전스, 복잡한 문제 해결 기술, 강력한 에이전트형 및 바이브 코딩 기능입니다.

미리보기

Gemini 3 Flash

대규모 모델에 필적하는 최첨단 성능을 훨씬 저렴한 비용으로 제공합니다.

미리보기

Gemini 3.5 Live Translate

70개 이상의 언어를 지원하는 지연 시간이 짧은 실시간 음성 번역 모델입니다.

새로운 미리보기

Gemini 3.1 Flash Live

실시간 대화 및 음성 우선 AI 애플리케이션을 위한 지연 시간이 짧은 고품질 Live API 모델입니다.

새로운 미리보기

Gemini 3.1 Flash TTS

강력하고 지연 시간이 짧은 음성 생성 기능입니다.

새로운 미리보기

Gemini Omni Flash

빠른 대화형 동영상 생성 및 편집 기능입니다. 텍스트와 이미지를 동영상으로 변환하고 자연어를 통해 결과를 개선합니다.

새로운 미리보기

Gemini 2.5 Flash

추론이 필요한 지연 시간이 짧은 대용량 작업을 위한 최고의 가격 대비 성능 모델입니다.

Nano Banana

빠른 창작 워크플로를 위해 설계된 최첨단 네이티브 이미지 생성 및 편집 기능입니다.

Gemini 2.5 Flash Live Preview

1초 미만의 네이티브 오디오 스트리밍을 지원하는 실시간 대화형 에이전트에 최적화되어 있습니다.

Gemini 2.5 Flash TTS 프리뷰

스타일과 속도를 세밀하게 제어할 수 있는 제어 가능한 텍스트 음성 변환 오디오 생성 기능입니다.

Gemini 2.5 Flash-Lite

2.5 제품군에서 가장 빠르고 예산 친화적인 멀티모달 모델입니다.

Gemini 2.5 Pro

심층 추론 및 코딩 기능을 갖춘 복잡한 작업을 위한 최첨단 모델입니다.

Gemini 2.5 Pro TTS 프리뷰

팟캐스트 및 오디오북과 같은 구조화된 워크플로에서 품질에 최적화된 충실도 높은 음성 합성 기능입니다.

오디오 모델

이 섹션에는 다른 섹션에 이미 나열되어 있을 수 있는 모델을 포함한 모든 오디오 모델이 포함되어 있습니다.

Gemini 3.1 Flash Live Preview

실시간 대화 및 음성 우선 AI 애플리케이션을 위해 설계된 지연 시간이 짧은 고품질 오디오-오디오 (A2A) 모델입니다.

Gemini 3.1 Flash TTS 프리뷰

자연스러운 출력, 조작 가능한 프롬프트, 정확한 내레이션 제어를 위한 새로운 표현 오디오 태그를 갖춘 강력하고 지연 시간이 짧은 음성 생성 기능입니다.

Gemini 2.5 Flash Live Preview

네이티브 오디오 추론을 지원하는 지연 시간이 짧은 양방향 음성 및 동영상 에이전트를 위한 Google의 대표적인 Live API 모델입니다.

Gemini 2.5 Flash TTS 프리뷰

지연 시간이 짧고 비용 효율적인 애플리케이션과 실시간 어시스턴트를 위한 빠르고 제어 가능한 텍스트 음성 변환 기능입니다.

Gemini 2.5 Pro TTS 프리뷰

팟캐스트 및 오디오북과 같은 구조화된 워크플로에서 품질에 최적화된 충실도 높은 음성 합성 기능입니다.

생성형 미디어 모델

이 섹션에는 다른 섹션에 이미 나열되어 있을 수 있는 모델을 포함한 모든 생성형 미디어 모델이 포함되어 있습니다.

Nano Banana 2

Gemini 3 시리즈의 인텔리전스와 빠른 생성 속도를 결합한 효율적인 프로덕션 규모의 시각적 요소 생성 기능입니다.

Nano Banana 2 Lite

이미지 생성 제품군의 효율성 전문가로 설계되어 지연 시간이 매우 짧고 비용 효율적인 이미지 생성 및 편집 기능을 제공합니다.

Veo 3.1 프리뷰

고급 창작 제어 및 네이티브로 동기화된 오디오를 갖춘 최첨단 시네마틱 동영상 생성 기능입니다.

Nano Banana Pro

스튜디오 품질의 4K 시각적 요소, 복잡한 레이아웃, 정확한 텍스트 렌더링을 위한 추론 코어를 갖춘 전문 디자인 엔진입니다.

Veo 3.1 Lite 프리뷰

Veo 3.1 제품군의 효율적이고 저렴한 개발자 우선 동영상 생성, 편집, 시네마틱 제어 기능입니다.

Gemini Omni Flash 프리뷰

빠른 대화형 동영상 생성 및 편집 기능입니다. 텍스트와 이미지를 동영상으로 변환하고 자연어를 통해 결과를 개선합니다.

Nano Banana

빠른 창작 워크플로를 위해 설계된 최첨단 네이티브 이미지 생성 및 편집 기능입니다.

Imagen 4 지원 중단됨

빠르고 매우 빠른 생성과 최대 2K 해상도의 탁월한 선명도를 갖춘 텍스트 이미지 변환 모델입니다.

음악 생성 모델

이 섹션에는 다른 섹션에 이미 나열되어 있을 수 있는 모델을 포함한 모든 음악 생성 모델이 포함되어 있습니다.

Lyria 3 Pro 프리뷰

복잡한 구조적 일관성을 갖춘 전체 길이의 노래에 최적화된 Google의 대표적인 음악 생성 모델입니다.

Lyria 3 Clip 프리뷰

최대 30초 길이의 짧은 음악 클립, 루프, 프리뷰를 생성하는 데 최적화되어 있습니다.

Lyria RealTime 실험용

세분화된 창작 제어 및 실시간 스트리밍 기능을 제공하는 충실도 높은 음악 생성 모델입니다.

도구 및 에이전트 모델

컴퓨터 사용 프리뷰

디지털 화면을 '볼' 수 있고 클릭, 입력, 탐색과 같은 UI 작업을 실행하여 복잡한 브라우저 작업을 자동화할 수 있는 특화 모델입니다.

Gemini Deep Research 프리뷰

수백 개의 소스에서 다단계 조사를 자율적으로 계획하고 실행하여 출처가 표시된 대화형 보고서를 생성하는 에이전트형 모델입니다.

Gemini Deep Research Max 프리뷰

수백 개의 소스에서 자동화된 컨텍스트 수집 및 종합을 위한 최대 포괄성입니다.

Antigravity 에이전트 프리뷰

안전하고 격리된 Linux 샌드박스 내에서 자율적으로 계획, 추론, 코드 실행, 파일 관리, 웹 탐색을 수행하는 범용 관리형 에이전트입니다.

특화 작업 모델

Gemini Embedding 2

고급 시맨틱 검색 및 RAG 시스템을 위해 텍스트, 이미지, 동영상, 오디오, PDF를 통합 임베딩 공간에 매핑하는 Google의 첫 번째 멀티모달 임베딩 모델입니다.

Gemini Embedding

고급 시맨틱 검색, 텍스트 분류, RAG 시스템을 위한 고차원 벡터 표현입니다.

Gemini Robotics-ER 1.6프리뷰

기기 읽기, 향상된 공간 및 물리적 추론과 같은 새로운 기능을 갖춘 로봇 에이전트를 위해 물리적 공간을 이해하고 다단계 작업을 계획하는 고급 구현 추론 모델입니다.

이전 모델

Gemini 2.0 Flash 종료

빠른 속도, 네이티브 도구 사용, 토큰 컨텍스트 윈도우 100만 개 등 차세대 기능과 향상된 기능을 갖춘 Google의 2세대 워크호스 모델입니다.

Gemini 2.0 Flash-Lite 종료

비용 효율성과 짧은 지연 시간에 최적화된 Google의 가장 빠른 2세대 모델입니다.

Gemini 3.1 Flash-Lite 프리뷰 종료

고빈도 경량 작업을 위한 가장 빠른 성능을 제공하는 Google의 가장 비용 효율적인 멀티모달 모델입니다.

Gemini 3 Pro 프리뷰 종료

고급 멀티모달 이해를 갖춘 Google의 최첨단 추론 모델입니다.

모델 버전 이름 패턴

Gemini 모델은 정식, 미리보기, 최신 또는 실험용 버전으로 제공됩니다.

정식

특정 정식 모델을 가리킵니다. 정식 모델은 일반적으로 변경되지 않습니다. 대부분의 프로덕션 앱은 특정 정식 모델을 사용해야 합니다.

예: gemini-3.5-flash

미리보기

프로덕션에 사용할 수 있는 미리보기 모델을 가리킵니다. 미리보기 모델은 일반적으로 결제가 사용 설정되어 있으며, 더 제한적인 비율 제한이 적용될 수 있고, 최소 2주 전에 지원 중단될 수 있습니다.

예: gemini-2.5-flash-preview-09-2025

실험용

일반적으로 프로덕션 용도에 적합하지 않으며 더 제한적인 비율 제한이 적용되는 실험용 모델을 가리킵니다. Google은 의견을 수집하고 최신 업데이트를 개발자에게 빠르게 제공하기 위해 실험용 모델을 출시합니다.

실험용 모델은 안정적이지 않으며 모델 엔드포인트의 가용성은 변경될 수 있습니다.

모델 지원 중단

모델 지원 중단에 대한 자세한 내용은 Gemini 지원 중단 페이지를 참고하세요.