이제 Google 검색을 통한 그라운딩 기능을 사용할 수 있습니다. 자세히 알아보기

이 페이지는 Cloud Translation API를 통해 번역되었습니다.

Gemini 모델

1.5 Flash

대부분의 작업에 뛰어난 성능을 제공하는 가장 균형 잡힌 멀티모달 모델

오디오, 이미지, 동영상, 텍스트를 입력하고 텍스트 응답을 가져옵니다.
코드 생성, 데이터 추출, 텍스트 수정 등
성능과 비용의 균형을 맞추는 작업에 적합

1.5 Flash-8B

빈번한 작업에 적합한 우수한 성능을 갖춘 가장 빠르고 비용 효율적인 멀티모달 모델

오디오, 이미지, 동영상, 텍스트를 입력하고 텍스트 응답을 가져옵니다.
코드 생성, 데이터 추출, 텍스트 수정 등
인텔리전스가 낮고 빈도가 높은 작업에 적합합니다.

1.5 Pro

다양한 추론 작업을 위한 기능을 갖춘 최고 성능의 멀티모달 모델

오디오, 이미지, 동영상, 텍스트를 입력하고 텍스트 응답을 가져옵니다.
코드 생성, 데이터 추출, 텍스트 수정 등
실적을 개선해야 하는 경우

모델 변형

Gemini API는 특정 사용 사례에 최적화된 다양한 모델을 제공합니다. 다음은 사용 가능한 Gemini 변형에 대한 간략한 개요입니다.

모델 변형	입력	출력	최적화 목표
Gemini 1.5 Flash `gemini-1.5-flash`	오디오, 이미지, 동영상, 텍스트	텍스트	다양한 작업에서 빠르고 다재다능한 성능
Gemini 1.5 Flash-8B `gemini-1.5-flash-8b`	오디오, 이미지, 동영상, 텍스트	텍스트	대용량 및 낮은 인텔리전스 태스크
Gemini 1.5 Pro `gemini-1.5-pro`	오디오, 이미지, 동영상, 텍스트	텍스트	더 많은 지능이 필요한 복잡한 추론 작업
Gemini 1.0 Pro (2025년 2월 15일에 지원 중단됨) `gemini-1.0-pro`	텍스트	텍스트	자연어 태스크, 멀티턴 텍스트 및 코드 채팅, 코드 생성
텍스트 임베딩 `text-embedding-004`	텍스트	텍스트 임베딩	텍스트 문자열의 관련성 측정
AQA `aqa`	텍스트	텍스트	질문에 대한 출처 기반 답변 제공

Gemini 1.5 Flash

Gemini 1.5 Flash는 다양한 작업에 걸쳐 확장할 수 있는 빠르고 다목적 멀티모달 모델입니다.

AI 스튜디오에서 사용해 보기

모델 세부정보

속성	설명
모델 코드	`models/gemini-1.5-flash`
지원되는 데이터 유형	입력 오디오, 이미지, 동영상, 텍스트 출력 텍스트
토큰 한도^[*]	입력 토큰 한도 1,048,576 출력 토큰 한도 8,192
오디오/시각적 사양	프롬프트당 최대 이미지 수 3,600개 최대 동영상 길이 1시간 최대 오디오 길이 약 9.5시간
비율 제한^[**]	무료: 15 RPM 100만 TPM 1,500 RPD Pay-as-you-go: 2,000 RPM 400만 TPM
기능	시스템 안내 지원됨 JSON 모드 지원됨 JSON 스키마 지원됨 조정 가능한 안전 설정 지원됨 캐싱 지원됨 조정 지원됨 함수 호출 지원됨 코드 실행 지원됨
버전	자세한 내용은 모델 버전 패턴을 참고하세요. 최신: `gemini-1.5-flash-latest` 최신 안정화 버전: `gemini-1.5-flash` 공개 버전 사용자: `gemini-1.5-flash-001` `gemini-1.5-flash-002` 실험용: `gemini-1.5-flash-8b-exp-0924` `gemini-1.5-flash-8b-exp-0827` `gemini-1.5-flash-exp-0827`
최신 업데이트	2024년 9월

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B는 낮은 수준의 인텔리전스 작업을 위해 설계된 소형 모델입니다.

AI 스튜디오에서 사용해 보기

모델 세부정보

속성	설명
모델 코드	`models/gemini-1.5-flash-8b`
지원되는 데이터 유형	입력 오디오, 이미지, 동영상, 텍스트 출력 텍스트
토큰 한도^[*]	입력 토큰 한도 1,048,576 출력 토큰 한도 8,192
오디오/시각적 사양	프롬프트당 최대 이미지 수 3,600개 최대 동영상 길이 1시간 최대 오디오 길이 약 9.5시간
비율 제한^[**]	무료: 15 RPM 100만 TPM 1,500 RPD Pay-as-you-go: 4,000 RPM 400만 TPM
기능	시스템 안내 지원됨 JSON 모드 지원됨 JSON 스키마 지원됨 조정 가능한 안전 설정 지원됨 캐싱 지원됨 조정 지원됨 함수 호출 지원됨 코드 실행 지원됨
버전	자세한 내용은 모델 버전 패턴을 참고하세요. 최신: `gemini-1.5-flash-8b-latest` 최신 안정화 버전: `gemini-1.5-flash-8b` 공개 버전 사용자: `gemini-1.5-flash-8b-001`
최신 업데이트	2024년 10월

Gemini 1.5 Pro

Gemini 1.5 Pro는 다양한 추론 작업에 최적화된 중간 규모 멀티모달 모델입니다. 1.5 Pro는 2시간 분량의 동영상, 19시간 분량의 오디오, 6만 줄의 코드가 포함된 코드베이스, 2,000페이지 분량의 텍스트 등 대량의 데이터를 한 번에 처리할 수 있습니다.

AI 스튜디오에서 사용해 보기

모델 세부정보

속성	설명
모델 코드	`models/gemini-1.5-pro`
지원되는 데이터 유형	입력 오디오, 이미지, 동영상, 텍스트 출력 텍스트
토큰 한도^[*]	입력 토큰 한도 2,097,152 출력 토큰 한도 8,192
오디오/시각적 사양	프롬프트당 최대 이미지 수 7,200 최대 동영상 길이 2시간 최대 오디오 길이 약 19시간
비율 제한^[**]	무료: 2 RPM 32,000 TPM 50 RPD Pay-as-you-go: 1,000 RPM 400만 TPM
기능	시스템 안내 지원됨 JSON 모드 지원됨 JSON 스키마 지원됨 조정 가능한 안전 설정 지원됨 캐싱 지원됨 조정 지원되지 않음 함수 호출 지원됨 코드 실행 지원됨
버전	자세한 내용은 모델 버전 패턴을 참고하세요. 최신: `gemini-1.5-pro-latest` 최신 안정화 버전: `gemini-1.5-pro` 공개 버전 사용자: `gemini-1.5-pro-001` `gemini-1.5-pro-002` 실험용: `gemini-1.5-pro-exp-0827`
최신 업데이트	2024년 9월

Gemini 1.0 Pro (지원 중단됨)

Gemini 1.0 Pro는 멀티턴 텍스트 및 코드 채팅, 코드 생성과 같은 작업을 처리하는 NLP 모델입니다.

AI 스튜디오에서 사용해 보기

모델 세부정보

속성	설명
모델 코드	`models/gemini-1.0-pro`
지원되는 데이터 유형	입력 텍스트 출력 텍스트
비율 제한^[**]	무료: 15 RPM 32,000 TPM 1,500 RPD Pay-as-you-go: 360 RPM 120,000 TPM 30,000 RPD
기능	시스템 안내 지원되지 않음 JSON 모드 지원되지 않음 JSON 스키마 지원되지 않음 조정 가능한 안전 설정 지원됨 캐싱 지원되지 않음 조정 지원됨 함수 호출 지원됨 함수 호출 구성 지원되지 않음 코드 실행 지원되지 않음
버전	최신: `gemini-1.0-pro-latest` 최신 안정화 버전: `gemini-1.0-pro` 안정화 버전: `gemini-1.0-pro-001`
최신 업데이트	2024년 2월

참고: gemini-pro는 gemini-1.0-pro의 별칭입니다.

텍스트 임베딩 및 임베딩

텍스트 임베딩

텍스트 임베딩은 문자열의 관련성을 측정하는 데 사용되며 많은 AI 애플리케이션에서 널리 사용됩니다.

text-embedding-004는 표준 MTEB 임베딩 벤치마크에서 비슷한 크기로 검색 성능이 우수하고 기존 모델보다 우수한 성능을 달성합니다.

모델 세부정보

속성	설명
모델 코드	Gemini API `models/text-embedding-004`
지원되는 데이터 유형	입력 텍스트 출력 텍스트 임베딩
토큰 한도^[*]	입력 토큰 한도 2,048 출력 크기 768
비율 제한^[**]	요청 1,500개/분
조정 가능한 안전 설정	지원되지 않음
최신 업데이트	2024년 4월

임베딩

임베딩 모델을 사용하여 입력 텍스트의 텍스트 임베딩을 생성할 수 있습니다.

임베딩 모델은 최대 2,048개 토큰의 텍스트에 대해 768차원의 임베딩을 만드는 데 최적화되어 있습니다.

임베딩 모델 세부정보

속성	설명
모델 코드	`models/embedding-001`
지원되는 데이터 유형	입력 텍스트 출력 텍스트 임베딩
토큰 한도^[*]	입력 토큰 한도 2,048 출력 크기 768
비율 제한^[**]	요청 1,500개/분
조정 가능한 안전 설정	지원되지 않음
최신 업데이트	2023년 12월

AQA

AQA 모델을 사용하여 문서, 자료 또는 구절 집합에 대해 기여 분석 질문-답변(AQA) 관련 작업을 실행할 수 있습니다. AQA 모델은 제공된 소스에 기반한 질문에 대한 답변과 함께 답변 가능 확률을 추정하여 반환합니다.

모델 세부정보

속성	설명
모델 코드	`models/aqa`
지원되는 데이터 유형	입력 텍스트 출력 텍스트
지원되는 언어	영어
토큰 한도^[*]	입력 토큰 한도 7,168 출력 토큰 한도 1,024
비율 제한^[**]	요청 1,500개/분
조정 가능한 안전 설정	지원됨
최신 업데이트	2023년 12월

이러한 모델 변형의 기능을 살펴보려면 예를 참고하세요.

[*] 토큰은 Gemini 모델의 경우 약 4자(영문 기준)에 해당합니다. 토큰 100개는 영어 단어 약 60~80개에 해당합니다.

[**] RPM: 분당 요청 수
TPM: 분당 토큰 수
RPD: 일일 요청 수
TPD: 일일 토큰 수

용량 제한으로 인해 지정된 최대 비율 제한이 보장되지는 않습니다.

모델 버전 이름 패턴

Gemini 모델은 미리보기 또는 안정화 버전으로 제공됩니다. 코드에서 다음 모델 이름 형식 중 하나를 사용하여 사용할 모델과 버전을 지정할 수 있습니다.

최신: 지정된 생성 및 변형에 관한 최신 버전의 모델을 가리킵니다. 기본 모델은 정기적으로 업데이트되며 미리보기 버전일 수 있습니다. 탐색적 테스트 앱과 프로토타입만 이 별칭을 사용해야 합니다.

최신 버전을 지정하려면 <model>-<generation>-<variation>-latest 패턴을 사용합니다. 예를 들면 gemini-1.0-pro-latest입니다.
최신 안정화 버전: 지정된 모델 생성 및 변형에 대해 출시된 최신 안정화 버전을 가리킵니다.

최신 안정화 버전을 지정하려면 <model>-<generation>-<variation> 패턴을 사용하세요. 예를 들면 gemini-1.0-pro입니다.
안정화: 특정 안정화 모델을 가리킵니다. 안정화된 모델은 변경되지 않습니다. 대부분의 프로덕션 앱은 특정 안정화 버전 모델을 사용해야 합니다.

안정적인 버전을 지정하려면 다음 패턴을 사용합니다. <model>-<generation>-<variation>-<version>. 예를 들면 gemini-1.0-pro-001입니다.
실험용: 약관에 정의된 대로 미리보기에서 사용할 수 있는 실험용 모델을 가리킵니다. 즉, 프로덕션용으로는 사용할 수 없습니다. Google은 의견을 수집하고, 최신 업데이트를 개발자에게 빠르게 제공하며, Google에서 진행 중인 혁신의 속도를 강조하기 위해 실험용 모델을 출시합니다. 실험 출시에서 얻은 정보를 바탕으로 모델을 더 광범위하게 출시하는 방법을 결정합니다. 실험용 모델은 사전 고지 없이 다른 모델로 전환될 수 있습니다. 실험용 모델은 이후 안정화 모델로 전환된다고 보장할 수 없습니다.

실험 버전을 지정하려면 <model>-<generation>-<variation>-<version> 패턴을 사용하세요. 예를 들면 gemini-1.5-pro-exp-0827입니다.

사용 가능한 언어

Gemini 모델은 다음 언어로 작동하도록 학습됩니다.

아랍어(ar)
벵골어(bn)
불가리아어(bg)
중국어 간체 및 번체(zh)
크로아티아어(hr)
체코어(cs)
덴마크어(da)
네덜란드어(nl)
영어(en)
에스토니아어(et)
핀란드어(fi)
프랑스어(fr)
독일어(de)
그리스어(el)
히브리어(iw)
힌디어(hi)
헝가리어(hu)
인도네시아어(id)
이탈리아어(it)
일본어(ja)
한국어(ko)
라트비아어(lv)
리투아니아어(lt)
노르웨이어(no)
폴란드어(pl)
포르투갈어(pt)
루마니아어(ro)
러시아어(ru)
세르비아어(sr)
슬로바키아어(sk)
슬로베니아어(sl)
스페인어(es)
스와힐리어(sw)
스웨덴어(sv)
태국어(th)
터키어(tr)
우크라이나어(uk)
베트남어(vi)