비율 제한

비율 제한은 특정 기간 내에 Gemini API에 요청할 수 있는 요청 수를 규제합니다. 이러한 한도는 공정한 사용을 유지하고, 악용을 방지하며, 모든 사용자를 위해 시스템 성능을 유지하는 데 도움이 됩니다.

요금 제한 작동 방식

비율 제한은 일반적으로 다음 세 가지 측정기준으로 측정됩니다.

  • 분당 요청 수 (RPM)
  • 일일 요청 수 (RPD)
  • 분당 토큰 수 (입력) (TPM)

사용량은 각 한도에 따라 평가되며, 한도를 초과하면 비율 제한 오류가 발생합니다. 예를 들어 RPM 한도가 20인 경우 TPM 또는 기타 한도를 초과하지 않았더라도 1분 이내에 21개의 요청을 하면 오류가 발생합니다.

비율 제한은 API 키별이 아닌 프로젝트별로 적용됩니다.

한도는 사용 중인 특정 모델에 따라 다르며 일부 한도는 특정 모델에만 적용됩니다. 예를 들어 분당 이미지 수(IPM)는 이미지를 생성할 수 있는 모델(Imagen 3)에 대해서만 계산되지만 개념적으로는 TPM과 유사합니다. 일일 토큰 한도 (TPD)가 있는 모델도 있습니다.

실험 모델과 미리보기 모델의 비율 제한이 더 엄격합니다.

사용 등급

비율 제한은 프로젝트의 사용량 등급과 연결됩니다. API 사용량과 지출이 증가하면 더 높은 등급으로 업그레이드하여 비율 한도를 늘릴 수 있습니다.

등급 자격 요건
무료 대상 국가의 사용자
Tier 1 프로젝트에 연결된 결제 계정
Tier 2 총 지출: 250달러 이상이고 결제가 완료된 후 30일 이상 경과
Tier 3 총 지출: 1,000달러 이상이고 결제가 완료된 후 30일 이상 경과

업그레이드를 요청하면 Google의 자동 악용 방지 시스템에서 추가 검사를 실행합니다. 일반적으로 명시된 자격 요건을 충족하면 승인을 받을 수 있지만, 드물게 검토 과정에서 확인된 다른 요인에 따라 업그레이드 요청이 거부될 수 있습니다.

이 시스템은 모든 사용자를 위해 Gemini API 플랫폼의 보안과 무결성을 유지하는 데 도움이 됩니다.

표준 API 비율 제한

다음 표에는 모든 표준 Gemini API 호출의 비율 한도가 나와 있습니다.

무료 등급

모델 RPM TPM RPD
Gemini 2.5 Pro 5 250,000명 100
Gemini 2.5 Flash 10 250,000명 250
Gemini 2.5 Flash-Lite Preview 06-17 15 250,000명 1,000
Gemini 2.5 Flash 미리보기 TTS 3 10,000 15
Gemini 2.5 Pro 미리보기 TTS -- -- --
Gemini 2.0 Flash 15 1,000,000 200
Gemini 2.0 Flash 프리뷰 이미지 생성 10 200,000 100
Gemini 2.0 Flash-Lite 30 1,000,000 200
Imagen 3 -- -- --
Veo 2 -- -- --
Gemini 1.5 Flash (지원 중단됨) 15 250,000명 50
Gemini 1.5 Flash-8B (지원 중단됨) 15 250,000명 50
Gemini 1.5 Pro (지원 중단됨) -- -- --
Gemma 3 및 3n 30 15,000 14,400
Gemini Embedding Experimental 03-07 5 -- 100

Tier 1

모델 RPM TPM RPD
Gemini 2.5 Pro 150 2,000,000 1,000
Gemini 2.5 Flash 1,000 1,000,000 10,000
Gemini 2.5 Flash-Lite Preview 06-17 4,000 4,000,000 --
Gemini 2.5 Flash 미리보기 TTS 10 10,000 100
Gemini 2.5 Pro 미리보기 TTS 10 10,000 50
Gemini 2.0 Flash 2,000 4,000,000 --
Gemini 2.0 Flash 프리뷰 이미지 생성 1,000 1,000,000 10,000
Gemini 2.0 Flash-Lite 4,000 4,000,000 --
Imagen 4 Standard 10 -- 70
Imagen 4 Ultra 5 -- 30
Imagen 3 20 -- --
Veo 2 분당 동영상 2개 -- 일일 50개 동영상
Gemini 1.5 Flash (지원 중단됨) 2,000 4,000,000 --
Gemini 1.5 Flash-8B (지원 중단됨) 4,000 4,000,000 --
Gemini 1.5 Pro (지원 중단됨) 1,000 4,000,000 --
Gemma 3 및 3n 30 15,000 14,400
Gemini Embedding Experimental 03-07 10 -- 1,000

Tier 2

모델 RPM TPM RPD
Gemini 2.5 Pro 1,000 5,000,000 50,000
Gemini 2.5 Flash 2,000 3,000,000 100,000
Gemini 2.5 Flash-Lite Preview 06-17 10,000 10,000,000 100,000
Gemini 2.5 Flash 미리보기 TTS 1,000 100,000 10,000
Gemini 2.5 Pro 미리보기 TTS 100 25,000 1,000
Gemini 2.0 Flash 10,000 10,000,000 --
Gemini 2.0 Flash 프리뷰 이미지 생성 2,000 3,000,000 100,000
Gemini 2.0 Flash-Lite 20,000 10,000,000 --
Imagen 4 Standard 10 -- 70
Imagen 4 Ultra 5 -- 30
Imagen 3 20 -- --
Veo 2 분당 동영상 2개 -- 일일 50개 동영상
Gemini 1.5 Flash (지원 중단됨) 2,000 4,000,000 --
Gemini 1.5 Flash-8B (지원 중단됨) 4,000 4,000,000 --
Gemini 1.5 Pro (지원 중단됨) 1,000 4,000,000 --
Gemma 3 및 3n 30 15,000 14,400
Gemini Embedding Experimental 03-07 10 -- 1,000

Tier 3

모델 RPM TPM RPD
Gemini 2.5 Pro 2,000 8,000,000 --
Gemini 2.5 Flash 10,000 8,000,000 --
Gemini 2.5 Flash-Lite Preview 06-17 30,000 30,000,000 --
Gemini 2.5 Flash 미리보기 TTS 1,000 1,000,000 --
Gemini 2.5 Pro 미리보기 TTS 100 1,000,000 --
Gemini 2.0 Flash 30,000 30,000,000 --
Gemini 2.0 Flash 프리뷰 이미지 생성 5,000 5,000,000 --
Gemini 2.0 Flash-Lite 30,000 30,000,000 --
Imagen 4 Standard 10 -- 70
Imagen 4 Ultra 5 -- 30
Imagen 3 20 -- --
Veo 2 분당 동영상 2개 -- 일일 50개 동영상
Gemini 1.5 Flash (지원 중단됨) 2,000 4,000,000 --
Gemini 1.5 Flash-8B (지원 중단됨) 4,000 4,000,000 --
Gemini 1.5 Pro (지원 중단됨) 1,000 4,000,000 --
Gemma 3 및 3n 30 15,000 14,400
Gemini Embedding Experimental 03-07 10 -- 1,000

지정된 비율 제한은 보장되지 않으며 실제 용량은 다를 수 있습니다.

Live API 비율 제한

Live API는 오디오, 동영상 또는 텍스트의 연속 스트림을 처리하여 즉각적이고 사람과 같은 음성 응답을 제공하므로 사용자에게 자연스러운 대화형 환경을 제공합니다. 이 API에는 표준 Gemini API 호출과 다른 비율 제한이 적용됩니다.

무료 등급

이름 동시 세션 TPM RPD
Gemini 2.5 Flash Live 3 1,000,000 --
Gemini 2.0 Flash Live 3 1,000,000 --
Gemini 2.5 Flash 미리보기 네이티브 오디오 대화상자 1 25,000 5
Gemini 2.5 Flash Experimental 네이티브 오디오 사고 다이얼로그 1 10,000 5

Tier 1

이름 동시 세션 TPM RPD
Gemini 2.5 Flash Live 50 4,000,000 --
Gemini 2.0 Flash Live 50 4,000,000 --
Gemini 2.5 Flash 미리보기 네이티브 오디오 대화상자 3 50,000 50
Gemini 2.5 Flash Experimental 네이티브 오디오 사고 다이얼로그 1 25,000 50

Tier 2

이름 동시 세션 TPM RPD
Gemini 2.5 Flash Live 1000 10,000,000 --
Gemini 2.0 Flash Live 1000 10,000,000 --
Gemini 2.5 Flash 미리보기 네이티브 오디오 대화상자 100 1,000,000 무제한
Gemini 2.5 Flash Experimental 네이티브 오디오 사고 다이얼로그 -- -- --

Tier 3

이름 동시 세션 TPM RPD
Gemini 2.5 Flash Live 1000 10,000,000 --
Gemini 2.0 Flash Live 1000 10,000,000 --
Gemini 2.5 Flash 미리보기 네이티브 오디오 대화상자 -- -- --
Gemini 2.5 Flash Experimental 네이티브 오디오 사고 다이얼로그 -- -- --

지정된 비율 제한은 보장되지 않으며 실제 용량은 다를 수 있습니다.

일괄 모드 비율 제한

일괄 모드 요청에는 일괄 모드가 아닌 API 호출과 별도의 자체 비율 제한이 적용됩니다.

  • 동시 일괄 요청: 100
  • 입력 파일 크기 제한: 2GB
  • 파일 저장용량 한도: 20GB
  • 모델별 대기열에 추가된 토큰: 다음 표에는 특정 모델의 활성 일괄 작업 전체에서 일괄 처리를 위해 대기열에 추가할 수 있는 최대 토큰 수가 나와 있습니다.

Tier 1

모델 대기열에 추가된 토큰 한도
Gemini 2.5 Pro 5,000,000
Gemini 2.5 Flash 3,000,000
Gemini 2.0 Flash 10,000,000
Gemini 2.0 Flash-Lite 10,000,000

Tier 2

모델 대기열에 추가된 토큰 한도
Gemini 2.5 Pro 500,000,000
Gemini 2.5 Flash 400,000,000
Gemini 2.0 Flash 1,000,000,000
Gemini 2.0 Flash-Lite 1,000,000,000

Tier 3

모델 대기열에 추가된 토큰 한도
Gemini 2.5 Pro 1,000,000,000
Gemini 2.5 Flash 1,000,000,000
Gemini 2.0 Flash 5,000,000,000
Gemini 2.0 Flash-Lite 5,000,000,000

지정된 비율 제한은 보장되지 않으며 실제 용량은 다를 수 있습니다.

다음 등급으로 업그레이드하는 방법

Gemini API는 모든 결제 서비스에 Cloud Billing을 사용합니다. 무료 등급에서 유료 등급으로 전환하려면 먼저 Google Cloud 프로젝트에 Cloud Billing을 사용 설정해야 합니다.

프로젝트가 지정된 기준을 충족하면 다음 등급으로 업그레이드할 수 있습니다. 업그레이드를 요청하려면 다음 단계를 따르세요.

  • AI Studio에서 API 키 페이지로 이동합니다.
  • 업그레이드하려는 프로젝트를 찾아 '업그레이드'를 클릭합니다. '업그레이드' 옵션은 다음 등급 자격 요건을 충족하는 프로젝트에만 표시됩니다.

간단한 검증 후 프로젝트가 다음 등급으로 업그레이드됩니다.

비율 제한 상향 요청

각 모델 변형에는 연결된 비율 제한 (분당 요청 수, RPM)이 있습니다. 이러한 비율 제한에 대한 자세한 내용은 Gemini 모델을 참고하세요.

유료 등급 비율 제한 상향 요청

요청하신 한도 증가를 보장해 드릴 수는 없지만, Google에서는 요청을 검토하고 용량 요구사항을 충족할 수 있는 경우 연락드리도록 최선을 다하겠습니다.