Gemini 모델

Gemini는 개발자가 콘텐츠를 생성하고 문제를 해결할 수 있는 생성형 AI 모델 제품군입니다 이러한 모델은 텍스트와 이미지를 모두 입력으로 처리하도록 설계되고 학습됩니다 이 가이드에서는 사용 사례에 가장 적합한 모델을 결정하는 데 도움이 되도록 각 모델 변형에 대한 정보를 제공합니다.

사용 가능한 모델 및 기능에 대한 간략한 요약은 다음과 같습니다.

모델 입력 출력
Gemini
  • Gemini 1.5 Pro (미리보기 전용)
텍스트 및 이미지 텍스트
  • Gemini 1.0 Pro
텍스트 텍스트
  • Gemini 1.0 Pro Vision
텍스트 및 이미지 텍스트
임베딩
  • 임베딩
텍스트 텍스트 임베딩
가져오기
  • 품질보증
텍스트 텍스트

안전 및 사용 목적

생성형 인공지능 모델은 강력한 도구지만 그 한계가 없는 것은 아닙니다. 이러한 기능의 다양성과 적용 가능성은 때때로 부정확하거나 편향되거나 불쾌감을 주는 출력과 같은 예기치 않은 출력으로 이어질 수 있습니다. 이러한 출력으로 인한 피해 위험을 제한하려면 후처리와 엄격한 수동 평가가 필수적입니다. 추가적인 안전 사용 권장사항은 안전 가이드를 참고하세요.

Gemini API에서 제공하는 모델은 다양한 생성형 AI 및 자연어 처리 (NLP) 애플리케이션에 사용할 수 있습니다. 이러한 함수는 Gemini API 또는 Google AI Studio 웹 앱을 통해서만 사용할 수 있습니다. Gemini API 사용에는 생성형 AI 금지된 사용 정책Gemini API 서비스 약관도 적용됩니다.

모델 크기

다음 표에서는 사용 가능한 크기 및 각 크기의 상대적인 의미를 보여줍니다.

모델 크기 설명 서비스
Gemini 1.0 Pro 기능과 효율성의 균형을 이루는 모델 크기입니다.
  • text
  • 채팅

모델 버전

Gemini 모델은 미리보기 또는 안정화 버전으로 제공됩니다. 코드에서 다음 모델 이름 형식 중 하나를 사용하여 사용할 모델과 버전을 지정할 수 있습니다.

  • 최신: 지정된 세대 및 변형에 맞는 최첨단 버전의 모델을 가리킵니다. 기본 모델은 정기적으로 업데이트되며 미리보기 버전일 수 있습니다. 탐색적 테스트 앱과 프로토타입에서만 이 별칭을 사용해야 합니다.

    최신 버전을 지정하려면 <model>-<generation>-<variation>-latest 패턴을 사용합니다. 예를 들면 gemini-1.0-pro-latest입니다.

  • 최신 안정화 버전: 지정된 모델 생성 및 변형을 위해 출시된 최신 안정화 버전을 가리킵니다.

    최신 안정화 버전을 지정하려면 <model>-<generation>-<variation> 패턴을 사용하세요. 예를 들면 다음과 같습니다. gemini-1.0-pro

  • 공개 버전: 특정 안정화 모델을 가리킵니다. 안정화 모델은 변경되지 않습니다. 대부분의 프로덕션 앱은 특정한 안정적인 모델을 사용해야 합니다.

    안정화 버전을 지정하려면 <model>-<generation>-<variation>-<version> 패턴을 사용합니다. 예를 들면 gemini-1.0-pro-001입니다.

안정화 버전이 있는 모델의 경우 모델 변형에서 모델의 '모델 이름' 행을 참조하세요.

모델 변형

Gemini API는 특정 사용 사례에 최적화된 다양한 모델을 제공합니다. 다음 표에서는 각각의 속성을 설명합니다.

다양한 버전 속성 설명
Gemini 1.5 Pro (미리보기 전용) 모델 최종 업데이트 2024년 4월
모델 코드 models/gemini-1.5-pro-latest
모델 기능
  • 입력: 오디오, 이미지, 텍스트
  • 출력: 텍스트
  • 다음과 같은 언어 작업에 최적화되었습니다.
    • 코드 생성
    • 텍스트 생성
    • 텍스트 수정
    • 문제 해결
    • 추천 생성
    • 정보 추출
    • 데이터 추출 또는 생성
    • AI 에이전트
  • 제로샷, 1샷, 퓨샷 작업을 처리할 수 있습니다
지원되는 생성 방법 generateContent
입력 토큰 한도 1048576
출력 토큰 한도 8192
모델 안전성 개발자가 조정할 수 있는 안전 설정이 자동으로 적용됩니다. 자세한 내용은 안전 설정 주제를 참조하세요.
비율 제한 분당 쿼리 2회, 일일 1,000개 쿼리[1]
Gemini Pro 모델 최종 업데이트 2024년 2월
모델 코드 models/gemini-pro
모델 기능
  • 입력: 텍스트
  • 출력: 텍스트
  • 텍스트를 생성합니다.
  • 멀티턴 대화 형식을 처리할 수 있습니다.
  • 제로샷, 1샷, 퓨샷 작업을 처리할 수 있습니다
지원되는 생성 방법 generateContent
입력 토큰 한도 30720
출력 토큰 한도 2048
모델 안전성 개발자가 조정할 수 있는 안전 설정이 자동으로 적용됩니다. 자세한 내용은 안전 설정 주제를 참조하세요.
비율 제한 분당 요청 60개[1]
모델 이름
  • 최신 버전: gemini-1.0-pro-latest
  • 최신 안정화 버전: gemini-1.0-pro
  • 정식 버전:
    • gemini-1.0-pro-001
Gemini 1.0 Pro Vision 모델 최종 업데이트 2023년 12월
모델 코드 models/gemini-pro-vision
모델 기능
  • 입력: 텍스트 및 이미지
  • 출력: 텍스트
  • 멀티모달 입력, 텍스트, 이미지를 사용할 수 있습니다.
  • 제로샷, 1샷, 퓨샷 작업을 처리할 수 있습니다
지원되는 생성 방법 generateContent
입력 토큰 한도 12288
출력 토큰 한도 4096
모델 안전성 개발자가 조정할 수 있는 안전 설정이 자동으로 적용됩니다. 자세한 내용은 안전 설정 주제를 참조하세요.
비율 제한 분당 요청 60개[1]
임베딩 모델 최종 업데이트 2023년 12월
모델 코드 models/embedding-001
모델 기능
  • 입력: 텍스트
  • 출력: 텍스트
  • 입력 텍스트의 텍스트 임베딩을 생성합니다.
  • 최대 2,048개 토큰의 텍스트에 대한 임베딩 생성에 최적화되었습니다.
지원되는 생성 방법 embedContent
모델 안전성 조정 가능한 안전 설정이 없습니다.
비율 제한 분당 요청 1,500개[1]
텍스트 임베딩 모델 최종 업데이트 2024년 4월
모델 코드 models/text-embedding-004 (Vertex AItext-embedding-preview-0409)
모델 기능
  • 입력: 텍스트
  • 출력: 텍스트
  • 입력 텍스트의 텍스트 임베딩을 생성합니다.
  • 768 미만의 탄성 임베딩 크기를 지원합니다.
지원되는 생성 방법 embedContent
모델 안전성 조정 가능한 안전 설정이 없습니다.
비율 제한 분당 요청 1,500개[1]
품질보증 모델 최종 업데이트 2023년 12월
모델 코드 models/aqa
모델 기능
  • 입력: 텍스트
  • 출력: 텍스트
  • 기여 질문 답변을 수행하는 모델입니다.
  • 답변 가능한 확률을 추정하고 제공된 소스를 기반으로 한 질문에 대한 답변을 반환하도록 학습된 모델입니다.
지원되는 생성 방법 generateAnswer
지원 언어 영어
입력 토큰 한도 7168
출력 토큰 한도 1024
모델 안전성 개발자가 조정할 수 있는 안전 설정이 자동으로 적용됩니다. 자세한 내용은 안전 설정 주제를 참조하세요.
비율 제한 분당 요청 60개[1]

를 참고하여 이러한 모델 변형의 기능을 살펴보세요.

모델 메타데이터

ModelService API를 사용하여 입력 및 출력 토큰 한도와 같은 최신 모델에 대한 추가 메타데이터를 가져올 수 있습니다. 다음 표는 Gemini Pro 모델 변형의 메타데이터를 보여줍니다.

속성
표시 이름 Gemini 1.0 Pro
모델 코드 models/gemini-1.0-pro
설명 텍스트 생성에 타겟팅된 모델
지원되는 생성 방법 generateContent
온도 0.9
top_p 1
top_k 1

모델 속성

다음 표에서는 모든 모델 변형에 공통된 Gemini 모델의 속성을 설명합니다.

속성 설명
학습 데이터 Gemini의 지식 컷오프는 2023년 초입니다. 이 기간 이후의 이벤트에 관한 지식은 제한적입니다.
지원 언어 사용 가능한 언어 보기
구성 가능한 모델 매개변수
  • 최상위 P
  • 최상위 K
  • 온도
  • 시퀀스 중지
  • 최대 출력 길이
  • 응답 후보 수

[1] 용량 제한으로 인해 지정된 최대 비율 제한은 보장되지 않습니다.

이러한 각 매개변수에 대한 자세한 내용은 LLM 소개 가이드의 모델 매개변수 섹션을 참조하세요.

다음 단계